Team Data Science Process ライフサイクル
Team Data Science Process (TDSP) は、チームがデータサイエンスプロジェクトを構造化するために使用できるライフサイクルを提供します。 ライフサイクルでは、プロジェクトを正常に完了するために実行できる手順の概要が示されます。
インテリジェントアプリケーションの一部であるデータサイエンスプロジェクトがある場合は、このライフサイクルを使用する必要があります。 インテリジェントアプリケーションでは、予測分析のために機械学習またはAIモデルをデプロイします。 このプロセスは、探索的なデータサイエンスプロジェクトや即席の分析プロジェクトにも使用できますが、ライフサイクルのすべての手順を実装する必要はありません。
チームは、タスクベースのTDSPを、データマイニングの業界間標準プロセス (CRISP-DM) 、データベースでのナレッジ検出(KDD) プロセス、組織独自のカスタムプロセスなど、他のデータサイエンスライフサイクルと組み合わせることができます。
目的と信頼性
TDSPの目的は、データサイエンスおよびAIプロジェクトへのアプローチを合理化し、標準化することです。 Microsoftでは、この構造化された手法を数百のプロジェクトに適用しています。 研究者はTDSPを研究し、その結果をピアレビュー文献に発表しました。 TDSPのアーキテクチャフレームワークは徹底的にテストされ、多くの領域で効果的であることが証明されています。
5 つのライフサイクル ステージ
TDSPライフサイクルは、チームが反復的に実行する5つの主要なステージで構成されています。 次の段階があります。
TDSPライフサイクルの視覚的な表現を次に示します。
TDSPライフサイクルは、予測モデルを作成するためのガイダンスを提供する一連の手順です。 チームは、インテリジェントアプリケーションの構築に使用する予定の運用環境に予測モデルをデプロイします。 このプロセスライフサイクルの目標は、明確な契約エンドポイントに向けてデータサイエンスプロジェクトをナビゲートすることです。 データ サイエンスは、調査と発見の繰り返しです。 明確に定義されたプロセスを使用してチームにタスクを伝達すると、データサイエンスプロジェクトを成功させる可能性が高まります。
各ステージには、次の概要を示す独自の記事があります。
- 目標: ステージの目的。
- 実行方法: ステージで実行するタスクの概要と、それらを完了する方法に関するガイダンス。
- 成果物: ステージで作成する必要がある成果物と、それらを作成するために使用できるリソース。
ピアレビューされた引用文献
研究者は、TDSPに関するピアレビューされた文献を公開しています。 TDSPの機能とアプリケーションについては、次の資料を参照してください。
データサイエンスパイプラインの技術と実践: 理論、小規模、大規模におけるデータ サイエンス パイプラインの包括的研究 (2091~2103ページ)
メキシコ環境法における前処理タスクの実行のためのCRISP-DMとTDSPに基づくハイブリッド方法論(Volume 13613のページ)
ビジネス環境におけるデータ サイエンス: 対象分野の専門家 (SME) における顧客分析のケーススタディ (689 〜 713 ページ)
機械学習駆動のイノベーションマネジメント: 概念フレームワーク:。 イベント議事録: LUT科学と専門知識の出版物: ISPIMイノベーション会議-私たちの共通の未来を革新します
共同作成者
この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。
プリンシパル作成者:
- Mark Tabladillo | シニア クラウド ソリューション アーキテクト
パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。
関連リソース
- ライフサイクルの最初のステージについては、 「ビジネスの理解」 を参照してください。
- Team Data Science Process とは
- 機械学習の製品とテクノロジの比較