メインフレームおよびミッドレンジデータの最新化

Azure Cosmos DB

Azure Data Lake

Azure SQL データベース

Azure SQL Managed Instance

Azure Storage

Apache®、 Spark、および炎のロゴは、Apache Software Foundation の米国およびその他の国における登録商標です。これらのマークを使用することが、Apache Software Foundation による保証を意味するものではありません。

この記事では、メインフレームとミッドレンジのデータソースを対象とするエンドツーエンドの最新化プランについて説明します。

アーキテクチャ

このアーキテクチャの Visio ファイルをダウンロードします。

データフロー

次のデータフローは、メインフレームデータ層を最新化するプロセスの概要を示しています。これは、前の図に対応しています。

メインフレームおよびミッドレンジシステムは、ファイルシステム (仮想ストレージアクセス方式 (VSAM)、フラットファイル、LTFS)、リレーショナルデータベース (Db2 for z/OS、Db2 for IBM i、Db2 for Linux UNIX および Windows)、非リレーショナルデータベース IMS (Information Management System)、ADABAS、IDMS (Integrated Database Management System) などのデータソースにデータを格納します。
オブジェクトの変換プロセスでは、ソースオブジェクトからオブジェクト定義が抽出されます。その後、これらの定義がターゲットデータストアの対応するオブジェクトに変換されます。
- SQL Server Migration Assistant (SSMA) for Db2 は、IBM Db2 データベースから Azure データベースにスキーマとデータを移行します。
- ホストファイル用マネージドデータプロバイダーは、次の手順でオブジェクトを変換します。
  - COBOL と RPG のレコードレイアウト、または コピーブックを解析する。
  - .NET アプリケーションで使用される C# オブジェクトにコピーブックをマップする。
- Db2toAzurePostgreSQL ツールを使用して、データベースオブジェクトを Db2 から Azure Database for PostgreSQL に移行します。
- サードパーティ製のツールは、非リレーショナルデータベース、ファイルシステム、その他のデータストアに対して自動オブジェクト変換を実行します。
データが取り込まれて変換されます。メインフレームシステムとミッドレンジシステムは、次のようなファイル形式で EBCDIC エンコード形式のファイルシステムデータを保存します。
- インデックス付きの VSAM ファイル
- インデックスのない GDG ファイル
- フラットファイル
COBOL、PL/I、アセンブリ言語のコピーブックに、これらのファイルのデータ構造が定義されています。

a. FTP は、単一のレイアウトとアンパックされたフィールドを持つメインフレームとミッドレンジのファイルシステムデータセットをバイナリ形式と対応するコピーブックで Azure に転送します。

b. データ変換は、ホスト統合サーバーのホストファイルコンポーネントを使用してカスタムプログラムを開発するか、Azure Logic Apps の IBM ホストファイル用の組み込みコネクタを使用して行います。

Spark Notebook コンバーターは、オープンソースの Spark フレームワークを使用して開発され、Microsoft Fabric、Azure Synapse Analytics、Databricks などの Spark 環境と互換性があります。

c. リレーショナルデータベースのデータが移行されます。

IBM のメインフレームおよびミッドレンジシステムでは、こちらを含むリレーショナルデータベースにデータが格納されます。
こちらのサービスがデータベースのデータを移行します。
- Data Factory は、Db2 コネクタを使用してデータベースからデータを抽出し、統合します。
- SQL Server Integration Services は、さまざまなデータの ETL タスクを処理します。
- Microsoft Fabric Data Factory では、IBM Db2 コネクタを使用して Db2 データを移行します。
d. 非リレーショナルデータベースのデータが移行されます。

IBM のメインフレームおよびミッドレンジシステムでは、こちらを含む非リレーショナルデータベースにデータが格納されます。
- IDMS (ネットワークモデルのデータベース管理システム (DBMS))
- IMS (階層モデルの DBMS)
- Adabas
- Datacom
サードパーティ製品は、これらのデータベースのデータを統合します。
Data Factory や AzCopy などの Azure サービスは、Azure データベースや Azure データストレージにデータを読み込みます。サードパーティソリューションやカスタムの読み込みソリューションを使ってデータを読み込むこともできます。
Azure では、Azure SQL Database などのフルマネージドリレーショナルデータベースや Azure Cosmos DB などの NoSQL オプションなど、さまざまなデータベースサービスが提供されています。これらのサービスは、スケーラビリティ、柔軟性、グローバル分散を目的として設計されています。
Azure には、非構造化データ用の Azure Blob Storage や、フルマネージドファイル共有用の Azure Files など、さまざまなストレージソリューションも用意されています。
コンピューティング、分析、ストレージ、ネットワークのために、Azure では最新化されたデータ層が使用されます。
クライアントアプリケーションでも、最新化されたデータ層が使用されます。

コンポーネント

データストレージ

このアーキテクチャでは、Azure での柔軟でインテリジェントなデータ管理のために、スケーラブルで安全なクラウドストレージとマネージドデータベースへのデータ移行について説明します。

SQL Database は Azure SQL ファミリの一部です。クラウド向けに設計されており、サービスとしてのフルマネージドの常緑プラットフォームのすべての利点を提供します。 SQL Database は、パフォーマンスと持続性を最適化する、AI を活用した自動機能も備えています。サーバーレスコンピューティングとハイパースケールストレージオプションにより、リソースが必要に応じて自動的にスケーリングされます。
Azure Database for PostgreSQL は、PostgreSQL データベースエンジンのオープンソースコミュニティエディションに基づくフルマネージドリレーショナルデータベースサービスです。
Azure Cosmos DB は、グローバル分散型のマルチモデル NoSQL データベースです。
Azure Database for MySQL は、オープンソース MySQL データベースエンジンのコミュニティエディションに基づくフルマネージドリレーショナルデータベースサービスです。
SQL Managed Instance は、フルマネージドで常に最新のサービスとしてのプラットフォームが持つすべての利点を備えた、インテリジェントでスケーラブルなクラウドデータベースサービスです。 SQL Managed Instance には、最新の SQL Server Enterprise エディションデータベースエンジンとのほぼ 100% の互換性があります。また、一般的なセキュリティの問題に対応するネイティブ仮想ネットワーク実装も提供されます。
Azure Data Lake Storage は、大量のデータを未加工のネイティブ形式で保持するストレージリポジトリです。データレイクストアは、テラバイト級およびペタバイト級のデータにスケーリングできるように最適化されています。データは通常、複数の異種ソースから取得されます。構造化、半構造化、非構造化のいずれかになります。
Microsoft Fabric の SQL データベースは、Azure SQL Database に基づく開発者向けのトランザクションデータベースであり、Fabric で運用データベースを簡単に作成できます。 Microsoft Fabric SQL Database では、Azure SQL Database と同じ SQL データベースエンジンが使用されます。
Microsoft Fabric Lakehouseは、構造化データと非構造化データを 1 つの場所で保存、管理、分析するためのデータアーキテクチャプラットフォームです。

Compute

Data Factory は、コンピューティングインフラストラクチャである統合ランタイム(IR) を使用して、さまざまなネットワーク環境間でデータを統合します。 Data Factory はセルフホステッド IRを使用して、クラウドデータストアとオンプレミスネットワークのデータストアの間でデータをコピーします。
オンプレミスデータゲートウェイは、ローカルにインストールされた Windows クライアントアプリケーションであり、ローカルのオンプレミスデータソースと Microsoft クラウド内のサービスの間のブリッジとして機能します。
Azure Virtual Machines は、オンデマンドでスケーラブルなコンピューティングリソースを提供します。 Azure 仮想マシン (VM) では仮想化の柔軟性を利用できる一方、物理ハードウェアのメンテナンスは必要ありません。 Azure VM により、Windows や Linux などのオペレーティングシステムを選択できます。

データインテグレーター

このアーキテクチャでは、メインフレームソースデータとターゲットデータベースに応じて利用できるさまざまな Azure ネイティブ移行ツールの概要を示します。

Azure Data Factory は、ハイブリッドデータ統合サービスです。このソリューションでは、Azure Data Factory を最小限に抑えて、ネイティブコネターを使用して Db2 データベースのターゲットからデータを移行します。
AzCopy は、ストレージアカウントと BLOB またはファイルをやり取りするコマンドラインユーティリティです。
SQL Server Integration Services は、エンタープライズレベルのデータ統合およびデータ変換ソリューションを作成するためのプラットフォームです。これを使用して、次のような方法で複雑なビジネス上の問題を解決できます。
- ファイルのコピーまたはダウンロード。
- データウェアハウスの読み込み。
- データのクレンジングとマイニング。
- SQL Server のオブジェクトとデータの管理。
Host Integration Server のテクノロジとツールによって、既存の IBM ホストシステム、プログラム、メッセージ、データと新しい Azure アプリケーションとの統合を実現できます。ホストファイルクライアントコンポーネントは、EBCDIC から ASCII に変換されたデータに柔軟性を提供します。たとえば、変換されたデータから JSON/XML を生成できます。
Azure Synapse Analytics では、データ統合、エンタープライズデータウェアハウス、ビッグデータ分析が統合されます。このアーキテクチャで使用される Azure Synapse 変換ソリューションは Apache Spark に基づいており、大規模なメインフレームデータセットワークロード変換に適しています。幅広いメインフレームデータ構造とターゲットをサポートしており、必要とされるコーディング作業は最小限に抑えられています。
Microsoft Fabric は、エンタープライズ対応のエンドツーエンドの分析プラットフォームです。データ移動、データ処理、インジェスト、変換、リアルタイムイベントルーティング、レポート作成を統合します。これらの機能は、データエンジニアリング、Data Factory、データサイエンス、Real-Time Analytics、Data Warehouse、データベースなどの統合サービスでサポートされています。

その他のツール

SQL Server Migration Assistant for Db2 は、Db2 から Microsoft データベースサービスへの移行を自動化します。 VM でこのツールを実行すると、Db2 データベースオブジェクトが SQL Server データベースオブジェクトに変換され、SQL Server にそれらのオブジェクトが作成されます。
ホストファイル用データプロバイダーは、オフライン、SNA、または TCP/IP 接続を使用する Host Integration Server のコンポーネントです。
- オフライン接続では、データプロバイダーはローカルバイナリファイルのレコードの読み取りと書き込みを行います。
- SNA 接続および TCP/IP 接続では、データプロバイダーはリモートの z/OS (IBM Z シリーズメインフレーム) のデータセットまたはリモートの i5/OS (IBM AS/400 および iSeries システム) の物理ファイルに格納されているレコードの読み取りと書き込みを行います。 TCP/IP を使用するのは i5/OS システムだけです。
Azure サービスは、パブリッククラウドで新しいアプリケーションの開発とスケーリングを行うための環境、ツール、プロセスを提供します。

シナリオの詳細

Azure データプラットフォームのような今日のデータストレージソリューションは、メインフレームシステムやミッドレンジシステムに比べてスケーラビリティとパフォーマンスに優れています。システムの最新化によって、こうした利点を活用できます。しかし、テクノロジ、インフラストラクチャ、業務の更新は複雑です。そのプロセスでは、ビジネスアクティビティとエンジニアリングアクティビティを徹底的に調査する必要があります。データ管理は、システムを最新化する際の考慮事項の 1 つです。データの視覚化と統合についても検討する必要があります。

最新化を成功させるには、データ優先の戦略を使用します。このアプローチを使用する場合は、新しいシステムではなくデータに焦点を当てます。データ管理は、もはや最新化のチェックリストの単なる 1 項目ではありません。むしろ、データが最重要項目です。調和の取れた品質重視のデータソリューションが、断片化し、適切に管理されていないソリューションに取って代わります。

このソリューションでは、データ優先のアプローチで Azure データプラットフォームのコンポーネントを使用します。具体的には、ソリューションには次のものが含まれます。

オブジェクトの変換。 ソースデータストアのオブジェクト定義をターゲットデータストアの対応するオブジェクトに変換する。
データインジェスト。 ソースデータストアに接続し、データを抽出する。
データの変換 抽出したデータを適切なターゲットデータストア構造に変換する。
データストレージ。 ソースデータストアからターゲットデータストアにデータを読み込む (初期および継続的に)。

考えられるユースケース

メインフレームおよびミッドレンジシステムを使用する組織は、特にこれらの目標を達成したい場合にこのソリューションからメリットを得られます。

ミッションクリティカルなワークロードを最新化する。
業務を改善し、競争で優位に立つためのビジネスインテリジェンスを獲得する。
メインフレームおよびミッドレンジのデータソースに関連するコストと柔軟性不足を排除する。

考慮事項

これらの考慮事項は、Azure Well-Architected Framework の柱を実装します。これは、ワークロードの品質を向上させるために使用できる一連の基本原則です。詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

セキュリティ

セキュリティは、重要なデータやシステムの意図的な攻撃や悪用に対する保証を提供します。詳細については、「セキュリティ設計レビューチェックリスト」を参照してください。

オンプレミスのクライアント ID と Azure のクライアント ID の違いに注意してください。すべての違いを補正する必要があります。
コンポーネント間のデータフローにはマネージド ID を使用します。
ホストファイル用データプロバイダーを使用してデータを変換する場合は、「ホストファイルのデータプロバイダーのセキュリティと保護」の推奨事項に従ってセキュリティを強化してください。

コストの最適化

コストの最適化は、不要な費用を削減し、運用効率を向上させる方法を検討することです。詳細については、「コストの最適化設計レビューチェックリスト」を参照してください。

SQL Server Migration Assistant はサポートされている無料のツールで、Db2 から SQL Server、SQL Database、SQL Managed Instance へのデータベースの移行を容易にします。移行の評価分析、スキーマおよび SQL ステートメントの変換、データの移行など、移行に関するあらゆる作業が SSMA によって自動化されます。
Azure Synapse Spark ベースのソリューションは、オープンソースライブラリから構築されています。これにより、変換ツールのライセンス取得による財務上の負担をなくします。
このソリューションの実装コストを見積もるには、 Azure 料金計算ツールを使用します。

パフォーマンス効率

パフォーマンス効率とは、ユーザーからの要求に合わせて効率的な方法でワークロードをスケーリングできることです。詳細については、「パフォーマンス効率設計レビューチェックリスト」を参照してください。

パフォーマンス効率の重要な柱は、パフォーマンス管理、容量計画、スケーラビリティ、適切なパフォーマンスパターンの選択です。
アクティブ - アクティブモードで論理インスタンスをオンプレミスの複数のマシンに関連付けることにより、セルフホステッド IR をスケールアウトすることができます。
Azure SQL Database には、データベースを動的にスケーリングする機能が用意されています。サーバーレス層では、コンピューティングリソースを自動的にスケーリングできます。データベースがプール内のリソースを共有できるエラスティックプールは、現状では、手動でのみスケーリングできます。

ホストファイル用データプロバイダーのクライアントを使用してデータを変換する場合は、接続プールを有効にして、接続の起動時間を短縮します。 Data Factory を使用してデータを抽出する場合は、コピーアクティビティのパフォーマンスを調整します。

共同作成者

この記事は、Microsoft によって保守されています。当初の寄稿者は以下のとおりです。

プリンシパル作成者:

Ashish Khandelwal | プリンシパルエンジニアリングアーキテクトマネージャー

その他の共同作成者:

Nithish Aruldoss | エンジニアリングアーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ

「Azure データベースの移行ガイド」を確認します。 Azure データエンジニアリング - メインフレーム & ミッドレンジの最新化に詳細を問い合わせます。

次の記事をご覧ください。

Azure データプラットフォームのエンドツーエンド

次の方法で共有

メインフレームおよびミッドレンジデータの最新化

アーキテクチャ

データフロー

コンポーネント

データストレージ

Compute

データインテグレーター

その他のツール

シナリオの詳細

考えられるユースケース

考慮事項

セキュリティ

コストの最適化

パフォーマンス効率

共同作成者

次のステップ

フィードバック

その他のリソース

次の方法で共有

メインフレームおよびミッドレンジ データの最新化

アーキテクチャ

データフロー

コンポーネント

データ ストレージ

Compute

データ インテグレーター

その他のツール

シナリオの詳細

考えられるユース ケース

考慮事項

セキュリティ

コストの最適化

パフォーマンス効率

共同作成者

次のステップ

関連リソース

フィードバック

その他のリソース

メインフレームおよびミッドレンジデータの最新化

データストレージ

データインテグレーター

考えられるユースケース