メインフレームとミッドレンジのデータを最新化する
Apache®, Spark, and the flame logo are either registered trademarks or trademarks of the Apache Software Foundation in the United States and/or other countries. これらのマークを使用することが、Apache Software Foundation による保証を意味するものではありません。
この記事では、メインフレームおよびミッドレンジ データ ソースのエンド ツー エンドのモダン化計画について説明します。 最新化により、ミッション クリティカルなワークロードのスケーラビリティとパフォーマンスが向上します。
Architecture
このアーキテクチャの Visio ファイルをダウンロードします。
Dataflow
次のデータフローは、前の図に対応しています。
メインフレーム システムとミッドレンジ システムは、次のデータ ソースにデータを格納します。
File systems:
- Virtual Storage Access Method (VSAM)
- Flat files
- リニア テープ ファイル システム
Relational databases:
- Db2 for z/OS
- Db2 for IBM i
- Db2 for Linux UNIX および Windows
Nonrelational databases:
- 情報管理システム (IMS)
- Adabas
- 統合データベース管理システム (IDMS)
オブジェクト変換プロセスは、ソース オブジェクトからオブジェクト定義を抽出します。 その後、定義はターゲット データ ストア内の対応するオブジェクトに変換されます。
SQL Server Migration Assistant for Db2 は、スキーマとデータを IBM Db2 データベースから Azure データベースに移行します。
マネージド データ プロバイダー for Host Files は、 次の方法でオブジェクトを変換します。
- Parsing common business-oriented language (COBOL) and Report Program Generator record layouts, or copybooks.
- .NET アプリケーションが使用する C# オブジェクトへのコピーブックのマッピング。
The Db2toAzurePostgreSQL tool migrates database objects from Db2 to Azure Database for PostgreSQL.
パートナー ツールは、非リレーショナル データベース、ファイル システム、およびその他のデータ ストアに対して自動オブジェクト変換を実行します。
データが取り込まれると変換されます。 メインフレームおよびミッドレンジ システムは、EBCDIC でエンコードされた形式でファイル システム データを次のようなファイル形式で格納します。
COBOL、プログラミング言語 1、およびアセンブリ言語のコピーブックは、これらのファイルのデータ構造を定義します。
a. ファイル転送プロトコル (FTP) は、メインフレームとミッドレンジのファイル システム データセットとそれに対応するコピーブックを Azure に転送します。 これらのデータセットには、バイナリ形式で単一のレイアウトとアンパックされたフィールドがあります。
b. データ変換は、Host Integration Server のホスト ファイル コンポーネントを使用するか、Azure Logic Apps の IBM ホスト ファイル用の組み込みコネクタを使用して、カスタム プログラムを開発することによって実現されます。
Spark Notebook コンバーターは、オープンソースの Spark フレームワークを使用して開発されています。 Microsoft Fabric、Azure Synapse Analytics、Azure Databricks などの Spark 環境と互換性があります。
c. リレーショナル データベース データが移行されます。
IBM メインフレームおよびミッドレンジ システムは、次のようなリレーショナル データベースにデータを格納します。
次のサービスは、データベース データを移行します。
- Azure Data Factory では、Db2 コネクタを使用してデータベースからデータを抽出および統合します。
- SQL Server Integration Services は、さまざまなデータ 抽出、変換、および読み込みタスクを 処理します。
- Fabric Data Factory は、IBM Db2 コネクタを使用して Db2 データを移行します。
d. 非リレーショナル データベース データが移行されます。
IBM メインフレームおよびミッドレンジ システムは、次のような非リレーショナル データベースにデータを格納します。
- IDMS, a network model database management system (DBMS).
- IMS, a hierarchical model DBMS.
- Adabas.
- Datacom.
パートナー製品は、これらのデータベースのデータを統合します。
Azure tools like Azure Data Factory and AzCopy load data into Azure databases and Azure data storage. また、パートナー ソリューションとカスタム読み込みソリューションを使用してデータを読み込むこともできます。
Azure では、Azure SQL Database などのフル マネージド リレーショナル データベース サービスや、Azure Cosmos DB などの NoSQL オプションなど、さまざまなデータベース サービスが提供されます。 これらのサービスは、スケーラビリティ、柔軟性、グローバル分散を目的として設計されています。
また、Azure には、非構造化データ用の Azure Blob Storage や、フル マネージド ファイル共有用の Azure Files など、さまざまなストレージ ソリューションも用意されています。
Azure サービスは、コンピューティング、分析、ストレージ、ネットワークに最新化されたデータ層を使用します。
クライアント アプリケーションでは、最新化されたデータ層も使用されます。
Components
このアーキテクチャでは、次のコンポーネントを使用します。
Data storage
このアーキテクチャでは、Azure での柔軟でインテリジェントなデータ管理のために、スケーラブルで安全なクラウド ストレージとマネージド データベースにデータを移行する方法について説明します。
SQL Database is part of the Azure SQL family. これはクラウド向けに設計されており、フル マネージドで常緑化されたサービスとしてのプラットフォーム (PaaS) のすべての利点を提供します。 SQL Database は、パフォーマンスと持続性を最適化する、AI を活用した自動機能も備えています。 サーバーレスコンピューティングと ハイパースケールストレージのオプション は、リソースをオンデマンドで自動的にスケーリングします。
Azure Database for PostgreSQL は、オープンソースの PostgreSQL データベース エンジンのコミュニティ エディションに基づくフル マネージドのリレーショナル データベース サービスです。
Azure Cosmos DB は、グローバルに分散された 複数モデルのNoSQL データベースです。
Azure Database for MySQL は、オープンソース の MySQL データベース エンジンのコミュニティ エディションに基づくフル マネージドのリレーショナル データベース サービスです。
SQL Managed Instance は、フル マネージドの常緑 PaaS のすべての利点を提供するインテリジェントでスケーラブルなクラウド データベース サービスです。 SQL Managed Instance には、最新の SQL Server Enterprise Edition データベース エンジンとのほぼ完全な互換性があります。 また、一般的なセキュリティの問題に対応するネイティブ仮想ネットワーク実装も提供されます。
Azure Data Lake Storage は、ネイティブの生形式で大量のデータを保持するストレージ リポジトリです。 Data Lake Store は、テラバイトとペタバイトのデータにスケーリングするために最適化されています。 通常、データは複数の異種ソースから取得されます。 構造化、半構造化、非構造化のいずれかです。
Microsoft Fabric の SQL データベース は、SQL Database に基づく開発者向けのトランザクション データベースです。 これを使用して、Fabric で運用データベースを簡単に作成できます。 Fabric の SQL データベースでは、SQL Database と同じ SQL データベース エンジンが使用されます。
Microsoft Fabric Lakehouse は、構造化データと非構造化データを一元的に保存、管理、分析するためのデータアーキテクチャプラットフォームです。
Compute
Azure Data Factory は、コンピューティング インフラストラクチャである 統合ランタイム (IR) を使用して、さまざまなネットワーク環境間でデータを統合します。 Azure Data Factory copies data between cloud data stores and data stores in on-premises networks by using self-hosted IRs.
オンプレミス データ ゲートウェイは、ローカルにインストールされた Windows クライアント アプリケーションであり、Microsoft Cloud 内のローカルのオンプレミス データ ソースとサービスの間のブリッジとして機能します。
Azure Virtual Machines は、オンデマンドでスケーラブルなコンピューティング リソースを提供します。 Azure 仮想マシン (VM) は、仮想化の柔軟性を提供しますが、物理ハードウェアのメンテナンス要求を排除します。 Azure VM には、Windows や Linux などのオペレーティング システムが用意されています。
Data integrators
このアーキテクチャでは、メインフレーム ソース データとターゲット データベースに応じて使用するさまざまな Azure ネイティブ移行ツールの概要を示します。
Azure Data Factory
は、ハイブリッド データ統合サービスです。 このソリューションでは、Azure Data Factory はネイティブ コネクタを使用して、Db2 ソースから Azure データベース ターゲットにデータを移行します。 AzCopy is a command-line utility that moves blobs or files into and out of storage accounts.
SQL Server Integration Services は、エンタープライズ レベルのデータ統合および変換ソリューションを作成するためのプラットフォームです。 これを使用すると、次の方法で複雑なビジネス上の問題を解決できます。
- ファイルのコピーまたはダウンロード。
- データ ウェアハウスの読み込み。
- クレンジングとマイニング データ。
- SQL Server オブジェクトとデータの管理。
Host Integration Server の テクノロジとツールは、既存の IBM ホスト システム、プログラム、メッセージ、およびデータを Azure アプリケーションと統合できます。 ホスト ファイル クライアント コンポーネントは、EBCDIC から ASCII に変換されたデータに柔軟性を提供します。 たとえば、変換されたデータから JSON または XML 形式のデータを生成できます。
Azure Synapse Analytics は 、データ統合、エンタープライズ データ ウェアハウス、ビッグ データ分析を組み合わせたものになります。 このアーキテクチャでは、Azure Synapse Analytics 変換ソリューションを使用します。 これは Apache Spark に基づいており、大規模なメインフレーム データセット ワークロード変換に適しています。 幅広いメインフレームデータ構造とターゲットをサポートし、コーディング作業を最小限に抑える必要があります。
Microsoft Fabric is an enterprise-ready, end-to-end analytics platform. データ移動、データ処理、インジェスト、変換、リアルタイム イベント ルーティング、レポート作成を統合します。 次の統合サービスを使用して、これらの機能をサポートしています。
- ファブリック データ エンジニア
- ファブリック データ ファクトリー
- Fabric Data Science
- ファブリック Real-Time インテリジェンス
- ファブリックデータウェアハウス
- Fabric Databases
Other tools
SQL Server Migration Assistant for Db2 は、Db2 から Microsoft データベース サービスへの移行を自動化します。 このツールを VM 上で実行すると、Db2 データベース オブジェクトが SQL Server データベース オブジェクトに変換され、それらのオブジェクトが SQL Server に作成されます。
ホスト ファイルのデータ プロバイダー は、オフライン、SNA、または TCP/IP 接続を使用する Host Integration Server の コンポーネントです。
- オフライン接続では、データ プロバイダーはローカル バイナリ ファイル内のレコードの読み取りと書き込みを行います。
- SNA および TCP/IP 接続を使用すると、データ・プロバイダーは、リモート z/OS (IBM Z シリーズのメインフレーム) データセットまたはリモート i5/OS (IBM AS/400 および iSeries システム) 物理ファイルに格納されているレコードを読み取りおよび書き込みます。 TCP/IP を使用するのは i5/OS システムだけです。
Azure services provide environments, tools, and processes for developing and scaling new applications in the public cloud.
Scenario details
Azure データ プラットフォームのような最新のデータ ストレージ ソリューションは、メインフレームおよびミッドレンジ システムよりも優れたスケーラビリティとパフォーマンスを提供します。 システムを最新化することで、これらの利点を活用できます。 ただし、テクノロジ、インフラストラクチャ、プラクティスの更新は複雑です。 このプロセスには、ビジネスとエンジニアリングのアクティビティに関する徹底的な調査が含まれます。 データ管理は、システムを最新化する際の考慮事項の 1 つです。 また、データの視覚化と統合も確認する必要があります。
Successful modernizations use a data-first strategy. この方法を使用する場合は、新しいシステムではなくデータに重点を置きます。 データ管理は、モダン化チェックリストの項目に過ぎなくなりました。 代わりに、データが中心になります。 調整された品質指向のデータ ソリューションは、断片化され、管理が不十分なものを置き換えます。
このソリューションでは、データ優先アプローチで Azure データ プラットフォーム コンポーネントを使用します。 具体的には、ソリューションには次のものが含まれます。
Object conversion. オブジェクト定義をソース データ ストアからターゲット データ ストア内の対応するオブジェクトに変換します。
Data ingestion. ソース データ ストアに接続し、データを抽出します。
Data transformation. 抽出されたデータを適切なターゲット データ ストア構造に変換します。
Data storage. 最初と継続的の両方で、ソース データ ストアからターゲット データ ストアにデータを読み込みます。
考えられるユース ケース
メインフレームおよびミッドレンジ システムを使用する組織は、特に次のような場合に、このソリューションを利用できます。
ミッション クリティカルなワークロードを最新化します。
ビジネス インテリジェンスを獲得して運用を改善し、競争上の優位性を獲得します。
メインフレームとミッドレンジのデータ ストアに関連付けられている高コストと剛性を削除します。
Considerations
これらの考慮事項では、Azure Well-Architected Framework の柱を実装します。これは、ワークロードの品質を向上させるために使用できる一連の基本原則です。 For more information, see Well-Architected Framework.
セキュリティ
セキュリティは、意図的な攻撃や貴重なデータとシステムの誤用に対する保証を提供します。 詳細については、「セキュリティの設計レビュー チェックリスト」を参照してください。
オンプレミスのクライアント ID と Azure のクライアント ID の違いに注意してください。 違いを補う必要があります。
Use managed identities for component-to-component data flows.
ホスト ファイルのデータ プロバイダーを使用してデータを変換する場合は、「 ホスト ファイルのセキュリティと保護のためのデータ プロバイダー」の推奨事項に従ってください。
Cost Optimization
コストの最適化では、不要な経費を削減し、運用効率を向上させる方法に重点を置いています。 詳細については、「コスト最適化の設計レビュー チェックリスト」を参照してください。
SQL Server Migration Assistant は、Db2 から SQL Server、SQL Database、SQL Managed Instance へのデータベースの移行を簡略化する、サポートされている無料のツールです。 SQL Server Migration Assistant は、移行評価分析、スキーマと SQL ステートメントの変換、データ移行など、移行のすべての側面を自動化します。
Azure Synapse Analytics Spark ベースのソリューションは、オープンソース ライブラリから構築されています。 これにより、ライセンス変換ツールの財務上の負担がなくなります。
このソリューションの実装コストを見積もるには、Azure 料金計算ツールを使用します。
Performance Efficiency
パフォーマンス効率とは、ユーザーの要求を効率的に満たすためにスケーリングするワークロードの能力を指します。 詳細については、「パフォーマンス効率の設計レビュー チェックリスト」を参照してください。
The key pillars of Performance Efficiency are performance management, capacity planning, scalability, and choosing an appropriate performance pattern.
アクティブ/アクティブ モードの複数のオンプレミス マシンに論理インスタンスを関連付けることで、 セルフホステッド IR をスケールアウト できます。
SQL Database を使用してデータベースを動的にスケーリングします。 サーバーレス層では、コンピューティング リソースを自動的にスケーリングできます。 エラスティック プールを使用すると、データベースはプール内のリソースを共有でき、手動でのみスケーリングできます。
Data Provider for Host Files クライアントを使用してデータを変換する場合は、 接続プールを有効に して接続の起動時間を短縮します。 Azure Data Factory を使用してデータを抽出する場合は、 コピー アクティビティのパフォーマンスを調整します。
Contributors
Microsoft では、この記事を保持しています。 次の共同作成者がこの記事を書きました。
Principal author:
- Ashish Khandelwal | Principal Engineering Architect Manager
Other contributors:
- Nithish Aruldoss | Engineering Architect
公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。
Next steps
「Azure データベースの移行ガイド」を確認します。 詳細については、 Azure Data Engineering - Mainframe および Midrange Modernization にお問い合わせください。
次の記事をご覧ください。
- Azure 上の IBM ワークロード
- Azure VM でのメインフレームのホスト変更
- Azure でサポートされているメインフレーム ワークロード
- メインフレーム コンピューティングを Azure に移行する