次の方法で共有


Azure Data Factory と Azure Synapse で ORC フォーマット コネクタの問題を解決する

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

この記事では、Azure Data Factory と Azure Synapse で ORC フォーマット コネクタの一般的問題を解決する方法を提案します。

エラー コード:OrcJavaInvocationException

  • メッセージ: An error occurred when invoking Java, message: %javaException;.

  • 原因と推奨事項: このエラーはさまざまな原因により発生する可能性があります。 考えられる原因の分析および関連する推奨事項については、以下の一覧を確認してください。

    原因分析 推奨
    エラー メッセージに "java.lang.OutOfMemory"、"Java heap space"、および "doubleCapacity" という文字列が含まれている場合は、通常、古いバージョンの Integration Runtime でのメモリ管理の問題です。 セルフホステッド統合ランタイムを使用している場合は、最新バージョンにアップグレードすることをお勧めします。
    エラー メッセージに "java.lang.OutOfMemory" という文字列が含まれている場合は、統合ランタイムにファイルを処理するのに十分なリソースがありません。 統合ランタイムで同時実行を制限してください。 セルフホステッド IR の場合は、8 GB 以上のメモリを備えた強力なマシンにスケールアップしてください。
    エラー メッセージに "NullPointerReference" という文字列が含まれている場合、その原因は一時的なエラーである可能性があります。 操作を再試行してください。 問題が解決しない場合は、サポートにお問い合わせください。
    エラー メッセージに "BufferOverflowException" という文字列が含まれている場合、その原因は一時的なエラーである可能性があります。 操作を再試行してください。 問題が解決しない場合は、サポートにお問い合わせください。
    エラー メッセージに "java.lang.ClassCastException:org.apache.hadoop.hive.serde2.io.HiveCharWritable can't be cast to org.apache.hadoop.io.Text" (java.lang.ClassCastException:org.apache.hadoop.hive.serde2.io.HiveCharWritable を org.apache.hadoop.io.Text にキャストできません) という文字列が含まれている場合、その原因は Java ランタイム内の型変換の問題である可能性があります。 通常は、ソース データを Java ランタイムで適切に処理できないことを意味します。 これはデータの問題です。 ORC 形式のデータで、char または varchar の代わりに string を使用してみてください。

エラー コード:OrcDateTimeExceedLimit

  • メッセージ: The Ticks value '%ticks;' for the datetime column must be between valid datetime ticks range -621355968000000000 and 2534022144000000000.

  • 原因:datetime 値が '0001-01-01 00:00:00' である場合は、ユリウス暦とグレゴリオ暦の違いが原因で発生する可能性があります。

  • 推奨事項: ティック値を確認し、datetime 値 '0001-01-01 00:00:00' を使用しないようにしてください。

トラブルシューティングのその他のヘルプについては、次のリソースを参照してください。