다음을 통해 공유


Microsoft Fabric의 Data Factory에 있는 JSON 형식

이 문서에서는 Microsoft Fabric의 Data Factory 데이터 파이프라인에서 JSON 형식을 구성하는 방법을 간략히 설명합니다.

지원되는 기능

JSON 형식은 원본 및 목적지로서 다음 작업과 커넥터에 대해 지원됩니다.

범주 커넥터/작업
지원되는 커넥터 Amazon S3
Amazon S3 호환
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure 파일
파일 시스템
FTP
Google Cloud Storage
HTTP
레이크하우스 파일
Oracle Cloud Storage
SFTP
지원되는 작업 복사 작업(원본/목적지)
조회 작업
GetMetadata 작업
삭제 작업

복사 작업의 JSON 형식

JSON 형식을 구성하려면 데이터 파이프라인 복사 작업의 원본 또는 목적지에서 연결을 선택한 다음, 파일 형식의 드롭다운 목록에서 JSON을 선택합니다. 이 형식을 추가로 구성하려면 설정을 선택하세요.

파일 형식 설정을 보여 주는 스크린샷

JSON 형식이 원본인 경우

파일 형식 섹션에서 설정을 선택하면 다음 속성이 팝업 파일 형식 설정 대화 상자에 표시됩니다.

JSON 파일 형식 원본을 보여 주는 스크린샷

  • 압축 유형: 드롭다운 목록에서 JSON 파일을 읽는 데 사용되는 압축 코덱을 선택합니다. 드롭다운 목록에서 없음, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 중에서 선택할 수 있습니다.

    압축 유형으로 ZipDeflate를 선택하면 원본 탭의 고급 설정 아래에 zip 파일 이름을 폴더로 유지가 표시됩니다.

    • Zip 파일 이름을 폴더로 유지: 원본 Zip 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자를 선택하면(기본값), 서비스는 압축을 푼 파일을 <specified file path>/<folder named as source zip file>/에 씁니다.
      • 이 상자를 선택 취소하면, 서비스는 압축을 푼 파일을 <specified file path>에 직접 씁니다. 경합 또는 예기치 않은 동작을 방지하기 위해, 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.

    압축 유형으로 TarGzip/tar를 선택하면 원본 탭의 고급 설정 아래에 압축 파일 이름을 폴더로 유지가 표시됩니다.

    • 압축 파일 이름을 폴더로 유지: 원본 압축 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자를 선택하면(기본값), 서비스는 압축을 푼 파일을 <specified file path>/<folder named as source compressed file>/에 씁니다.
      • 이 상자를 선택 취소하면, 서비스는 압축을 푼 파일을 <specified file path>에 직접 씁니다. 경합 또는 예기치 않은 동작을 방지하기 위해 다른 원본 파일에 중복된 파일 이름이 없는지 확인합니다.
  • 압축 수준: 압축 비율입니다. 가장 빠름 또는 최적 중에서 선택할 수 있습니다.

    • 가장 빠름: 결과 파일이 최적으로 압축되지 않은 경우에도 압축 작업을 최대한 빨리 완료해야 합니다.

    • 최적: 작업이 완료되는데 시간이 오래 걸리더라도 압축 작업이 최적으로 압축되어야 합니다. 자세한 내용을 확인하려면 압축 수준 문서로 이동하세요.

  • 인코딩: 테스트 파일을 읽는 데 사용되는 인코딩 유형을 지정합니다. 드롭다운 목록에서 한 가지 유형을 선택하세요. 기본값은 UTF-8입니다.

목적지인 JSON 형식

설정을 선택하면 다음 속성이 팝업 파일 형식 설정 대화 상자에 표시됩니다.

JSON 파일 형식 목적지를 보여주는 스크린샷

  • 압축 유형: 드롭다운 목록에서 JSON 파일을 쓰는 데 사용되는 압축 코덱을 선택합니다. 드롭다운 목록에서 없음, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 중에서 선택할 수 있습니다.

  • 압축 수준: 압축 비율입니다. 최적 또는 가장 빠름 중에서 선택할 수 있습니다.

    • 가장 빠름: 결과 파일이 최적으로 압축되지 않은 경우에도 압축 작업을 최대한 빨리 완료해야 합니다.

    • 최적: 작업이 완료되는데 시간이 오래 걸리더라도 압축 작업이 최적으로 압축되어야 합니다. 자세한 내용을 확인하려면 압축 수준 문서로 이동하세요.

  • 인코딩: 테스트 파일을 쓰는 데 사용되는 인코딩 유형을 지정합니다. 드롭다운 목록에서 한 가지 유형을 선택하세요. 기본값은 UTF-8입니다.

목적지 탭의 고급 설정에서 다음과 같은 JSON 형식 관련 속성이 표시됩니다.

  • 파일 패턴: 각 JSON 파일에 저장된 데이터의 패턴을 지정합니다. 허용되는 값은 개체 집합(JSON Lines)개체 배열입니다. 기본값은 개체 집합입니다. 이러한 패턴에 대한 자세한 내용은 JSON 파일 패턴 섹션을 참조하세요.

JSON 파일 패턴

JSON 파일에서 데이터를 복사하는 경우 복사 작업은 다음과 같은 JSON 파일 패턴을 자동으로 검색하고 구문 분석할 수 있습니다. JSON 파일에 데이터를 쓸 때 복사 작업 목적지에서 파일 패턴을 구성할 수 있습니다.

  • 유형 I: setOfObjects

    각 파일에는 단일 개체, JSON 줄 또는 연결된 개체가 포함됩니다.

    • 단일 개체 JSON 예제

      {
          "time": "2015-04-29T07:12:20.9100000Z",
          "callingimsi": "466920403025604",
          "callingnum1": "678948008",
          "callingnum2": "567834760",
          "switch1": "China",
          "switch2": "Germany"
      }
      
    • JSON Lines(목적지의 기본값)

      {"time":"2015-04-29T07:12:20.9100000Z","callingimsi":"466920403025604","callingnum1":"678948008","callingnum2":"567834760","switch1":"China","switch2":"Germany"}
      {"time":"2015-04-29T07:13:21.0220000Z","callingimsi":"466922202613463","callingnum1":"123436380","callingnum2":"789037573","switch1":"US","switch2":"UK"}
      {"time":"2015-04-29T07:13:21.4370000Z","callingimsi":"466923101048691","callingnum1":"678901578","callingnum2":"345626404","switch1":"Germany","switch2":"UK"}
      
    • 연결된 JSON 예제

      {
          "time": "2015-04-29T07:12:20.9100000Z",
          "callingimsi": "466920403025604",
          "callingnum1": "678948008",
          "callingnum2": "567834760",
          "switch1": "China",
          "switch2": "Germany"
      }
      {
          "time": "2015-04-29T07:13:21.0220000Z",
          "callingimsi": "466922202613463",
          "callingnum1": "123436380",
          "callingnum2": "789037573",
          "switch1": "US",
          "switch2": "UK"
      }
      {
          "time": "2015-04-29T07:13:21.4370000Z",
          "callingimsi": "466923101048691",
          "callingnum1": "678901578",
          "callingnum2": "345626404",
          "switch1": "Germany",
          "switch2": "UK"
      }
      
  • 유형 II: arrayOfObjects

    각 파일에 개체 배열이 포함됩니다.

    [
        {
            "time": "2015-04-29T07:12:20.9100000Z",
            "callingimsi": "466920403025604",
            "callingnum1": "678948008",
            "callingnum2": "567834760",
            "switch1": "China",
            "switch2": "Germany"
        },
        {
            "time": "2015-04-29T07:13:21.0220000Z",
            "callingimsi": "466922202613463",
            "callingnum1": "123436380",
            "callingnum2": "789037573",
            "switch1": "US",
            "switch2": "UK"
        },
        {
            "time": "2015-04-29T07:13:21.4370000Z",
            "callingimsi": "466923101048691",
            "callingnum1": "678901578",
            "callingnum2": "345626404",
            "switch1": "Germany",
            "switch2": "UK"
        }
    ]
    

테이블 요약

JSON이 원본인 경우

JSON 형식을 사용할 때 복사 작업 원본 섹션에서 지원되는 속성은 다음과 같습니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. JSON 유형(datasetSettings 에서):
Json
압축 유형 JSON 파일을 읽는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
아니요 유형(compression 에서):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 가장 빠름
최적
아니요 수준(compression 아래):
가장 빠름
최적
인코딩 테스트 파일을 읽는 데 사용되는 인코딩 형식입니다. "UTF-8"(기본값으로),"BOM 없이 UTF-8", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" 아님 encodingName
Zip 파일 이름을 폴더로 유지 원본 Zip 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다. 선택됨(기본값) 또는 선택 해제됨 아니요 preserveZipFileNameAsFolder
(compressionProperties->type 아래 ZipDeflateReadSettings으로):
true(기본값) 또는 false
압축 파일 이름을 폴더로 유지 원본 압축 파일 이름을 복사 중에 폴더 구조로 유지할지 여부를 나타냅니다. 선택됨(기본값) 또는 선택 해제됨 아니요 preserveCompressionFileNameAsFolder
(compressionProperties->type 아래 TarGZipReadSettings 또는 TarReadSettings으로):
true(기본값) 또는 false

JSON이 목적지인 경우

JSON 형식을 사용할 때 복사 작업 목적지 섹션에서 다음 속성이 지원됩니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. JSON 유형(datasetSettings 에서):
Json
압축 유형 JSON 파일을 쓰는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
아니요 유형(compression 에서):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 가장 빠름
최적
아니요 수준(compression 아래):
가장 빠름
최적
인코딩 테스트 파일을 쓰는 데 사용되는 인코딩 형식입니다. "UTF-8"(기본값으로),"BOM 없이 UTF-8", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" 아님 encodingName
파일 패턴 각 JSON 파일에 저장된 데이터의 패턴을 나타냅니다. 개체의 집합
개체의 배열
아니요 filePattern:
setOfObjects
arrayOfObjects