Azure Data Catalog에 Data Lake Storage Gen1의 데이터 등록
이 문서에서는 데이터 카탈로그와 데이터를 통합하여 조직 내에서 데이터를 검색할 수 있도록 만들기 위해 Azure Data Lake Storage Gen1과 Azure Data Catalog를 통합하는 방법을 알아봅니다. 데이터 카탈로그를 만드는 방법에 대한 자세한 내용은 Azure Data Catalog를 참조하세요. 데이터 카탈로그를 사용할 수 있는 시나리오를 이해하려면 Azure Data Catalog 일반적인 시나리오를 참조하세요.
사전 요구 사항
이 자습서를 시작하기 전에 다음이 있어야 합니다.
Azure 구독. Azure 평가판을 참조하세요.
Data Lake Storage Gen1에 대해 Azure 구독을 사용하도록 설정합니다. 지침을 참조하세요.
Data Lake Storage Gen1 계정. Azure Portal을 사용하여 Azure Data Lake Storage Gen1 시작에 있는 지침을 따릅니다. 이 자습서에서는 Data Lake Storage Gen1 계정 datacatalogstore를 만듭니다.
계정을 만든 후에 그 계정에 샘플 데이터 집합을 업로드합니다. 이 자습서에서는, Azure Data Lake Git 리포지토리 의 AmbulanceData폴더에 있는 모든 .csv 파일을 업로드하겠습니다. Azure Storage Explorer와 같은 다양한 클라이언트를 사용하여 Blob 컨테이너에 데이터를 업로드할 수 있습니다.
Azure Data Catalog. 조직용 Azure Data Catalog가 이미 생성되어 있어야 합니다. 각 조직에는 카탈로그가 하나만 허용됩니다.
Data Lake Storage Gen1을 Data Catalog의 원본으로 등록
https://azure.microsoft.com/services/data-catalog
로 이동하여 시작을 클릭합니다.Azure Data Catalog 포털에 로그인하고 데이터 게시를 클릭합니다.
다음 페이지에서 애플리케이션 시작을 클릭합니다. 컴퓨터에 애플리케이션 매니페스트 파일이 다운로드됩니다. 매니페스트 파일을 두 번 클릭하여 애플리케이션을 시작합니다.
시작 페이지에서 로그인을 클릭하고 자격 증명을 입력합니다.
데이터 원본 선택 페이지에서 Azure Data Lake Store를 선택하고 다음을 클릭합니다.
다음 페이지에서 Data Catalog에 등록할 Data Lake Storage Gen1 계정 이름을 입력합니다. 다른 옵션은 기본값으로 두고 연결을 클릭합니다.
다음 페이지는 다음과 같은 세그먼트로 나눌 수 있습니다.
a. 서버 계층 구조 상자에는 Data Lake Storage Gen1 계정 폴더 구조가 표시됩니다. $Root는 Data Lake Storage Gen1 계정 루트를, AmbulanceData는 Data Lake Storage Gen1 계정의 루트에 생성된 폴더를 나타냅니다.
b. 사용 가능한 개체 상자에 AmbulanceData 폴더의 하위 파일과 폴더가 나열됩니다.
다. 등록할 개체 상자에는 Azure Data Catalog에 등록할 파일과 폴더가 나열됩니다.
이 자습서에서는, 디렉터리의 모든 파일을 등록합니다. 이를 위해, (
) 단추를 클릭하여 모든 파일을 등록할 개체 상자로 이동합니다.
데이터를 조직 전체의 데이터 카탈로그에 등록하는 것이므로, 나중에 데이터를 신속하게 찾는 데 사용할 수 있는 메타데이터를 추가하는 것이 좋습니다. 예를 들어, 데이터 소유자(예: 데이터를 업로드한 사람)의 전자 메일 주소를 추가하거나 데이터 식별을 위한 태그를 추가할 수 있습니다. 아래 스크린 캡처에서 데이터에 추가하는 태그를 볼 수 있습니다.
등록을 클릭합니다.
다음 화면 캡처는 데이터가 데이터 카탈로그에 성공적으로 등록된 것을 나타냅니다.
포털 보기 를 클릭하고 데이터 카탈로그로 돌아가서, 이제 포털에서 등록된 데이터를 액세스할 수 있는지 확인합니다. 데이터 검색을 위해, 데이터를 등록할 때 사용한 태그를 사용할 수 있습니다.
이제 데이터에 주석 및 설명서를 추가하는 등의 작업을 수행할 수 있습니다. 자세한 내용은 다음 링크를 참조하세요.