테이블 및 뷰란?
테이블 및 뷰는 데이터 구성 및 액세스에 대한 Databricks의 기본 개념입니다.
테이블은 일반적으로 Delta Lake 형식의 특정 위치에 저장된 구조화된 데이터 세트입니다. 테이블은 스토리지에 실제 데이터를 저장하며 SQL 명령 또는 DataFrame API를 사용하여 쿼리 및 조작할 수 있으며 삽입, 업데이트, 삭제 및 병합과 같은 작업을 지원합니다. 테이블이란?을 참조하세요.
뷰는 SQL 쿼리로 정의된 가상 테이블입니다. 뷰 자체는 데이터를 저장하지 않습니다. 대신 뷰는 하나 이상의 테이블의 데이터를 특정 형식 또는 추상화로 표시하는 방법을 제공합니다. 보기는 복잡한 쿼리를 단순화하고, 비즈니스 논리를 캡슐화하며, 스토리지를 복제하지 않고 기본 데이터에 일관된 인터페이스를 제공하는 데 유용합니다. 보기란?을 참조하세요.
Unity 카탈로그의 테이블 및 뷰
테이블 및 뷰는 Unity 카탈로그를 사용하여 제어됩니다. Unity 카탈로그에서 테이블과 뷰는 다음 다이어그램과 같이 3개 수준 네임스페이스(catalog.schema.table)의 세 번째 수준에 있습니다.
델타 테이블, 스트리밍 테이블 및 구체화된 뷰 간의 차이점
다음 표에서는 델타 테이블, 스트리밍 테이블 및 구체화된 뷰 간의 차이점에 대한 질문과 대답을 제공합니다.
질문 | 델타 테이블 | ST | MV |
---|---|---|---|
이것은 무엇인가요? | ACID 트랜잭션, 스키마 적용 및 기타 Delta Lake 기능을 지원하는 Delta Lake 형식으로 저장된 표준 테이블입니다. | 스트리밍 및 증분 처리 사용 사례를 위해 확장된 일반 델타 테이블입니다. | 결과가 항상 미리 계산되고 올바른 쿼리의 결과입니다. |
권장되는 사용 사례는 무엇인가요? | 다음을 수행하는 절차 코드: -음식물 섭취 -변형 |
다음을 수행하는 선언적 코드: - 추가 전용 원본에서 수집 - 짧은 대기 시간 변환 |
다음을 수행하는 선언적 코드: - 증분 변환 - 일괄 처리 변환 |
어떻게 채워집니까? | 절차 코드(INSERT , UPDATE , MERGE 파티션 덮어쓰기 사용 replaceWhere ) |
다음을 포함한 선언적 코드: - 스트림 추가 - 변경 내용 스트림 적용 - 한 번 흐름 |
선언적 쿼리 |
Unity 카탈로그의 개체 형식은 무엇인가요? | 테이블 | 테이블 | 보기 |
누가 업데이트할 수 있나요? | 델타 테이블을 업데이트할 수 있는 모든 작성기입니다. | 스트리밍 테이블을 정의하는 파이프라인만 업데이트할 수 있습니다. | 구체화된 뷰를 정의하는 파이프라인만 업데이트할 수 있습니다. |
호환되는 Delta Lake 기능은 무엇인가요? | 모든 Delta Lake 기능을 지원합니다. | 다음을 지원하지 않습니다. - Liquid Partitioning - 예측 최적화 |
다음을 지원하지 않습니다. - Liquid Partitioning - 예측 최적화 |