다음을 통해 공유


많은 소규모 Spark 작업

작은 작업이 많은 경우 비교적 작은 데이터(<10GB)에서 많은 작업을 수행할 수 있습니다. 작은 작업은 각각 몇 초 정도만 걸리지만 더해지고 작업당 오버헤드에 소요되는 시간도 늘어나게 됩니다.

소규모 작업을 가속화하는 가장 좋은 방법은 여러 작업을 병렬로 실행하는 것입니다. 델타 라이브 테이블 은 자동으로 이 작업을 수행합니다.

기타 옵션은 다음과 같습니다.