이 브라우저는 더 이상 지원되지 않습니다.
최신 기능, 보안 업데이트, 기술 지원을 이용하려면 Microsoft Edge로 업그레이드하세요.
Apache Spark를 가장 잘 설명하는 정의는 무엇인가요?
스케일링 성능이 뛰어난 관계형 데이터베이스 관리 시스템입니다.
Python 런타임이 있는 가상 서버입니다.
여러 언어를 사용하는 병렬 데이터 처리를 위한 분산 플랫폼입니다.
Spark를 사용하여 parquet 파일의 데이터를 분석해야 합니다. 어떻게 해야 하나요?
parquet 파일을 데이터 프레임에 로드합니다.
데이터를 서버리스 SQL 풀의 테이블로 가져옵니다.
데이터를 CSV 형식으로 변환합니다.
SQL 쿼리를 사용하여 Spark 카탈로그의 뷰에서 데이터를 검색하는 Notebook 셀에 코드를 작성하려고 합니다. 사용해야 하는 매직은 무엇인가요?
%%spark
%%pyspark
%%sql
작업을 확인하기 전에 모든 질문에 대답해야 합니다.
이 페이지가 도움이 되었나요?