자습서: Azure Databricks의 엔드투엔드 ML 모델
현실 세계의 기계 학습은 엉망입니다. 데이터 원본에 결측값이 있거나 중복 행이 포함되어 있거나 메모리에 맞지 않을 수 있습니다. 기능 엔지니어링에는 종종 도메인 전문 지식이 필요하며 지루할 수 있습니다. 모델링에는 데이터 과학과 시스템 엔지니어링의 융합이 자주 요구되며 알고리즘에 대한 지식뿐만 아니라 컴퓨터 아키텍처 및 분산 컴퓨터에 대한 지식도 필요로 합니다.
Azure Databricks는 이 프로세스를 단순화합니다. 다음 10분 자습서 Notebook은 테이블 형식 데이터에서 기계 학습 모델을 학습하는 엔드투엔드 예제를 보여 줍니다.
이 Notebook을 가져와서 직접 실행하거나 또는 코드 조각과 아이디어를 복사하여 개인의 용도로 사용할 수 있습니다.
Notebook
작업 영역이 Unity 카탈로그에 사용하도록 설정된 경우 이 버전의 Notebook을 사용합니다:
Databricks에서 MLflow 통합으로 scikit-learn 사용하기(Unity 카탈로그)
Unity 카탈로그에 작업 영역을 사용하도록 설정하지 않은 경우 이 버전의 Notebook을 사용합니다: