다음을 통해 공유


데이터 과학 및 데이터 엔지니어링에 대한 Copilot 개요(미리 보기)

중요하다

이 기능은 프리뷰 상태입니다.

데이터 과학 및 데이터 엔지니어링을 위한 Copilot 데이터를 분석하고 시각화하는 데 도움이 되는 AI 도우미입니다. Lakehouse 테이블 및 파일, Power BI 데이터 세트 및 pandas/spark/fabric 데이터 프레임과 함께 작동하여 Notebook에서 직접 답변 및 코드 조각을 제공합니다. Copilot 사용하는 가장 효과적인 방법은 데이터를 데이터 프레임으로 추가하는 것입니다. 채팅 패널에서 질문을 할 수 있으며 AI는 전자 필기장으로 복사할 응답 또는 코드를 제공합니다. 데이터의 스키마와 메타데이터를 이해하고, 데이터가 데이터 프레임에 로드되는 경우 데이터 프레임 내의 데이터도 인식합니다. Copilot 데이터에 대한 인사이트를 제공하거나, 시각화를 위한 코드를 만들거나, 데이터 변환을 위한 코드를 제공하도록 요청할 수 있으며, 쉽게 참조할 수 있도록 파일 이름을 인식합니다. Copilot 복잡한 코딩을 제거하여 데이터 분석을 간소화합니다.

메모

  • 관리자님이 Copilot사용을 시작하기 전에 테넌트 스위치를 활성화해야 합니다. 자세한 내용은 테넌트 설정 Copilot 문서를 참조하세요.
  • F64 또는 P1 용량은 이 문서에 나열된 지역 중 하나에 있어야 하며, 패브릭 지역 가용성에 해당해야 합니다.
  • 테넌트 또는 용량이 미국 또는 프랑스 외부에 있는 경우 패브릭 테넌트 관리자가 Azure OpenAI로 전송된 데이터를 패브릭 관리 포털에서 테넌트의 지리적 지역, 규정 준수 경계 또는 국가 클라우드 인스턴스 테넌트 설정 외부에서 처리할 수 있도록 설정하지 않는 한 Copilot 기본적으로 사용하지 않도록 설정됩니다.
  • Microsoft Fabric의 Copilot 평가판 SKU에서는 지원되지 않습니다. 유료 SKU(F64 이상 또는 P1 이상)만 지원됩니다.
  • 패브릭의 Copilot 현재 공개 미리 보기로 출시되고 있으며 2024년 3월 말까지 모든 고객에게 제공될 예정입니다.
  • 자세한 내용은 Fabric의 및 Power BI에 대한 개요 문서를 참조하세요.

패브릭 데이터 과학용 데이터 과학 및 데이터 엔지니어링에 대한 Copilot 소개

데이터 과학 및 데이터 엔지니어링을 위한 Copilot 통해 데이터 분석 및 시각화 작업을 처리하는 데 도움이 되는 AI 도우미와 채팅할 수 있습니다. Notebook 내에서 lakehouse 테이블, Power BI 데이터 세트, 또는 Pandas/Spark 데이터 프레임에 대해 Copilot 질문을 할 수 있습니다. 자연어 또는 코드 스니펫으로 답변하는 Copilot. Copilot은 할 일에 따라 데이터별 코드를 생성할 수도 있습니다. 예를 들어 데이터 과학 및 데이터 엔지니어링용 Copilot 다음을 위한 코드를 생성할 수 있습니다.

  • 차트 만들기
  • 데이터 필터링
  • 변환 적용
  • 기계 학습 모델

먼저 Notebook 리본에서 Copilot 아이콘을 선택합니다. Copilot 채팅 패널이 열리고 전자 필기장 맨 위에 새 셀이 나타납니다. 이 셀은 Spark 세션이 Fabric 노트북에서 로드될 때마다 실행되어야 합니다. 그렇지 않으면 Copilot 환경이 제대로 작동하지 않습니다. 향후 릴리스에서 이 필수 초기화를 처리하기 위한 다른 메커니즘을 평가하는 중입니다.

Copilot 리본을 보여 주는 스크린샷

다음 코드를 사용하여 Notebook 맨 위에 있는 셀을 실행합니다.

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

셀을 성공적으로 실행한 후 Copilot을 사용할 수 있습니다. Notebook의 세션이 닫히면 전자 필기장 맨 위에 있는 셀을 다시 실행해야 합니다.

성공적인 셀 실행을 보여 주는 스크린샷

Copilot의 효과를 최대화하려면 테이블이나 데이터셋을 노트북에서 데이터프레임으로 로드하십시오. 이러한 방식으로 AI는 데이터에 액세스하고 해당 구조와 콘텐츠를 이해할 수 있습니다. 그런 다음, AI와 채팅을 시작합니다. 전자 필기장 도구 모음에서 채팅 아이콘을 선택하고 채팅 패널에 질문 또는 요청을 입력합니다. 예를 들어 다음을 요청할 수 있습니다.

  • "이 데이터 세트에 있는 고객의 평균 연령은 무엇인가요?"
  • "지역별 판매 막대 차트 표시"

그리고 더 많은. Copilot은 여러분의 노트북에 복사하여 붙여넣을 수 있는 답변 또는 코드를 제공합니다. 데이터 과학 및 데이터 엔지니어링을 위한 Copilot 데이터를 탐색하고 분석하는 편리하고 대화형 방법입니다.

Copilot을(를) 사용할 때, 노트북 셀 안에서 마법 명령어를 호출하여 노트북에서 직접 출력을 얻을 수도 있습니다. 예를 들어 응답에 대한 자연어 답변의 경우 다음과 같이 "%%chat" 명령을 사용하여 질문을 할 수 있습니다.

%%chat
What are some machine learning models that may fit this dataset?

코드 생성을 보여 주는 스크린샷

또는

%%code
Can you generate code for a logistic regression that fits this data?

로지스틱 회귀 코드 생성을 보여 주는 스크린샷

데이터 과학 및 데이터 엔지니어링용 Copilot는 레이크하우스 테이블의 스키마와 메타데이터를 인식합니다. 연결된 레이크하우스의 데이터 컨텍스트에서 Copilot은 관련 정보를 제공할 수 있습니다. 예를 들어 다음을 요청할 수 있습니다.

  • "호숫가에 있는 테이블은 몇 개입니까?"
  • "고객 테이블의 열은 무엇인가요?"

Copilot 레이크하우스를 전자 필기장에 추가한 경우 관련 정보로 응답합니다. Copilot은 노트북에 연결된 모든 레이크하우스에 추가된 파일의 이름을 인식합니다. 채팅에서 이름으로 해당 파일을 참조할 수 있습니다. 예를 들어 lakehouse에 sales.csv라는 파일이 있는 경우, "sales.csv에서 데이터 프레임을 만들라고 요청할 수 있습니다." Copilot 코드를 생성하고 채팅 패널에 표시합니다. Copilot을 사용하여 노트북의 경우, 다양한 출처에서 데이터를 쉽게 액세스하고 쿼리할 수 있습니다. 이를 위해 정확한 명령 구문이 필요하지 않습니다.

  • 채팅 패널의 맨 위에 있는 빗자루를 사용하여 Copilot 채팅 패널에서 대화를 지우세요. Copilot는 세션 중에 입력 또는 출력에 대한 정보를 기억하지만, 현재의 콘텐츠가 방해가 된다면 도움이 될 수 있습니다.
  • 채팅 매직 라이브러리를 사용하여 Copilot에 대한 설정, 특히 개인정보 설정을 구성합니다. 기본 설정 공유 모드는 Copilot가 액세스할 수 있는 컨텍스트 공유를 최대화하도록 설계되었으므로, 제공된 정보를 copilot에게 제한하게 되면 응답의 관련성에 직접적이고 중대한 영향을 미칠 수 있습니다.
  • Copilot 처음 시작하면 시작하는 데 도움이 되는 유용한 프롬프트 집합을 제공합니다. 대화를 시작하는 데 Copilot가 도움이 될 수 있습니다. 나중에 프롬프트를 참조하려면 채팅 패널 아래쪽에 있는 스파클 단추를 사용할 수 있습니다.
  • copilot 채팅의 사이드바를 "드래그"하여 채팅 패널을 확장하거나, 코드를 보다 명확하게 보거나, 화면에서 출력의 가독성을 높일 수 있습니다.

제한사항

데이터 과학 경험의 Copilot 기능은 현재 notebook으로 범위로 제한되어 있습니다. 이러한 기능에는 Copilot 채팅 창, 코드 셀 내에서 사용할 수 있는 IPython 매직 명령 및 코드 셀에 입력할 때 자동 코드 제안이 포함됩니다. Copilot은 시맨틱 링크 통합을 통해 Power BI 시맨틱 모델을 읽을 수도 있습니다.

Copilot는 두 가지 주요 예상 용도가 있습니다.

  • 첫째로, 당신은 Copilot에게 Notebook에서 데이터를 검사하고 분석하도록 요청할 수 있는 옵션이 있습니다(예: 먼저 DataFrame을 로드하고, 그 다음으로 DataFrame 내의 데이터에 대해 Copilot에게 질문하십시오).
  • 둘째, Copilot에게 데이터 분석 프로세스에 대한 다양한 제안을 생성하도록 요청할 수 있습니다. 예를 들어, 관련 예측 모델, 다양한 유형의 데이터 분석을 수행하는 코드 및 완료된 노트북에 대한 문서가 있을 수 있습니다.

급변하거나 최근에 릴리스된 라이브러리를 사용하는 코드 생성에는 부정확성 또는 잘못된 정보가 포함될 수 있습니다.