다음을 통해 공유


자습서: Power BI에서 기계 학습 모델 빌드

Important

데이터 흐름 v1에 대한 Power BI AutoML(Automated Machine Learning) 모델 만들기가 사용 중지되어 더 이상 사용할 수 없습니다. 고객은 솔루션을 Microsoft Fabric의 AutoML 기능으로 마이그레이션하는 것이 좋습니다. 자세한 내용은 사용 중지 공지 사항을 참조하세요.

이 자습서에서는 자동화된 Machine Learning을 사용하여 Power BI에서 이진 예측 모델을 만들고 적용합니다. Power BI 데이터 흐름을 만들고 데이터 흐름에 정의된 엔터티를 사용하여 Power BI에서 직접 기계 학습 모델을 학습하고 유효성을 검사합니다. 그런 다음, 새 데이터 채점에 해당 모델을 사용하여 예측을 생성합니다.

먼저, 이진 예측 기계 학습 모델을 만들어 온라인 세션 특성 집합을 기반으로 하는 온라인 쇼핑객의 구매 의도를 예측합니다. 이 연습에 벤치 마크 기계 학습 의미 체계 모델을 사용합니다. 모델을 학습하면 Power BI는 모델 결과를 설명하는 유효성 검사 보고서를 자동으로 생성합니다. 그런 다음 유효성 검사 보고서를 검토하고 데이터에 모델을 적용하여 점수를 매길 수 있습니다.

이 자습서는 다음 단계로 구성됩니다.

  • 입력 데이터를 사용하여 데이터 흐름을 만듭니다.
  • 기계 학습 모델을 만들고 학습합니다.
  • 모델 유효성 검사 보고서를 검토합니다.
  • 데이터 흐름 엔터티에 모델을 적용합니다.
  • Power BI 보고서에서 모델의 점수가 매겨진 출력을 사용합니다.

입력 데이터를 사용하여 데이터 흐름 만들기

다음 단계에 따라 입력 데이터를 사용하여 데이터 흐름을 만듭니다.

데이터 가져오기

데이터 흐름을 만드는 첫 번째 단계는 데이터 원본을 준비하는 것입니다. 이 경우 온라인 세션 집합에서 기계 학습 의미 체계 모델을 사용하며, 이 중 일부는 구매로 이어집니다. 의미 체계 모델에는 모델을 학습하는 데 사용할 해당 세션에 대한 특성 집합이 포함되어 있습니다.

UC Irvine 웹 사이트에서 의미 체계 모델을 다운로드하거나 online_shoppers_intention.csv를 다운로드할 수 있습니다. 이 자습서의 뒷부분에서 해당 URL을 지정하여 의미 체계 모델에 연결합니다.

테이블 만들기

데이터 흐름에 엔터티를 만들려면 Power BI 서비스에 로그인한 다음 작업 영역으로 이동합니다.

  1. 작업 영역이 없는 경우 Power BI 왼쪽 탐색 창에서 작업 영역을 선택하고 작업 영역 만들기를 선택하여 작업 영역을 만듭니다. 작업 영역 만들기 창에 작업 영역 이름을 입력하고 저장을 선택합니다.

    작업 영역을 만드는 방법을 보여 주는 스크린샷.

  2. 새 작업 영역의 맨 위에서 새로 만들기를 선택한 다음 데이터 흐름을 선택합니다.

    데이터 흐름을 만드는 방법을 보여 주는 스크린샷.

  3. 새 테이블 추가를 선택하여 브라우저에서 파워 쿼리 편집기를 실행합니다.

    새 테이블 추가를 선택하는 것을 보여 주는 스크린샷.

  4. 데이터 원본 선택 화면에서 데이터 원본으로 텍스트/CSV를 선택합니다.

    데이터 원본 선택에서 텍스트/CSV를 선택하는 것을 보여 주는 스크린샷.

  5. 데이터 원본에 연결 페이지에서 online_shoppers_intention.csv 파일에 대한 다음 링크를 파일 경로 또는 URL 상자에 붙여넣고 다음을 선택합니다.

    https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

    파일 경로에 붙여넣기를 보여 주는 스크린샷.

  6. 파워 쿼리 편집기는 CSV 파일의 데이터에 대한 미리 보기를 보여 줍니다. 데이터를 로드하기 전에 변경하려면 데이터 변환을 선택합니다.

    파일 데이터 미리 보기 화면에서 데이터 변환을 선택하는 것을 보여 주는 스크린샷.

  7. 파워 쿼리는 열의 데이터 형식을 자동으로 유추합니다. 열 머리글의 맨 위에 있는 특성 유형 아이콘을 선택하여 데이터 형식을 변경할 수 있습니다. 수익 열의 유형을 True/False로 변경합니다.

    오른쪽 창에 있는 이름 상자의 값을 변경하여 쿼리 이름을 보다 친숙한 이름으로 바꿀 수 있습니다. 예를 들어, 쿼리 이름을 온라인 방문자로 변경할 수 있습니다.

    쿼리 이름 및 수익 열 데이터 형식을 변경하는 것을 보여 주는 스크린샷.

  8. 저장 및 닫기를 선택하고 대화 상자에서 데이터 흐름의 이름을 입력한 후 저장을 선택합니다.

    데이터 흐름 저장 스크린샷.

기계 학습 모델 만들기 및 학습

기계 학습 모델 추가

  1. 학습 데이터와 레이블 정보를 포함하는 테이블에 대한 작업 목록에서 ML 모델 적용 아이콘을 선택하고 기계 학습 모델 추가를 선택합니다.

    기계 학습 모델 추가를 보여 주는 스크린샷.

  2. 기계 학습 모델을 만드는 첫 번째 단계는 예측하려는 결과 필드가 포함된 기록 데이터를 확인하는 것입니다. 이 데이터를 학습하여 모델을 만듭니다. 이 경우 방문자가 구매할지 여부를 예측하려고 합니다. 예측하려는 결과는 수익 필드에 있습니다. 결과 열 값으로 수익을 선택한 후 다음을 선택합니다.

    기록 데이터 필드 선택을 보여 주는 스크린샷.

  3. 다음으로, 만들 기계 학습 모델의 유형을 선택합니다. Power BI는 사용자가 확인한 결과 필드의 값을 분석하고 해당 필드를 예측하기 위해 만들 수 있는 기계 학습 모델 유형을 제안합니다.

    이 경우 방문자가 구매할지 여부에 대한 이진 결과를 예측하려고 하므로 Power BI는 이진 예측을 권장합니다. 구매하려는 방문자를 예측하는 데 관심이 있으므로 대상 결과 선택에서 true를 선택합니다. 모델 유효성 검사 결과를 요약하는 자동 생성된 보고서 결과에 사용할 다른 레이블을 제공할 수도 있습니다. 그 후 다음을 선택합니다.

    이진 파일 예측 화면을 보여 주는 스크린샷.

  4. Power BI에서 데이터 샘플의 예비 검색을 수행하고 더 정확한 예측을 생성할 수 있는 입력을 제안합니다. Power BI에서 열을 권장하지 않는 경우 열 옆에 권장하지 않는 이유를 설명합니다. 열 이름 옆에 있는 확인란을 선택하거나 선택 취소하여 모델에서 학습할 필드만 포함하도록 선택 항목을 변경할 수 있습니다. 입력을 수락하려면 다음을 선택합니다.

    열 선택을 보여 주는 스크린샷.

  5. 마지막 단계에서는 모델 이름을 구매 의도 예측의 이름을 지정하고 학습에 소요되는 시간을 선택합니다. 빠른 결과를 확인하기 위해 학습 시간을 줄이거나, 최상의 모델을 얻기 위해 학습 시간을 늘릴 수 있습니다. 저장 후 학습을 선택하여 모델 학습을 시작합니다.

    모델 이름 지정 및 학습 시간 선택을 보여 주는 스크린샷.

데이터 원본에 대한 자격 증명을 찾을 수 없는 오류와 유사한 오류가 발생하면 Power BI는 데이터 점수를 매기도록 자격 증명을 업데이트해야 합니다. 자격 증명을 업데이트하려면 머리글 표시줄에서 기타 옵션 ...을 선택한 다음 설정>설정을 선택합니다.

설정 선택을 보여 주는 스크린샷.

데이터 흐름에서 데이터 흐름을 선택하고 데이터 원본 자격 증명을 확장한 다음 자격 증명 편집을 선택합니다.

Dataflow 사용자 인증 정보 편집을 보여 주는 스크린샷.

학습 상태 추적

학습 프로세스는 기록 데이터를 샘플링 및 정규화하고 의미 체계 모델을 구매 의도 예측 학습 데이터구매 의도 예측 테스트 데이터의 새 엔터티로 분할하는 것으로 시작됩니다.

의미 체계 모델의 크기에 따라 학습 프로세스는 몇 분에서 선택된 학습 시간까지 걸릴 수 있습니다. 데이터 흐름의 상태를 통해 모델이 학습되고 유효성이 검사되는지 확인할 수 있습니다. 이는 작업 영역의 의미 체계 모델 + 데이터 흐름 탭에서 데이터 새로 고침 처리 중으로 표시됩니다.

학습 중인 모델을 보여 주는 스크린샷.

데이터 흐름의 기계 학습 모델 탭에서 모델을 볼 수 있습니다. 상태는 모델이 학습을 위해 큐에 대기 중이거나 학습 중이거나 학습되었음을 나타냅니다. 모델 학습이 완료되면 데이터 흐름은 업데이트된 마지막 학습 시간 및 학습됨 상태를 표시합니다.

학습 상태와 마지막 학습 시간을 보여 주는 스크린샷.

모델 유효성 검사 보고서 검토

모델 유효성 검사 보고서를 검토하려면 기계 학습 모델 탭에서 동작 아래의 학습 보고서 보기 아이콘을 선택합니다. 이 보고서는 기계 학습 모델의 잠재적 성능을 설명합니다.

보고서의 모델 성능 페이지에서 상위 예측 변수 확인을 선택하여 모델의 상위 예측 변수를 확인합니다. 예측 변수 중 하나를 선택하여 결과 분포를 해당 예측 변수에 연결하는 방법을 확인할 수 있습니다.

모델 성능 페이지를 보여 주는 스크린샷.

모델 성능 페이지에서 확률 임계값 슬라이서를 사용하여 모델의 정밀도재현율에 대한 영향을 검사할 수 있습니다.

가능성 임계값 슬라이서를 보여 주는 스크린샷.

보고서의 다른 페이지는 모델의 통계 성능 메트릭을 설명합니다.

이 보고서에는 반복 실행, 입력에서 기능을 추출하는 방법, 사용된 최종 모델의 하이퍼 매개 변수를 설명하는 학습 세부 정보 페이지도 포함됩니다.

데이터 흐름 엔터티에 모델 적용

보고서 맨 위에 있는 모델 적용 단추를 선택하여 이 모델을 호출합니다. 적용 대화 상자에서 모델을 적용할 원본 데이터가 포함된 대상 엔터티를 지정할 수 있습니다. 그런 다음 저장 및 적용을 선택합니다.

모델 적용을 보여 주는 스크린샷.

모델을 적용하면 enriched <model_name>enriched <model_name> explanations 접미사를 사용하여 새 테이블 2개가 생성됩니다. 이 경우 온라인 방문자 테이블에 모델을 적용하면 다음이 만들어집니다.

  • 온라인 방문자가 모델의 예측 출력을 포함하는 구매 의도 예측을 보강했습니다.
  • 온라인 방문자가 예측에 대한 최고 레코드별 영향 요인을 포함하는 구매 의도 예측 설명을 보강했습니다.

이진 예측 모델을 적용하면 Outcome, PredictionScore, PredictionExplanationExplanationIndex열 4개가 추가되며, 각 열에는 구매 의도 예측 접두사가 있습니다.

4개의 새로운 열을 보여 주는 스크린샷.

데이터 흐름 새로 고침이 완료되면 온라인 방문자가 구매 의도 예측을 보강했습니다. 테이블을 선택하여 결과를 볼 수 있습니다.

온라인 방문자 보강된 구매 의도 예측 테이블의 결과 보기를 보여 주는 스크린샷.

데이터 흐름의 파워 쿼리 편집기에서 직접 작업 영역의 모든 자동화된 Machine Learning 모델을 호출할 수도 있습니다. 자동화된 Machine Learning 모델에 액세스하려면 자동화된 Machine Learning 모델의 인사이트를 사용하여 보강하려는 테이블에 대한 편집을 선택합니다.

테이블에 대해 편집을 선택하는 것을 보여 주는 스크린샷.

파워 쿼리 편집기의 리본에서 AI 인사이트를 선택합니다.

AI 인사이트 선택을 보여 주는 스크린샷.

AI 인사이트 화면의 탐색 창에서 Power BI 기계 학습 모델 폴더를 선택합니다. 목록에는 액세스 권한이 있는 모든 기계 학습 모델이 파워 쿼리 함수로 표시됩니다. 기계 학습 모델에 대한 입력 매개 변수도 자동으로 해당 파워 쿼리 함수의 매개 변수로 매핑됩니다. 자동 매개 변수 매핑은 매개 변수의 이름과 데이터 형식이 동일한 경우에만 발생합니다.

기계 학습 모델을 호출하려면 선택한 모델의 열을 드롭다운 목록에서 입력으로 선택할 수 있습니다. 입력 대화 상자 옆으로 열 아이콘을 전환하여 입력으로 사용할 상수 값을 지정할 수도 있습니다.

Power Query 함수 브라우저를 보여 주는 스크린샷.

기계 학습 모델 출력 미리 보기를 테이블에 새 열로 표시하려면 적용을 선택합니다. 모델 호출을 쿼리의 적용 단계 아래에 표시할 수도 있습니다.

Power Query 편집기에서 미리 보기 결과 보기를 보여 주는 스크린샷.

데이터 흐름을 저장하면 엔터티 테이블의 모든 새 행 또는 업데이트된 행에 대해 데이터 흐름을 새로 고치는 경우 자동으로 모델이 호출됩니다.

Power BI 보고서에서 모델의 점수가 매겨진 출력 사용

기계 학습 모델의 채점된 출력을 사용하기 위해 데이터 흐름 커넥터를 사용하여 Power BI Desktop에서 데이터 흐름에 연결할 수 있습니다. 이제 온라인 구매자가 구매 의도 예측을 보강했습니다. 테이블을 사용하여 모델의 예측을 Power BI 보고서에 통합할 수 있습니다.

제한 사항

자동화된 Machine Learning에서 게이트웨이를 사용하는 데 몇 가지 알려진 문제가 있습니다. 게이트웨이를 사용해야 하는 경우 먼저 게이트웨이를 통해 필요한 데이터를 가져오는 데이터 흐름을 만드는 것이 좋습니다. 그런 다음, 첫 번째 데이터 흐름을 참조하는 다른 데이터 흐름을 만들어 이러한 모델을 만들거나 적용합니다.

데이터 흐름에 대한 AI 작업이 실패하는 경우 데이터 흐름과 함께 AI를 사용할 때 빠른 결합을 사용하도록 설정해야 할 수 있습니다. 테이블을 가져온 후 AI 기능 추가를 시작하기 전에 홈 리본에서 옵션을 선택하고 표시되는 창에서 데이터 결합 허용 옆의 확인란을 선택합니다. 여러 원본에서 기능을 사용하도록 설정한 다음 확인을 선택하여 선택 사항을 저장합니다. 그런 다음 데이터 흐름에 AI 기능을 추가할 수 있습니다.

이 자습서에서는 다음 단계를 통해 Power BI에서 이진 예측 모델을 만들고 적용했습니다.

  • 입력 데이터를 사용하여 데이터 흐름을 만들었습니다.
  • 기계 학습 모델을 만들고 학습했습니다.
  • 모델 유효성 검사 보고서를 검토했습니다.
  • 데이터 흐름 엔터티에 모델을 적용했습니다.
  • Power BI 보고서에서 모델의 점수가 매겨진 출력을 사용하는 방법을 학습했습니다.

Power BI의 기계 학습 자동화에 대한 자세한 내용은 Power BI의 자동화된 Machine Learning을 참조하세요.