다음을 통해 공유


Matchbox 추천 점수 매기기

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

Matchbox 추천을 사용하여 데이터 집합에 대한 예측 점수 매기기

범주: Machine Learning/ 점수

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 매치박스 추천 점수 매기기 모듈을 사용하여 Microsoft Research의 Matchbox 알고리즘을 기반으로 학습된 권장 사항 모델을 기반으로 예측을 만드는 방법을 설명합니다.

Matchbox 추천자는 다음과 같은 네 가지 종류의 예측을 생성할 수 있습니다.

후자의 세 가지 종류의 예측을 만들 때 프로덕션 모드 또는 평가 모드에서 작동할 수 있습니다.

  • 프로덕션 모드는 모든 사용자나 항목을 고려하며 일반적으로 웹 서비스에서 사용됩니다.

    학습 중에 표시되는 사용자뿐만 아니라 새 사용자에 대한 점수를 만들 수 있습니다. 자세한 내용은 이 섹션을 참조하세요.

  • 평가 모드는 평가될 수 있는 사용자나 항목 세트의 일부에 대해 작동하며 일반적으로 실험 중에 사용됩니다.

.NET 개발 팀의 이 자습서에서 권장 사항 시스템을 빌드하는 엔드 투 엔드 환경에 대해 알아야 할 모든 것을 알아봅니다. 샘플 코드와 애플리케이션에서 Machine Learning 호출하는 방법에 대한 설명이 포함되어 있습니다.

Machine Learning 사용하여 .NET 애플리케이션에 대한 권장 엔진 빌드

매치박스 추천에 대한 자세한 정보

권장 사항 시스템을 만드는 목표는 시스템의 "사용자"에게 하나 이상의 "항목"을 추천하는 것입니다. 항목에는 영화, 식당, 책, 노래 등이 포함될 수 있습니다. 그리고 사용자는 사람, 사람 그룹 또는 항목 기본 설정이 지정된 기타 엔터티일 수 있습니다.

추천 시스템에는 두 가지 기본 접근 방식이 사용됩니다. 그 중 첫 번째는 사용자와 항목 둘 다에 대해 기능을 사용하는 콘텐츠 기반 방식입니다. 사용자는 연령/성별 등의 속성으로 설명할 수 있고 항목은 작성자/제조업체 등의 속성으로 설명할 수 있습니다. 콘텐츠 기반 추천 시스템의 일반적인 예는 소셜 매치메이킹 사이트에서 확인할 수 있습니다. 두 번째 방식은 공동 작업 필터링입니다. 이 방식에서는 사용자와 항목의 식별자만을 사용하며, 사용자가 항목에 지정한 등급의 스파스 행렬에서 이러한 엔터티와 관련된 암시적 정보를 가져옵니다. 특정 사용자에 대한 정보는 해당 사용자가 등급을 지정한 항목과 같은 항목에 등급을 지정한 다른 사용자로부터 파악할 수 있습니다.

Matchbox 추천은 공동 작업 필터링과 콘텐츠 기반 방식이 결합된 방식을 사용하므로 하이브리드 추천이라고 할 수 있습니다. 시스템을 사용한 지 얼마 되지 않은 사용자의 경우에는 해당 사용자에 대한 기능 정보를 활용하여 예측 성능을 개선합니다. 따라서 일반적으로 발생하는 "콜드 시작" 문제를 방지할 수 있습니다. 그러나 특정 사용자의 등급 정보가 충분히 수집되면 기능뿐이 아니라 사용자의 특정 등급에 따라 해당 사용자에 대해 완전히 개인 설정된 예측을 할 수 있습니다. 따라서 추천 방식이 콘텐츠 기반 추천에서 공동 작업 필터링 기반 추천으로 원활하게 전환됩니다. 사용자 또는 항목 기능을 사용할 수 없는 경우에도 Matchbox는 여전히 공동 작업 필터링 모드에서 작동합니다.

Matchbox 추천 및 기본 확률 알고리즘에 대한 자세한 내용은 관련 연구 문서인

권장 엔진에서 점수를 만드는 방법의 예는 Azure AI 갤러리를 참조하세요.

  • 추천: 동영상 추천: 이 샘플에서는 항목이 영화인 항목 권장 사항을 보여 줍니다. 또한 등급 예측을 보여 줍니다.

  • 추천: 레스토랑 등급: 이 샘플에서는 항목 기능과 사용자 기능을 모두 사용하는 항목 권장 사항을 보여 줍니다.

  • 권장 사항 사방: 이 블로그 게시물은 많은 시각 보조 기능을 갖춘 추천 시스템에 대한 개략적인 소개를 제공합니다.

매치박스 추천 점수 매기기를 구성하는 방법

이 모듈은 각기 다른 요구 사항을 사용하는 다양한 유형의 추천을 지원합니다. 사용자가 보유한 데이터 형식 및 사용자가 만들려는 추천의 유형에 대한 링크를 클릭합니다.

예측 등급

등급을 예측할 때 모델은 지정된 사용자가 학습 데이터를 사용하여 특정 항목에 반응하는 방법을 계산합니다. 따라서 점수 매기기를 위한 입력 데이터는 평가할 사용자와 항목을 모두 제공해야 합니다.

  1. 학습된 권장 사항 모델을 실험에 추가하고 학습된 Matchbox 추천에 연결합니다. Matchbox 추천 학습을 사용하여 모델을 만들어야 합니다.

  2. 추천 예측 종류: 등급 예측을 선택합니다. 추가 매개 변수는 필요하지 않습니다.

  3. 예측을 만들 데이터를 추가하고 점수를 매길 데이터 세트에 연결합니다.

    등급을 예측하려면 입력 데이터 세트에 사용자-항목 쌍이 포함되어야 합니다.

    데이터 세트에는 첫 번째 및 두 번째 열에 있는 사용자-항목 쌍의 선택적인 세 번째 열이 포함될 수 있지만 예측 중에 세 번째 열은 무시됩니다.

  4. (선택 사항) 사용자 기능의 데이터 세트가 있는 경우 사용자 기능에 연결합니다.

    사용자 기능의 데이터 세트에는 첫 번째 열에 사용자 ID가 포함되어야 합니다. 나머지 열에는 성별, 기본 설정, 위치 등 사용자의 특징을 지정하는 값이 포함되어야 합니다.

    등급 항목이 있는 사용자의 기능은 학습 중에 이미 학습되었기 때문에 매치박스 추천 점수 매기기에 의해 무시됩니다. 따라서 콜드 시작 사용자 또는 항목의 등급을 지정하지 않은 사용자만 포함하도록 데이터 세트를 미리 필터링합니다.

    경고

    사용자 기능을 사용하지 않고 모델을 학습한 경우 점수 매기기 중에 사용자 기능을 도입할 수 없습니다.

  5. 항목 기능의 데이터 세트가 있으면 항목 기능에 연결할 수 있습니다.

    항목 기능 데이터 세트에는 첫 번째 열에 항목 식별자가 포함되어야 합니다. 나머지 열에는 항목의 특징을 지정하는 값이 포함되어야 합니다.

    등급 항목의 기능은 학습 중에 이미 학습되었으므로 점수 일치 상자 추천에서 무시됩니다. 따라서 점수 매기기 데이터 세트를 콜드 시작 항목 또는 사용자가 등급을 매기지 않은 항목으로 제한합니다.

    경고

    항목 기능을 사용하지 않고 모델을 학습한 경우 점수 매기기 중에 항목 기능을 도입할 수 없습니다.

  6. 학습 데이터 세트라는 선택적 다섯 번째 입력 포트를 사용하여 예측 결과에서 이미 등급이 지정된 항목을 제거합니다.

    이 필터를 적용하려면 원래 학습 데이터 세트를 입력 포트에 연결합니다.

  7. 실험을 실행합니다.

등급 예측 결과

출력 데이터 세트에는 사용자, 항목 및 각 입력 사용자 및 항목에 대한 예측 등급이 포함된 세 개의 열이 포함되어 있습니다.

또한 점수 매기기 중에 다음 변경 내용이 적용됩니다.

  • 사용자 또는 항목 기능 열에서 누락된 값은 누락되지 않은 학습 집합 값의 모드 로 자동으로 바뀝니다.

  • 모든 사용자 및 항목 기능은 학습에 표시되는 해당 최대 절대값으로 크기가 조정됩니다.

  • 기능 값의 경우 희박도를 유지하기 위해 변환이 적용되지 않습니다.

  • 단일 값 기능은 이진 값 표시기 기능 집합으로 변환됩니다.

추천

사용자에게 항목을 추천하려면 사용자 및 항목 목록을 입력으로 제공합니다. 이 데이터에서 모델은 기존 항목 및 사용자에 대한 정보를 사용하여 각 사용자에게 표시 가능한 것으로 예상되는 항목의 목록을 생성합니다. 반환되는 추천 수를 사용자 지정하고, 추천을 생성하기 위해 필요한 이전 추천 수에 대한 임계값을 설정할 수 있습니다.

  1. 학습된 권장 사항 모델을 실험에 추가하고 학습된 매치박스 추천에 연결합니다. 매치박스 추천 학습을 사용하여 모델을 만들어야 합니다.

  2. 지정된 사용자 목록에 대한 항목을 추천하려면 추천 예측 종류항목 추천으로 설정합니다.

  3. 추천 항목 선택: 다음 값 중 하나를 선택하여 프로덕션 또는 모델 평가에 점수 매기기 모듈을 사용하는지 여부를 나타냅니다.

    • 등급이 지정된 항목에서(모델 평가의 경우) : 모델을 개발하거나 테스트하는 경우 이 옵션을 선택합니다. 이 옵션은 평가 모드를 사용하도록 설정하며, 모듈은 등급이 지정된 입력 데이터 세트의 해당 항목에서만 추천을 만듭니다.

    • 모든 항목에서: 웹 서비스 또는 프로덕션에서 사용할 실험을 설정하는 경우 이 옵션을 선택합니다. 이 옵션은 프로덕션 모드를 사용하도록 설정하며, 모듈은 학습 중에 확인된 모든 항목에서 추천을 만듭니다.

  4. 예측을 만들 데이터 세트를 추가하고 점수를 매길 데이터 세트에 연결합니다.

    • 모든 항목에서 옵션을 선택하는 경우 입력 데이터 세트는 하나의 열로만 구성되어야 하며 추천을 만들 사용자의 식별자를 포함합니다.

      데이터 세트에 둘 이상의 열이 포함되어 있으면 오류가 발생합니다. 데이터 세트 모듈에서 열 선택 모듈을 사용하여 입력 데이터 세트에서 추가 열을 제거합니다.

    • 등급이 지정된 항목에서(모델 평가의 경우) 옵션을 선택하는 경우 입력 데이터 세트는 사용자-항목 쌍으로 구성되어야 합니다. 첫 번째 열에는 사용자 ID가 포함되어야 합니다. 두 번째 열에는 해당 항목 식별자가 포함되어야 합니다.

      데이터 세트는 사용자 항목 등급의 세 번째 열을 포함할 수 있지만 이 열은 무시됩니다.

  5. (선택 사항) 사용자 기능의 데이터 세트가 있는 경우 사용자 기능에 연결합니다.

    사용자 기능 데이터 세트의 첫 번째 열에는 사용자 ID가 포함되어야 합니다. 나머지 열에는 성별, 기본 설정, 위치 등 사용자의 특징을 지정하는 값이 포함되어야 합니다.

    등급이 지정된 항목이 있는 사용자의 기능은 학습 중에 이미 학습되었기 때문에 매치박스 추천 점수 매기기에서 무시됩니다. 따라서 콜드 시작 사용자 또는 항목의 등급을 지정하지 않은 사용자만 포함하도록 데이터 세트를 미리 필터링합니다.

    경고

    사용자 기능을 사용하지 않고 모델을 학습한 경우 점수 매기기 중에 기능을 도입할 수 없습니다.

  6. (선택 사항) 항목 기능의 데이터 세트가 있으면 항목 기능에 연결할 수 있습니다.

    항목 기능 데이터 세트의 첫 번째 열에는 항목 식별자가 포함되어야 합니다. 나머지 열에는 항목의 특징을 지정하는 값이 포함되어야 합니다.

    등급이 지정된 항목의 기능은 학습 중에 이미 학습되었기 때문에 매치박스 추천 점수 매기기에서 무시됩니다. 따라서 점수 매기기 데이터 세트를 콜드 시작 항목 또는 사용자가 등급을 지정하지 않은 항목으로 제한할 수 있습니다.

    경고

    항목 기능을 사용하지 않고 모델을 학습한 경우 점수를 매길 때 항목 기능을 사용하지 마십시오.

  7. 사용자에게 추천할 최대 항목 수: 각 사용자에 대해 반환할 항목의 수를 입력합니다. 기본적으로 5개 항목을 권장합니다.

  8. 사용자당 추천 풀의 최소 크기: 필요한 사전 추천 수를 나타내는 값을 입력합니다. 기본적으로 이 매개 변수는 2로 설정됩니다. 즉, 항목을 두 개 이상의 다른 사용자가 추천해야 합니다.

    이 옵션은 평가 모드에서 점수를 매기는 경우에만 사용해야 합니다. 모든 항목에서 선택하는 경우 이 옵션을 사용할 수 없습니다.

  9. 실험을 실행합니다.

항목 추천의 결과

Matchbox 추천 점수 매기기에서 반환하는 점수가 매겨진 데이터 집합에는 각 사용자에 대한 추천 항목이 표시됩니다.

  • 첫 번째 열에는 사용자 식별자가 포함됩니다.
  • 사용자에게 추천할 최대 항목 수에 대해 설정한 값에 따라 많은 추가 열이 생성됩니다. 각 열에는 추천된 항목(식별자별)이 포함됩니다. 추천은 항목 1 열에서 선호도가 가장 높은 항목을 포함하는 사용자-항목 선호도를 기준으로 정렬됩니다.

경고

이 점수가 매기된 데이터 세트는 추천 평가 모듈을 사용하여 평가할 수 없습니다.

관련 사용자 찾기

관련 사용자를 찾는 옵션은 "사용자 같은 사람"을 추천하거나 다른 유형의 예측을 기반으로 하는 유사한 사용자 풀을 만드는 경우에 유용합니다.

  1. 학습된 권장 사항 모델을 실험에 추가하고 학습된 매치박스 추천에 연결합니다. 매치박스 추천 학습을 사용하여 모델을 만들어야 합니다.

  2. 추천 예측 종류: 관련 사용자를 선택합니다.

  3. 관련 사용자 선택: 점수를 매기기 위해 모델을 사용하는 방법을 나타내고 다음과 같이 점수를 기준으로 할 사용자 풀을 지정합니다.

    • 모든 사용자: 웹 서비스 또는 프로덕션에서 사용할 실험을 설정하거나 새 사용자를 예측해야 하는 경우 이 옵션을 선택합니다. 이 옵션은 프로덕션 모드를 사용하도록 설정하고 모듈은 학습 중에 본 사용자에 대해서만 권장 사항을 기반으로 합니다.

    • 등급이 지정된 항목(모델 평가용)에서: 모델을 개발하거나 테스트하는 경우 이 옵션을 선택합니다. 이 옵션은 평가 모드를 사용하도록 설정하고, 모델은 몇 가지 일반적인 항목을 평가한 테스트 집합의 사용자를 기반으로 권장 사항을 기반으로 합니다.

  4. 예측을 생성할 사용자가 포함된 데이터 세트를 커넥트. 이 데이터 세트의 형식은 프로덕션 모드 또는 평가 모드에서 채점 모듈을 사용하는지 여부에 따라 달라집니다.

    • 프로덕션 모드( 모든 항목에서 사용)

      점수를 매길 데이터 세트는 관련 사용자를 찾으려는 사용자 로 구성되어야 합니다. 첫 번째 열과 유일한 열에는 사용자 식별자가 포함되어야 합니다. 다른 열이 포함된 경우 오류가 발생합니다. 데이터 세트 모듈에서 열 선택 모듈을 사용하여 불필요한 열을 제거합니다.

    • 평가 모드, 등급 항목에서 사용(모델 평가용)

      채점할 데이터 세트는 사용자 항목 쌍을 포함하는 2-3개의 열로 구성되어야 합니다. 첫 번째 열에는 사용자 식별자가 포함되어야 합니다. 두 번째 열에는 항목 식별자가 포함되어야 합니다. 데이터 세트에는 세 번째 등급 열(열 2의 항목에 대해 1열의 사용자가 포함)이 포함될 수 있지만 등급 열은 무시됩니다.

  5. 사용자에 대해 찾을 최대 관련 사용자 수: 각 사용자에 대해 원하는 최대 예측 수를 나타내는 숫자를 입력합니다. 기본값은 5입니다. 즉, 최대 5명의 관련 사용자가 반환될 수 있지만 경우에 따라 5보다 작을 수 있습니다.

  6. 평가 모드(등급이 지정된 항목의 사용자)에서 다음 추가 매개 변수를 구성합니다.

    • 쿼리 사용자와 관련 사용자가 공통적으로 평가해야 하는 최소 항목 수: 이 값은 권장 사항에 대한 임계값을 설정합니다. 입력한 숫자는 대상 사용자와 잠재적 관련 사용자가 평가해야 하는 최소 항목 수를 나타냅니다. 기본값은 2입니다. 즉, 적어도 두 항목은 두 사용자에 의해 평가되어야 합니다.

    • 단일 사용자에 대한 관련 사용자 풀의 최소 크기: 이 값은 권장 사항을 만드는 데 필요한 유사한 사용자의 최소 수를 제어합니다. 기본적으로 값은 2입니다. 즉, 동일한 항목을 평가하여 관련된 사용자가 2명 정도인 경우 관련 항목을 고려하고 권장 사항을 생성할 수 있습니다.

  7. (선택 사항) 사용자 기능의 데이터 세트가 있는 경우 사용자 기능에 연결합니다.

    사용자 기능 데이터 세트의 첫 번째 열에는 사용자 ID가 포함되어야 합니다. 나머지 열에는 성별, 기본 설정, 위치 등 사용자의 특징을 지정하는 값이 포함되어야 합니다.

    등급이 지정된 항목을 가진 사용자의 기능은 학습 중에 이미 학습되었으므로 매치박스 추천 점수 매기 기에서 무시됩니다. 따라서 콜드 시작 사용자 또는 항목의 등급을 지정하지 않은 사용자만 포함하도록 데이터 세트를 미리 필터링합니다.

    경고

    사용자 기능을 사용하지 않고 모델을 학습한 경우 점수 매기기 중에 사용자 기능을 적용할 수 없습니다.

  8. (선택 사항) 항목 기능의 데이터 세트가 있는 경우 항목 기능에 연결합니다.

    항목 기능 데이터 세트의 첫 번째 열에는 항목 식별자가 포함되어야 합니다. 나머지 열에는 항목의 특징을 지정하는 값이 포함되어야 합니다.

    등급 항목의 기능은 학습 중에 이미 학습되었으므로 매치박스 추천 점수 매기 기에서 무시됩니다. 따라서 점수 매기기 데이터 세트를 콜드 시작 항목 또는 사용자가 평가하지 않은 항목으로 제한할 수 있습니다.

    경고

    항목 기능을 사용하지 않고 모델을 학습한 경우 점수를 매길 때 항목 기능을 사용하지 마십시오.

  9. 실험을 실행합니다.

매치박스 추천 점수 매기기에서 반환된 점수 매기기 데이터 세트는 입력 데이터 세트의 각 사용자와 관련된 사용자를 나열합니다.

입력 데이터 세트에 지정된 각 사용자에 대해 결과 데이터 세트에는 관련 사용자 집합이 포함됩니다.

  • 첫 번째 열에는 대상 사용자의 식별자(입력으로 제공된 사용자)가 포함됩니다.

  • 관련 사용자의 식별자를 포함하는 추가 열이 생성됩니다. 추가 열 수는 옵션에서 설정한 값, 사용자에 대해 찾을 관련 사용자의 최대 수에 따라 달라집니다.

    관련 사용자는 대상 사용자와의 관계 강도에 따라 정렬되며, 열에서 가장 강력한 관련 사용자인 관련 사용자 1이 있습니다.

관련 항목 찾기

관련 항목을 예측하여 이미 등급이 지정된 항목을 기반으로 사용자에 대한 권장 사항을 생성할 수 있습니다.

  1. 학습된 권장 사항 모델을 실험에 추가하고 학습된 Matchbox 추천에 연결합니다. 매치박스 추천 학습을 사용하여 모델을 만들어야 합니다.

  2. 추천 예측 종류: 관련 항목을 선택합니다.

  3. 예측을 생성할 사용자가 포함된 데이터 세트를 커넥트. 이 데이터 세트의 형식은 프로덕션 모드 또는 평가 모드에서 채점 모듈을 사용하는지 여부에 따라 달라집니다.

    • 모든 항목에서 사용하는 프로덕션 모드

      점수를 매길 데이터 세트는 관련 사용자를 찾으려는 항목으로 구성되어야 합니다.

      첫 번째 열과 유일한 열에는 항목 식별자가 포함되어야 합니다. 다른 열이 포함된 경우 오류가 발생합니다. 데이터 세트 모듈에서 열 선택 모듈을 사용하여 불필요한 열을 제거합니다.

    • 평가 모드, 정격 항목 사용(모델 평가용)

      채점할 데이터 세트는 사용자-항목 쌍을 포함하는 2-3개의 열로 구성되어야 합니다. 첫 번째 열에는 사용자 식별자가 포함되어야 합니다. 두 번째 열에는 항목 식별자가 포함되어야 합니다.

      데이터 세트에는 세 번째 등급 열(열 2의 항목에 대한 열 1의 사용자가 포함)이 포함될 수 있지만 등급 열은 무시됩니다.

  4. 항목에 대해 찾을 최대 관련 항목 수: 각 항목>에 대해 원하는 최대 예측 수를 나타내는 숫자를 입력합니다.

    기본값은 5입니다. 즉, 최대 5개의 관련 항목을 반환할 수 있지만 5개 미만이 있을 수 있습니다.

  5. 평가 모드(등급이 지정된 항목의 사용자)를 사용하는 경우 다음 추가 매개 변수를 구성합니다.

    • 쿼리 항목 및 관련 항목이 공통적으로 평가되어야 하는 최소 항목 수: 이 값은 권장 사항에 대한 임계값을 설정합니다. 입력한 숫자는 대상 사용자 및 일부 관련 사용자가 평가한 최소 항목 수를 나타냅니다. 기본값은 2입니다. 즉, 적어도 대상 사용자와 관련 사용자가 두 개의 항목을 평가해야 합니다.

    • 단일 항목에 대한 관련 항목 풀의 최소 크기: 이 값은 권장 사항을 만드는 데 필요한 유사한 항목의 최소 수를 제어합니다. 기본적으로 값은 2입니다. 즉, 동일한 사용자가 등급을 매긴 덕분으로 관련된 항목이 두 개 정도 있는 경우 관련 항목을 고려하고 권장 사항을 생성할 수 있습니다.

  6. (선택 사항) 사용자 기능의 데이터 세트가 있는 경우 사용자 기능에 연결합니다.

    사용자 기능 데이터 세트의 첫 번째 열에는 사용자 ID가 포함되어야 합니다. 나머지 열에는 성별, 기본 설정, 위치 등 사용자의 특징을 지정하는 값이 포함되어야 합니다.

    평가 항목을 가진 사용자의 기능은 학습 중에 이미 학습되었으므로 매치박스 추천 점수 매기기에서 무시됩니다. 따라서 콜드 시작 사용자 또는 항목의 등급을 지정하지 않은 사용자만 포함하도록 데이터 세트를 미리 필터링합니다.

    경고

    모델에서 사용자 기능을 사용하지 않고 학습된 경우 점수 매기기 중에 사용자 기능을 적용할 수 없습니다.

  7. (선택 사항) 항목 기능의 데이터 세트가 있는 경우 항목 기능에 연결할 수 있습니다.

    항목 기능 데이터 세트의 첫 번째 열에는 항목 식별자가 포함되어야 합니다. 나머지 열에는 항목의 특징을 지정하는 값이 포함되어야 합니다.

    평가 항목의 기능은 점수 매치박스 추천에서 무시됩니다. 이러한 기능은 학습 중에 이미 학습되었기 때문입니다. 따라서 점수 매기기 데이터 세트를 콜드 스타트 항목 또는 사용자가 평가하지 않은 항목으로 제한할 수 있습니다.

    경고

    항목 기능을 사용하지 않고 모델을 학습한 경우 점수를 매길 때 항목 기능을 사용하지 마십시오.

  8. (선택 사항) 예측 실험에서는 학습 데이터 세트라는 다섯 번째 입력 포트를 사용하여 예측 결과에서 모델 학습 데이터에 포함된 기존 사용자를 제거할 수 있습니다.

    이 필터를 적용하려면 원래 학습 데이터 세트를 입력 포트에 연결합니다.

  9. 실험을 실행합니다.

매치박스 추천 점수 매기기에서 반환된 점수 매기기 데이터 세트는 입력 데이터 세트의 각 항목에 대한 관련 항목을 나열합니다.

  • 첫 번째 열에는 대상 항목(입력으로 제공된 항목)의 식별자가 포함됩니다.

  • 관련 항목의 식별자를 포함하는 추가 열이 생성됩니다. 추가 열 수는 옵션에서 설정한 값, 항목에 대해 찾을 최대 관련 항목 수에 따라 달라집니다.

    관련 항목은 대상 항목에 대한 관계 강도에 따라 정렬되며, 열에서 가장 강력한 관련 항목인 관련 항목 1이 있습니다.

기술 정보

이 섹션에는 추천을 사용하여 예측을 만드는 방법에 대한 몇 가지 일반적인 질문에 대한 답변이 포함되어 있습니다.

콜드 시작 사용자 및 추천

일반적으로 권장 사항을 만들기 위해 매치박스 추천 점수 매기기 모듈에는 사용자 ID를 포함하여 모델을 학습할 때 사용한 것과 동일한 입력이 필요합니다. 이는 학습 중에 이 사용자에 대한 정보를 알 수 있는지 여부를 알고리즘이 알고 있어야 하기 때문입니다.

그러나 새 사용자의 경우에는 사용자 ID는 없고 연령, 성별 등의 일부 사용자 특성만 있을 수도 있습니다.

이 경우에도 시스템의 새 사용자를 콜드 시작 사용자로 처리하여 해당 사용자에 대해 추천을 작성할 수 있습니다. 이러한 사용자의 경우 추천 알고리즘은 이전 기록이나 이전 등급을 사용하지 않으며 사용자 특성만 사용합니다.

예측 목적의 경우 콜드 시작 사용자는 ID가 학습에 사용되지 않은 사용자로 정의됩니다. ID가 학습에 사용된 ID와 일치하지 않도록 하기 위해 새 식별자를 만들 수 있습니다. 예를 들어 지정된 범위 내에서 임의의 ID를 생성하거나 콜드 시작 사용자에게 일련의 ID를 미리 할당할 수 있습니다.

그러나 사용자 특성 벡터와 같은 공동 작업 필터링 데이터가 없으면 분류 또는 회귀 학습자를 사용하는 것이 좋습니다.

Matchbox 추천기의 프로덕션 사용

Matchbox 추천을 실험한 다음 모델을 프로덕션으로 이동한 경우 평가 모드 및 프로덕션 모드에서 추천을 사용할 때 다음과 같은 주요 차이점을 알고 있어야 합니다.

  • 평가 모드에서는 기본적으로 테스트 집합의 실제 정보와 대조하여 확인할 수 있는 예측이 필요합니다. 따라서 추천을 평가할 때는 테스트 집합에서 등급이 지정된 항목만 예측해야 합니다. 이 경우 예측 가능한 값이 제한됩니다.

    그러나 모델을 실제로 운영할 때는 보통 예측 모드를 변경하여 최적의 예측 결과를 얻기 위해 가능한 모든 항목을 기준으로 추천을 수행합니다. 이러한 많은 예측의 경우 해당하는 실제 정보가 없으므로 추천의 정확도를 실험에서와 동일한 방식으로 확인할 수 없습니다.

  • 프로덕션에서 사용자 ID를 제공하지 않고 특성 벡터만 제공하면, 가능한 모든 사용자에 대한 모든 추천 목록이 응답으로 제공될 수 있습니다. 따라서 사용자 ID를 제공해야 합니다.

    반환되는 추천 수를 제한하려는 경우 사용자당 반환되는 최대 항목 수를 지정할 수도 있습니다.

  • 이전에 등급이 지정되지 않은 항목에 대해서만 예측을 생성할 수는 없습니다. 이것은 의도적인 것입니다.

    그 이유는 등급이 지정되지 않은 항목만 추천하려면 추천자가 전체 학습 데이터 집합을 모델과 함께 저장해야 하므로 스토리지 사용이 증가하기 때문입니다.

    사용자가 확인하지 않은 항목만 추천하려는 경우 추천할 항목을 더 요청하고 등급이 지정된 항목을 수동으로 필터링할 수 있습니다.

추천자의 지속적인 업데이트

권장 사항 모델의 온라인 업데이트(또는 지속적인 학습)는 현재 Machine Learning 지원되지 않습니다. 권장 사항에 대한 사용자 응답을 캡처하고 모델 개선에 사용하려는 경우 전체 모델을 주기적으로 다시 학습하는 것이 좋습니다. 증분 학습은 불가능하지만 가장 최근 데이터를 사용하는 동안 데이터 볼륨이 최소화되도록 학습 데이터에 슬라이딩 윈도우를 적용할 수 있습니다.

예상 입력

Name 유형 설명
학습된 Matchbox 추천입니다. ILearner 학습된 Matchbox 추천입니다.
점수를 매길 데이터 집합입니다. 데이터 테이블 점수를 매길 데이터 집합입니다.
사용자 기능 데이터 테이블 사용자를 설명하는 기능이 포함된 데이터 집합입니다.

이 데이터는 선택 사항임
항목 기능 데이터 테이블 항목을 설명하는 기능이 포함된 데이터 집합입니다.

이 데이터는 선택 사항임

모듈 매개 변수

Name 범위 Type 기본값 설명
추천 예측 종류 목록 예측 종류입니다. 항목 추천 추천에서 출력하는 예측의 유형을 지정합니다.
추천 항목 선택 목록 항목 선택 등급이 지정된 항목(모델 평가의 경우) 추천 원본 항목 집합을 선택합니다.
관련 사용자 선택 목록 사용자를 선택합니다. 항목 등급을 지정한 사용자(모델 평가의 경우) 관련 항목을 찾을 때 사용할 사용자 집합을 선택합니다.
관련 항목 선택 목록 [항목 선택 등급이 지정된 항목(모델 평가의 경우) 관련 항목을 찾을 때 사용할 항목 집합을 선택합니다.

출력

Name 유형 설명
점수가 매겨진 데이터 집합입니다. 데이터 테이블 점수가 매겨진 데이터 집합입니다.

예외

예외 설명
오류 0022 입력 데이터 세트에서 선택한 열의 수가 필요한 수와 같지 않으면 예외가 발생합니다.
오류 0036 지정된 사용자나 항목에 대해 여러 개의 기능 벡터가 제공된 경우 예외가 발생합니다.
오류 0013 모듈로 전달된 학습자의 형식이 올바르지 않으면 예외가 발생합니다.
오류 0035 지정된 사용자나 항목에 대해 기능을 제공하지 않으면 예외가 발생합니다.
오류 0053 Matchbox 추천을 위한 사용자 기능이나 항목이 없으면 예외가 발생합니다.
오류 0003 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다.

Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.

API 예외 목록은 MACHINE LEARNING REST API 오류 코드를 참조하세요.

참고 항목

Matchbox 추천 학습
추천 평가
점수