ARFF로 변환
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
데이터 입력을 Weka 도구 집합에서 사용하는 특성 관계 파일 형식으로 변환
범주: 데이터 형식 변환
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 ARFF로 변환 모듈을 사용하여 데이터 세트를 변환하고 Weka 도구 집합에서 사용하는 특성 관계 파일 형식을 반환하는 방법을 설명합니다. 이 형식을 ARFF라고 합니다.
Weka의 ARFF 데이터 사양은 데이터 전처리, 분류 및 기능 선택을 포함하여 여러 기계 학습 작업을 지원합니다. 이 형식으로 데이터는 엔터티 및 해당 특성별로 구성되며 단일 텍스트 파일에 포함됩니다. 기술 노트 섹션에서 Weka 파일 형식의 세부 정보를 찾을 수 있습니다.
일반적으로 weka 파일 형식으로 변환하려면 Machine Learning 및 Weka를 모두 사용하고 학습 데이터를 앞뒤로 이동하려는 경우에만 필요합니다.
Weka 도구 집합에 대한 자세한 내용은 위키백과 문서인 Weka(기계 학습)를 참조하세요.
경고
Azure 저장소의 기존 ARFF 파일을 덮어쓸 수 없습니다.
ARFF로 변환을 사용하는 방법
ARFF로 변환 모듈을 실험에 추가합니다. 이 모듈은 Machine Learning Studio(클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.
이를 데이터 세트를 출력하는 모듈에 연결합니다.
실험을 실행하거나 ARFF로 변환 모듈을 클릭한 다음 [실행]을 클릭합니다.
결과
로컬 폴더에 데이터 복사본을 만들려면 ARFF로 변환의 출력을 두 번 클릭하고 다운로드 옵션을 선택합니다.
폴더를 지정하지 않으면 기본 파일 이름이 적용되고 파일이 로컬 다운로드 라이브러리에 저장 됩니다 .
참고
이 모듈은 Python 또는 R 코드로 내보내기를 지원하지 않습니다.
예
Azure AI 갤러리에는 이 형식과 관련된 예제가 없습니다. 그러나 이러한 실험은 다른 형식 변환 형식을 보여 줍니다.
색 기반 이미지 압축: 분석의 각 부분에 사용되는 데이터 세트를 재현성을 위해 파일로 내보내고 다른 분석 플랫폼에서 사용합니다.
이진 분류에 대한 교차 유효성 검사 샘플: Excel 같은 도구를 사용하여 여러 모델의 결과를 비교할 수 있도록 교차 유효성 검사 결과를 파일로 내보냅니다.
기술 정보
이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.
ARFF 형식의 예
이 섹션에서는 ARFF로 변환할 때 일반적인 데이터 세트가 어떻게 표시되는지 예제를 제공합니다.
일반적으로 ARFF 데이터 파일은 데이터 원본 및 스키마를 정의하는 헤더 와 실제 엔터티 및 해당 특성을 포함하는 데이터 섹션의 두 섹션으로 구성됩니다.
ARFF 헤더
ARFF 파일의 헤더는 특성 목록(열)과 해당 데이터 형식을 정의합니다. 헤더는 데이터 원본 또는 기타 참고 사항을 설명하는 여러 주석 줄을 포함할 수도 있습니다.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
팁
변환하는 데이터 세트에 열 이름이 없는 경우 ARFF로 변환하기 전에 메타데이터 편집 모듈을 사용하여 열 이름을 추가합니다.
ARFF 데이터
데이터 섹션은 쉼표로 구분된 값으로 구성되며 열 머리글이 없는 CSV 파일과 매우 유사합니다.
@DATA 5.1,3.5,1.4,0.2,0
이 파일 형식에 대한 자세한 내용은 Weka Wiki 페이지: ARFF(개발자 버전)를 참조하세요.
현재 ARFF 버전
Machine Learning Studio(클래식)는 ARFF 3.0 형식을 사용하여 ARFF 파일을 저장합니다.
예상 입력
Name | 유형 | 설명 |
---|---|---|
데이터 세트 | 데이터 테이블 | 입력 데이터 세트 |
출력
Name | 유형 | 설명 |
---|---|---|
결과 데이터 집합 | Arff | 출력 데이터 세트 |