TextCatalog.ProduceWordBags 메서드
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
오버로드
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
WordBagEstimator에 지정된 |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
WordBagEstimator에 지정된 |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
WordBagEstimator에 지정된 |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
WordBagEstimator에 지정된 inputColumnName
열을 라는 outputColumnName
새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
매개 변수
- catalog
- TransformsCatalog.TextTransforms
변환의 카탈로그입니다.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
데이터를 받을 열의 이름입니다. 사전에 저장할 최대 n그램 수입니다.용어/빈도 쌍을 구분하는 데 사용되는 구분 기호입니다.항을 빈도와 구분하는 데 사용되는 구분 기호입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.
- maximumNgramsCount
- Int32
반환
설명
WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.
적용 대상
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
WordBagEstimator에 지정된 inputColumnName
열을 라는 outputColumnName
새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
매개 변수
- catalog
- TransformsCatalog.TextTransforms
변환의 카탈로그입니다.
- inputColumnName
- String
데이터를 받을 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.
- ngramLength
- Int32
Ngram 길이입니다.
- skipLength
- Int32
n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.
- useAllLengths
- Boolean
모든 n-gram 길이를 포함할지 아니면 만 ngramLength
ngramLength
포함할지 여부입니다.
- maximumNgramsCount
- Int32
사전에 저장할 최대 n그램 수입니다.
단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.
반환
설명
WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.
적용 대상
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
WordBagEstimator에 지정된 inputColumnNames
여러 열을 라는 outputColumnName
새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
매개 변수
- catalog
- TransformsCatalog.TextTransforms
변환의 카탈로그입니다.
- inputColumnNames
- String[]
데이터를 가져와야 하는 여러 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.
- ngramLength
- Int32
Ngram 길이입니다.
- skipLength
- Int32
n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.
- useAllLengths
- Boolean
모든 n-gram 길이를 포함할지 아니면 만 ngramLength
ngramLength
포함할지 여부입니다.
- maximumNgramsCount
- Int32
사전에 저장할 최대 n그램 수입니다.
단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.
반환
설명
WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.