次の方法で共有


TokenizerResult クラス

定義

Encoding はトークナイザーの出力を表します。

public sealed class TokenizerResult
type TokenizerResult = class
Public NotInheritable Class TokenizerResult
継承
TokenizerResult

コンストラクター

TokenizerResult(String, String, IReadOnlyList<Split>, Boolean)

TokenizerResult オブジェクトの新しいオブジェクトを作成します。

プロパティ

Ids

トークン ID の一覧を取得します。 Id は、言語モデルへの主な入力です。 これらはトークン インデックスであり、LM が理解する数値表現です。

NormalizedString

元の文字列の正規化された形式を取得します。

Offsets

オフセットの一覧を取得します。 これらのオフセットでは、入力文字列をスライスし、対応するトークンを生成する原因となった元の部分を取得します。

OffsetsMappedToOriginalString

元の文字列の正規化された形式を取得します。

OriginalString

元のトークン化された文字列を取得します。

Tokens

生成されたトークンを取得します。 これらは ID の文字列表現です。

適用対象