Umiejętność poznawcza łączenia jednostek (wersja 3)
Umiejętność entity linking (wersja 3) zwraca listę rozpoznanych jednostek z linkami do artykułów w dobrze znanym baza wiedzy (Wikipedia).
Uwaga
Ta umiejętność jest powiązana z modelami uczenia maszynowego entity linking w języku AI platformy Azure i wymaga rozliczanego zasobu dla transakcji, które przekraczają 20 dokumentów na indeksator dziennie. Wykonanie wbudowanych umiejętności jest naliczane za istniejące usługi Azure AI z płatnością zgodnie z rzeczywistym użyciem.
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
Limity danych
Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Length
wartość . Jeśli musisz podzielić dane przed wysłaniem ich do umiejętności EntityLinking, rozważ użycie umiejętności dzielenia tekstu. Jeśli używasz umiejętności dzielenia tekstu, ustaw długość strony na 5000, aby uzyskać najlepszą wydajność.
Parametry umiejętności
Nazwy parametrów są uwzględniane w wielkości liter i są opcjonalne.
Nazwa parametru | opis |
---|---|
defaultLanguageCode |
Kod języka tekstu wejściowego. Jeśli nie określono domyślnego kodu języka, język angielski (en) będzie używany jako domyślny kod języka. Zobacz pełną listę obsługiwanych języków. |
minimumPrecision |
Wartość z zakresu od 0 do 1. Jeśli wynik ufności (w danych wyjściowych entities ) jest niższy niż ta wartość, jednostka nie jest zwracana. Wartość domyślna to 0. |
modelVersion |
(Opcjonalnie) Określa wersję modelu do użycia podczas wywoływania łączenia jednostek. Jeśli nie zostanie określona, będzie ona domyślnie dostępna do najnowszej. Zalecamy, aby nie określać tej wartości, chyba że jest to konieczne. |
Dane wejściowe umiejętności
Nazwa danych wejściowych | opis |
---|---|
languageCode |
Ciąg wskazujący język rekordów. Jeśli ten parametr nie zostanie określony, domyślny kod języka będzie używany do analizowania rekordów. Zobacz pełną listę obsługiwanych języków. |
text |
Tekst do przeanalizowania. |
Dane wyjściowe umiejętności
Nazwa danych wyjściowych | opis |
---|---|
entities |
Tablica typów złożonych, które zawierają następujące pola:
|
Przykładowa definicja
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
Przykładowe dane wejściowe
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
Przykładowe dane wyjściowe
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
Przesunięcia zwracane dla jednostek w danych wyjściowych tej umiejętności są zwracane bezpośrednio z interfejsów API usługi językowej, co oznacza, że jeśli używasz ich do indeksowania do oryginalnego ciągu, należy użyć klasy StringInfo na platformie .NET, aby wyodrębnić poprawną zawartość. Aby uzyskać więcej informacji, zobacz Obsługa wielojęzycznych i emoji w temacie Funkcje usługi językowej.
Przypadki ostrzegawcze
Jeśli kod języka dokumentu nie jest obsługiwany, zwracane jest ostrzeżenie i nie są wyodrębniane żadne jednostki.