Brug færdigbygget tekstanalyse i Fabric med REST API og SynapseML (prøveversion)
Vigtig
Denne funktion er i prøveversion.
Text Analytics er en Azure AI-tjenester, der giver dig mulighed for at udføre tekstudvinding og tekstanalyse med NLP-funktioner (Natural Language Processing).
I dette selvstudium kan du se, hvordan du bruger tekstanalyse i Fabric med RESTful API til:
- Registrer synspunktsmærkater på sætnings- eller dokumentniveau.
- Identificer sproget for et bestemt tekstinput.
- Udtræk nøglefaser fra en tekst.
- Identificer forskellige enheder i tekst, og kategoriser dem i foruddefinerede klasser eller typer.
Forudsætninger
# Get workload endpoints and access token
from synapse.ml.mlflow import get_mlflow_env_config
import json
mlflow_env_configs = get_mlflow_env_config()
access_token = access_token = mlflow_env_configs.driver_aad_token
prebuilt_AI_base_host = mlflow_env_configs.workload_endpoint + "cognitive/textanalytics/"
print("Workload endpoint for AI service: \n" + prebuilt_AI_base_host)
service_url = prebuilt_AI_base_host + "language/:analyze-text?api-version=2022-05-01"
# Make a RESful request to AI service
post_headers = {
"Content-Type" : "application/json",
"Authorization" : "Bearer {}".format(access_token)
}
def printresponse(response):
print(f"HTTP {response.status_code}")
if response.status_code == 200:
try:
result = response.json()
print(json.dumps(result, indent=2, ensure_ascii=False))
except:
print(f"pasre error {response.content}")
else:
print(response.headers)
print(f"error message: {response.content}")
Synspunktsanalyse
Funktionen Synspunktsanalyse gør det muligt at registrere synspunktsmærkater (f.eks. "negativ", "neutral" og "positiv") og tillidsscore på sætnings- og dokumentniveau. Denne funktion returnerer også tillidsscorer mellem 0 og 1 for hvert dokument og sætninger i det for positive, neutrale og negative synspunkter. Se understøttelse af synspunktsanalyse og meningsmining for listen over aktiverede sprog.
import requests
from pprint import pprint
import uuid
post_body = {
"kind": "SentimentAnalysis",
"parameters": {
"modelVersion": "latest",
"opinionMining": "True"
},
"analysisInput":{
"documents":[
{
"id":"1",
"language":"en",
"text": "The food and service were unacceptable. The concierge was nice, however."
}
]
}
}
post_headers["x-ms-workload-resource-moniker"] = str(uuid.uuid1())
response = requests.post(service_url, json=post_body, headers=post_headers)
# Output all information of the request process
printresponse(response)
Udgang
HTTP 200
{
"kind": "SentimentAnalysisResults",
"results": {
"documents": [
{
"id": "1",
"sentiment": "mixed",
"confidenceScores": {
"positive": 0.43,
"neutral": 0.04,
"negative": 0.53
},
"sentences": [
{
"sentiment": "negative",
"confidenceScores": {
"positive": 0.0,
"neutral": 0.01,
"negative": 0.99
},
"offset": 0,
"length": 40,
"text": "The food and service were unacceptable. ",
"targets": [
{
"sentiment": "negative",
"confidenceScores": {
"positive": 0.01,
"negative": 0.99
},
"offset": 4,
"length": 4,
"text": "food",
"relations": [
{
"relationType": "assessment",
"ref": "#/documents/0/sentences/0/assessments/0"
}
]
},
{
"sentiment": "negative",
"confidenceScores": {
"positive": 0.01,
"negative": 0.99
},
"offset": 13,
"length": 7,
"text": "service",
"relations": [
{
"relationType": "assessment",
"ref": "#/documents/0/sentences/0/assessments/0"
}
]
}
],
"assessments": [
{
"sentiment": "negative",
"confidenceScores": {
"positive": 0.01,
"negative": 0.99
},
"offset": 26,
"length": 12,
"text": "unacceptable",
"isNegated": false
}
]
},
{
"sentiment": "positive",
"confidenceScores": {
"positive": 0.86,
"neutral": 0.08,
"negative": 0.07
},
"offset": 40,
"length": 32,
"text": "The concierge was nice, however.",
"targets": [
{
"sentiment": "positive",
"confidenceScores": {
"positive": 1.0,
"negative": 0.0
},
"offset": 44,
"length": 9,
"text": "concierge",
"relations": [
{
"relationType": "assessment",
"ref": "#/documents/0/sentences/1/assessments/0"
}
]
}
],
"assessments": [
{
"sentiment": "positive",
"confidenceScores": {
"positive": 1.0,
"negative": 0.0
},
"offset": 58,
"length": 4,
"text": "nice",
"isNegated": false
}
]
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2022-11-01"
}
}
Sprogregistrering
Sprogregistrering evaluerer tekstinput for hvert dokument og returnerer sprog-id'er med en score, der angiver analysens styrke. Denne funktion er nyttig for indholdslagre, der indsamler vilkårlig tekst, hvor sproget er ukendt. Se Understøttede sprog for at få til registrering af sprog for at få en liste over aktiverede sprog.
post_body = {
"kind": "LanguageDetection",
"parameters": {
"modelVersion": "latest"
},
"analysisInput":{
"documents":[
{
"id":"1",
"text": "This is a document written in English."
}
]
}
}
post_headers["x-ms-workload-resource-moniker"] = str(uuid.uuid1())
response = requests.post(service_url, json=post_body, headers=post_headers)
# Output all information of the request process
printresponse(response)
Udgang
HTTP 200
{
"kind": "LanguageDetectionResults",
"results": {
"documents": [
{
"id": "1",
"detectedLanguage": {
"name": "English",
"iso6391Name": "en",
"confidenceScore": 0.99
},
"warnings": []
}
],
"errors": [],
"modelVersion": "2022-10-01"
}
}
Udtræk af nøgleudtryk
Udtrækning af nøgleudtryk evaluerer ustruktureret tekst og returnerer en liste over nøgleudtryk. Denne funktion er nyttig, hvis du har brug for hurtigt at identificere hovedpunkterne i en samling dokumenter. Se Understøttede sprog for at få oplysninger om udtræk af nøglesætninger for at få vist en liste over aktiverede sprog.
post_body = {
"kind": "KeyPhraseExtraction",
"parameters": {
"modelVersion": "latest"
},
"analysisInput":{
"documents":[
{
"id":"1",
"language":"en",
"text": "Dr. Smith has a very modern medical office, and she has great staff."
}
]
}
}
post_headers["x-ms-workload-resource-moniker"] = str(uuid.uuid1())
response = requests.post(service_url, json=post_body, headers=post_headers)
# Output all information of the request process
printresponse(response)
Udgang
HTTP 200
{
"kind": "KeyPhraseExtractionResults",
"results": {
"documents": [
{
"id": "1",
"keyPhrases": [
"modern medical office",
"Dr. Smith",
"great staff"
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2022-10-01"
}
}
Navngivet enhedsgenkendelse (NER)
Ner (Named Entity Recognition) er muligheden for at identificere forskellige enheder i tekst og kategorisere dem i foruddefinerede klasser eller typer, f.eks.: person, placering, begivenhed, produkt og organisation. Se NER-sprogunderstøttelse for at få vist en liste over aktiverede sprog.
post_body = {
"kind": "EntityRecognition",
"parameters": {
"modelVersion": "latest"
},
"analysisInput":{
"documents":[
{
"id":"1",
"language": "en",
"text": "I had a wonderful trip to Seattle last week."
}
]
}
}
post_headers["x-ms-workload-resource-moniker"] = str(uuid.uuid1())
response = requests.post(service_url, json=post_body, headers=post_headers)
# Output all information of the request process
printresponse(response)
Udgang
HTTP 200
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "trip",
"category": "Event",
"offset": 18,
"length": 4,
"confidenceScore": 0.74
},
{
"text": "Seattle",
"category": "Location",
"subcategory": "GPE",
"offset": 26,
"length": 7,
"confidenceScore": 1.0
},
{
"text": "last week",
"category": "DateTime",
"subcategory": "DateRange",
"offset": 34,
"length": 9,
"confidenceScore": 0.8
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2021-06-01"
}
}
Objektlinkning
Der er ingen trin til REST API i dette afsnit.
Relateret indhold
- Brug færdigbygget tekstanalyse i Fabric med SynapseML-
- Brug færdigbygget Azure AI Translator i Fabric med REST API-
- Brug færdigbygget Azure AI Translator i Fabric med SynapseML-
- Brug færdigbygget Azure OpenAI i Fabric med REST API-
- Brug færdigbygget Azure OpenAI i Fabric med Python SDK-
- Brug færdigbygget Azure OpenAI i Fabric med SynapseML-