Cognitive Services の Text Analytics API 日本語対応強化
Text Analytics API、日本語対応機能強化
Cognitive Services の Text Analytics API の対応言語が拡大、日本語で利用できる機能が増えました。
from Cortana Intelligence and Machine Learning Blog > Text Analytics API Now Available in Multiple Languages
Text Analytics API は文章解析を行う API で、文章の言語判定、キーフレーズやトピックの抽出、ネガポジ (Sentiment) 分析などを行うことができます。
Microsoft Cognitive Services > Text Analytics API
今回の機能拡大により、日本語文章のキーフレーズ抽出ができるようになりました。こちら Text Analytics API のデモサイト↓で簡単に試すことができます。
https://text-analytics-demo.azurewebsites.net/
文章を入力して [Analyze!] をクリックすると、分析結果が表示されます。黄色に表示されるのが抽出されたキーフレーズです。
Text Analytics API の使い方
言語判定、キーフレーズ抽出、ネガポジ分析はそれぞれ Request URL が異なります。
//言語判定
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/languages
//キーフレーズ抽出
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases
//ネガポジ分析
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/sentiment
言語判定
まず最初に言語判定を行います。複数のセンテンスを一度に送信できます (→ idで判別)。
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/languages HTTP/1.1
Content-Type: application/json
Host: westus.api.cognitive.microsoft.com
Ocp-Apim-Subscription-Key: ••••••••••••••••••••••••••••••••
{
"documents": [
{
"id": "1",
"text": "今日の天気は雨のち晴れです。"
}
]
}
判別された言語と確度スコアが 0~1(→0~100%) で表示されます。
Transfer-Encoding: chunked
x-aml-ta-request-id: ••••••••••••••••••••••••••••••••
X-Content-Type-Options: nosniff
Date: Thu, 23 Jun 2016 ••:••:•• GMT
Content-Type: application/json; charset=utf-8
{
"documents": [
{
"id": "1",
"detectedLanguages": [
{
"name": "Japanese",
"iso6391Name": "ja",
"score": 1.0
}
]
}
],
"errors": []
}
キーフレーズ抽出
キーフレーズ抽出では、パラメーターとして言語を指定する必要があります。
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases HTTP/1.1
Content-Type: application/json
Host: westus.api.cognitive.microsoft.com
Ocp-Apim-Subscription-Key: ••••••••••••••••••••••••••••••••
{
"documents": [
{
"language": "ja",
"id": "1",
"text": "今日の天気は雨のち晴れです。"
}
]
}
抽出されたキーフレーズが返されます。
Transfer-Encoding: chunked
x-aml-ta-request-id: ••••••••••••••••••••••••••••••••
X-Content-Type-Options: nosniff
Date: Thu, 23 Jun 2016 ••:••:•• GMT
Content-Type: application/json; charset=utf-8
{
"documents": [
{
"keyPhrases": [
"天気",
"晴れ"
],
"id": "1"
}
],
"errors": []
}
Cognitive Service API Reference
以上のような API のテストは、Cognitive Services API Reference (Text Analytics) が便利です。Request parameter, header, body を生成でき、そのまま Send したときの Response を画面上で確認できます。