通話とオンライン会議のボット
ボットは、リアルタイムの音声、ビデオ、画面共有を使用して、Teams 通話や会議と対話できます。 通話とオンライン会議用の Microsoft Graph API を使用して、Teams アプリは音声とビデオを使用してユーザーと対話し、エクスペリエンスを強化しました。 これらの API を使用すると、次の新機能を追加できます:
- 自動音声応答 (IVR)。
- 通話コントロール。
- デスクトップやアプリの共有を含む、リアルタイムのオーディオとビデオのストリームを利用しましょう。
Teams アプリでこれらの Graph API を使用するには、ボットを作成し、いくつかの追加情報とアクセス許可を指定します。
さらに、リアルタイム メディア プラットフォームを使用すると、ボットはリアルタイムの音声、ビデオ、画面共有を使用して Teams 通話や会議と対話できます。 音声通話やビデオ通話、オンライン会議に同席するボットは、ボットの登録に使用される少数の追加機能を伴う通常の Microsoft Teams ボットです。
さらに 2 つの設定supportsCalling
とsupportsVideo
、ボットの Microsoft アプリ ID に対する Graph アクセス許可、テナント管理者の同意を含む Teams アプリ マニフェストを使用すると、ボットを登録できます。 Teams 通話と会議のボットを登録する際に、Webhook URL がメンションされ、これはボットへのすべての着信通話の Webhook エンドポイントです。 アプリケーションでホストされるメディア ボットでは、オーディオ およびビデオ メディア ストリームにアクセスするために Microsoft.Graph.Communications.Calls.Media .NET ライブラリが必要で、ボットは Windows Server マシンまたは Azure の Windows Server ゲスト オペレーティング システム (OS) にデプロイする必要があります。 Teams 上のボットでは、オーディオとビデオのコンテンツに対して特定のメディア形式のセットのみがサポートされます。
通話とオンライン会議ボットの関数
ボットは、通話とオンライン会議のために Microsoft Graph API を呼び出すことによって、次の関数を実行できます。
機能 | 関数 |
---|---|
コア機能 | • 2 人のユーザー間で 1 対 1 の呼び出しを開始します。 • 2 人以上のユーザー (最大 350 ユーザー) でグループ通話を開始します。 • 2 人のユーザーを含む 1 対 1 の通話を、2 人以上のユーザーを含むグループ通話にアップグレードします。 • 開始後にグループ呼び出しに参加します。 • ボイス オーバー インターネット プロトコル (VoIP) 参加者を招待して、進行中のグループ通話に参加します。 |
通話中の制御 | • ビデオのオン/オフを切り替えます。 • マイクをミュートまたはミュート解除します。 •カメラを切り替えます。 • 通話を保留にするか、ローカルで再開します。 •アクティブスピーカー。 •通話のためのスピーカーを選択します。 • 通話用のマイクを選択します。 • アイドル、初期メディア、接続、接続、保留、ロビー、切断など、参加者の状態を表示します。 • 通話の状態 (初期メディア、着信、接続、呼び出し、接続、保留、切断、切断など) を表示します。 • 参加者がミュート状態かどうかを表示します。 • 参加者が通話を終了した理由を表示します。 |
画面共有 | •アプリ内から画面全体を共有します。 • 特定のアプリを共有します (実行中のアプリの一覧から)。 • 開いているタブの一覧から Web ブラウザー タブを共有します。 •画面共有中にシステムオーディオを共有します。 • 参加者はリモート画面共有を表示できます。 |
ロスター | • 通話中に参加者を一覧表示します。 • 通話から参加者を削除します。 |
公衆交換電話網 (PSTN) | • PSTN 参加者と 1 対 1 の通話を行います。 • PSTN 参加者とグループ通話を行います。 • PSTN 参加者との 1 対 1 通話をグループ通話にアップグレードします。 • PSTN 参加者としてグループ通話からダイヤルアウトします。 • 初期メディアのサポート。 |
ここで、いくつかの主要な概念、専門用語、および規則を理解する必要があります。
専門用語集
次の主要な概念、用語、規則は、通話とオンライン会議ボットを使用してガイドします。
- 音声通話またはビデオ通話
- 通話の種類
- 信号
- 通話とオンライン会議
- リアルタイム メディア
音声通話またはビデオ通話
Teams での通話は、純粋に音声のみ、または音声とビデオにすることができます。 音声またはビデオ通話の代わりに、通話という用語が使用されます。
通話の種類
通話は、ユーザーとボットの間のピア ツー ピア、またはグループ通話内の 2 人以上のユーザーとボットの間のマルチパーティのいずれかです。
通話に必要なさまざまな通話タイプとアクセス許可を次に示します:
ユーザーは、ボットの支援でピア ツー ピア通話を開始したり、ボットを既存のマルチパーティ通話に招待したりできます。 マルチパーティ呼び出しは、Teams ユーザー インターフェイスではまだ有効になっていません。
注:
ボットに対するユーザーによる呼び出しは、Teams モバイル クライアントではサポートされていません。
ユーザーがボットとのピアツーピア呼び出しを開始するために、グラフのアクセス許可は必要ありません。 ボットがマルチパーティ通話に参加したり、ボットがユーザーとのピア ツー ピア通話を開始したりするには、ボットに追加のアクセス許可が必要です。
通話はピア ツー ピアとして開始し、最終的にはマルチパーティ通話になります。 ボットに適切なアクセス許可が与えられながら、ボットは他のユーザーを招待することでマルチパーティ通話を開始できます。 ボットにグループ呼び出しに参加するアクセス許可がない場合、参加者が別の参加者を呼び出しに追加した場合、ボットは通話から削除されます。
信号
着信と通話時通信の 2 種類の信号があります。 以下は信号のさまざまな機能です:
着信を受信するには、ボットの設定にエンドポイントを 1 つ入力します。 このエンドポイントは、着信が開始されたときに通知を受け取ります。 通話に応答したり、それを拒否したり、他のユーザーにリダイレクトしたりできます。
ボットが通話中の場合、ボットをミュートしたりそれを解除したり、ビデオやデスクトップ コンテンツを他の参加者と共有したり共有を停止したりするための API があります。
ボットは、参加者の一覧にアクセスし、新しい参加者を招待し、ミュートすることもできます。
通話とオンライン会議
Teams ユーザーの観点から見ると、計画外とスケジュールされた 2 種類のオンライン会議があります。 ボットの観点から見ると、両方のオンライン会議は同一です。 1 つのボットに対して、オンライン会議は参加者の組との間のマルチパーティ通話であり、会議の調整情報が含まれます。 会議の調整情報は、会議に関連付けられているbotId
、chatId
、joinUrl
、startTime
、またはendTime
などの会議のメタデータです。
リアルタイム メディア
ボットが通話またはオンライン会議に参加している場合は、音声ストリームとビデオ ストリームを処理する必要があります。 ユーザーが通話中に話したり、Web カメラで自分を表示したり、会議で画面を表示したりすると、ボットにオーディオストリームとビデオ ストリームとして表示されます。 ボットがしごく単純に何かを言いたい場合、 0 を押して対話型音声応答 (IVR) シナリオでオペレーター に到達するには、.WAV ファイルを再生する必要があります。 これらを総称して、メディアまたはリアルタイム メディアと呼ばれます。
リアルタイム メディアとは、以前に記録したオーディオやビデオの再生とは対照的に、メディアをリアルタイムで処理する必要があるシナリオを指します。 メディア ストリーム (リアルタイム メディア ストリーム) の処理は複雑です。 Microsoft は、これらのシナリオを処理し、負荷の重い従来のリアルタイム メディア処理の負担を可能な限り取り除くために、リアルタイム メディア プラットフォームを作成しました。 ボットが着信に応答するか、新規または既存の通話に参加する場合は、リアルタイム メディア プラットフォームにメディアの処理方法を伝える必要があります。 IVR アプリケーションを構築している場合は、高価なオーディオ処理を Microsoft にオフロードできます。 または、ボットでメディア ストリームへの直接のアクセスが必要な場合は、そのシナリオもサポートされます。 メディア処理には、次の 2 種類があります:
サービスでホストされるメディア: ボットは、通話のルーティングや Microsoft リアルタイム メディア プラットフォームへのオーディオ処理のオフロードなど、アプリケーション ワークフローの管理に重点を置きます。 サービスによりホストされるメディアを使用すると、ボットを実装しホストするためのさまざまなオプションが使用できるようになります。 サービスホスト型メディア ボットは、メディアをローカルで処理しないため、ステートレス サービスとして実装できます。 サービスホスト型メディア ボットでは、次の API を使用できます:
PlayPrompt
オーディオ クリップを再生するため。Record
オーディオ クリップを記録するため。SubscribeToTone
デュアル トーン周波数多重 (DTMF) トーンにサービス登録するため。たとえば、ユーザーがいつ 0 を押してオペレーターに到達したかを把握します。
アプリケーション ホスト型メディア: ボットがメディアに直接アクセスするには、特定の Graph アクセス許可が必要です。 ボットにアクセス許可が付与された後、リアルタイム メディア ライブラリと Graph 通話 SDK は、リッチでリアルタイムのメディアを構築し、ボットとの通話に役立ちます。 アプリケーションによりホストされるボットは、Windows 環境でホストされる必要があります。 詳細については、アプリケーションでホストされるメディア ボットに関するページを参照してください。
コード サンプル
サンプルの名前 | 説明 | Graph |
---|---|---|
Graph 通話 | Microsoft の通話プラットフォームと対話するための Graph 通話。 | 表示 |
次の手順
関連項目
Platform Docs