最適化された LLM サービスエンドポイントをプロビジョニング済みスループットに移行する

[アーティクル]
02/04/2025

重要

このドキュメントは廃止され、更新されない可能性があります。このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。

この記事では、Foundation Model APIを使用して、既存の LLM サービスエンドポイントをプロビジョニング済みスループットエクスペリエンスに移行する方法について説明します。

何が変更されていますか?

プロビジョニングされたスループットにより、最適化された LLM サービスエンドポイントを起動するためのエクスペリエンスが簡単になります。 Databricks は、次のことができるように LLM モデルサービスシステムを変更しました。

スケールアウト範囲は、コンカレンシーではなく、1 秒あたりのトークン数など、LLM ネイティブの用語で構成できます。
お客様は、GPU ワークロードの種類自体を選択する必要がなくなりました。

既定では、プロビジョニングされたスループットで新しい LLM サービスエンドポイントが作成されます。引き続き GPU ワークロードの種類を選択する場合、このエクスペリエンスは API を使用してのみサポートされます。

プロビジョニングされたスループットに LLM サービスエンドポイントを移行する

既存のエンドポイントをプロビジョニング済みスループットに移行する最も簡単な方法は、新しいモデルバージョンでエンドポイントを更新することです。新しいモデルバージョンを選択すると、プロビジョニングされたスループットのエクスペリエンスが UI に表示されます。 UI には、一般的なユースケースの Databricks ベンチマークに基づいて、1 秒あたりのトークン範囲が表示されます。

プロビジョニングスループット LLM サービス

最適化の改善により、この更新されたオファリングのパフォーマンスは厳密に向上し、エンドポイントの価格は変更されません。製品に関するフィードバックや懸念事項については、model-serving-feedback@databricks.com にお問い合わせください。

次の方法で共有

最適化された LLM サービスエンドポイントをプロビジョニング済みスループットに移行する

何が変更されていますか?

プロビジョニングされたスループットに LLM サービスエンドポイントを移行する

フィードバック

その他のリソース

次の方法で共有

最適化された LLM サービス エンドポイントをプロビジョニング済みスループットに移行する

何が変更されていますか?

プロビジョニングされたスループットに LLM サービス エンドポイントを移行する

フィードバック

その他のリソース

最適化された LLM サービスエンドポイントをプロビジョニング済みスループットに移行する

プロビジョニングされたスループットに LLM サービスエンドポイントを移行する