索引编制配置指南

项目
11/04/2024

可以使用默认索引设置，也可以对其进行调整。可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。

本文介绍每个选项。使用 Azure AI 视频索引器网站（请参阅 API 指南）时，相同的选项适用。为大量内容编制索引时，请遵循大规模索引编制指南。

默认设置

默认情况下，Azure AI 视频索引器配置为：

源语言：英语
隐私：专用
音频和视频设置：标准
流式处理质量：单比特率

视频源语言

如果你知道视频中讲述的语言，请从视频源语言列表中选择该语言。如果你不确定视频的语言，请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识（LID）来检测视频语言，并使用检测到的语言生成听录和见解。

如果视频包含多种语言且不确定哪些语言，请选择“自动检测多语言”。在这种情况下，上传和编制视频索引时，将应用多语言（MLID）检测。

虽然当视频中的语言变化时，自动检测是一个很好的选择，但在使用 LID 或 MLID 时需要考虑两点：

LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
在预先选择视频的适当语言时，听录质量更高。

详细了解语言支持和支持的语言。

隐私

使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。

索引选项

使用默认索引设置时，每个音频和视频索引选项的价格可能有所不同。有关详细信息，请参阅 Azure AI 视频索引器定价。

下面是索引类型选项，其中包含提供其见解的详细信息。若要修改索引编制类型，请选择“高级设置”。

注意

光学字符识别（OCR）与多种见解类型一起使用。

高级设置

仅音频

基本：仅使用音频（忽略视频）编制索引和提取见解，并提供以下见解：听录、翻译、输出字幕和字幕的格式（隐藏式字幕）。
标准：仅使用音频索引和提取见解（忽略视频），并提供以下见解：听录、翻译、输出标题和字幕的格式（隐藏式字幕）、自动语言检测、情感、关键字、命名实体（品牌、位置、人员）、情绪、演讲者、主题提取和文本 con帐篷模式ration。
高级：仅使用音频索引和提取见解（忽略视频），并提供以下见解：听录、翻译、输出字幕和字幕的格式（隐藏式字幕）、自动语言检测、音频事件检测、情感、关键字、命名实体（品牌、位置、人员）、情绪、演讲者、主题提取和文本 con帐篷模式ration。

仅视频

基本：仅使用视频索引和提取见解（忽略音频），并提供以下见解：标签、对象检测、OCR、场景（关键帧和镜头），以及黑色帧检测。
标准：仅使用视频（忽略音频）编制见解的索引和提取见解，并提供以下见解：标签（OCR）、命名实体（OCR - 品牌、位置、人员）、OCR、人员、场景（关键帧和镜头）、黑帧、视觉 con帐篷模式ration 和主题提取（OCR）。
高级：仅使用视频（忽略音频）编制和提取见解并提供以下见解：标签（OCR）、匹配的人员、命名实体（OCR - 品牌、位置、人员）、OCR、观察人员、人员、场景（关键帧和镜头）、clapper 板检测、数字模式检测、特色服装见解、无文本石板检测、文本徽标检测、黑色框架、视觉感知帐篷模式配和主题提取（OCR）。

音频和视频

基本：使用音频和视频为见解编制索引和提取见解，并提供以下见解：听录、翻译、输出标题和字幕的格式（隐藏式字幕）、对象检测、OCR、场景（关键帧和镜头）和黑色帧。
标准：使用音频和视频索引和提取见解，并提供以下见解：听录、翻译、输出字幕和字幕的格式（隐藏式字幕）、自动语言检测、情感、关键字、命名实体（品牌、位置、人员）、OCR、场景（关键帧和镜头）、黑帧、视觉 con帐篷模式ration、人员、情绪、说话人、主题提取和文本 con帐篷模式ration。
高级：使用音频和视频索引和提取见解，并提供以下见解：听录、翻译、输出字幕和字幕的格式（隐藏式字幕）、自动语言检测、文本检测、文本检测帐篷模式配音、音频事件检测、情感、关键字、匹配人员、命名实体（品牌、位置、人员）、OCR、观察人员、人员、clapper 板检测、数字模式检测、特色服装见解、无文本石板检测、情绪、扬声器、场景（关键帧和镜头）、文本徽标检测、黑色框架、视觉对象帐篷模式配给和主题提取。

流式处理质量选项

流式传输索引视频有两个选项：

单比特率：如果视频高度大于或等于 720p HD，则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。否则，其编码为 640 x 468。
无流式处理：生成见解，但不执行流式处理操作，并且视频在 Azure AI 视频索引器网站上不可用。如果选择“无流式处理”，则无需为编码付费。

排除模型

通过 VI 网站和 API 编制索引时，可以排除模型。使用网站将视频上传到索引时，请选择“高级设置>索引预设”，然后选择要从索引结果中排除的 AI 模型。这可以启用更高效的索引编制和 VI 结果，只包含你感兴趣的见解。

自定义内容模型

Azure AI 视频索引器允许自定义其某些模型，使其适应特定的用例。这些模型包括品牌、语言、人物和语音。

见解和媒体存储

见解存储

所有索引见解和元数据都保存在由 VI 管理的存储帐户中，不会为此存储付费。

媒体存储

VI 帐户已连接到Azure 存储帐户。可以控制并支付此存储帐户的使用情况。当为视频编制索引时，以下文件存储在此帐户中：

源文件。如果将来要重新编制视频索引，则会保留此内容。
当流式处理质量设置为单比特率时，新的编码文件。

删除媒体

索引媒体及其所有关联的文件和见解可以通过三种方式删除：

使用视频索引器门户删除文件。
使用“删除视频”或删除视频源文件请求。
如果使用 API 时，如果不需要将原始媒体文件保留在存储中，请将 retentionPeriod 参数设置为 1-7 之间。索引视频及其相关内容、源文件、见解等在编制索引后 1-7 天内被删除。

通过