索引编制配置指南

可以使用默认索引设置,也可以对其进行调整。 可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。

本文介绍每个选项。 使用 Azure AI 视频索引器网站 (请参阅 API 指南)时,相同的选项适用。 为大量内容编制索引时,请遵循大规模索引编制指南

默认设置

默认情况下,Azure AI 视频索引器配置为:

  • 源语言:英语
  • 隐私:专用
  • 音频和视频设置:标准
  • 流式处理质量:单比特率

视频源语言

如果你知道视频中讲述的语言,请从视频源语言列表中选择该语言。 如果你不确定视频的语言,请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识(LID)来检测视频语言,并使用检测到的语言生成听录和见解。

如果视频包含多种语言且不确定哪些语言,请选择“自动检测多语言”。 在这种情况下,上传和编制视频索引时,将应用多语言(MLID)检测。

虽然当视频中的语言变化时,自动检测是一个很好的选择,但在使用 LID 或 MLID 时需要考虑两点:

  • LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
  • 在预先选择视频的适当语言时,听录质量更高。

详细了解语言支持和支持的语言

隐私

使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。

索引选项

使用默认索引设置时,每个音频和视频索引选项的价格可能有所不同。 有关详细信息,请参阅 Azure AI 视频索引器定价

下面是索引类型选项,其中包含提供其见解的详细信息。 若要修改索引编制类型,请选择“高级设置”。

注意

光学字符识别(OCR)与多种见解类型一起使用。

高级设置

仅音频

  • 基本:仅使用音频(忽略视频)编制索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)。
  • 标准:仅使用音频索引和提取见解(忽略视频),并提供以下见解:听录、翻译、输出标题和字幕的格式(隐藏式字幕)、自动语言检测、情感、关键字、命名实体(品牌、位置、人员)、情绪、演讲者、主题提取和文本 con帐篷模式ration。
  • 高级:仅使用音频索引和提取见解(忽略视频),并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、音频事件检测、情感、关键字、命名实体(品牌、位置、人员)、情绪、演讲者、主题提取和文本 con帐篷模式ration。

仅视频

  • 基本:仅使用视频索引和提取见解(忽略音频),并提供以下见解:标签、对象检测、OCR、场景(关键帧和镜头),以及黑色帧检测。
  • 标准:仅使用视频(忽略音频)编制见解的索引和提取见解,并提供以下见解:标签(OCR)、命名实体(OCR - 品牌、位置、人员)、OCR、人员、场景(关键帧和镜头)、黑帧、视觉 con帐篷模式ration 和主题提取(OCR)。
  • 高级:仅使用视频(忽略音频)编制和提取见解并提供以下见解:标签(OCR)、匹配的人员、命名实体(OCR - 品牌、位置、人员)、OCR、观察人员、人员、场景(关键帧和镜头)、clapper 板检测、数字模式检测、特色服装见解、无文本石板检测、文本徽标检测、黑色框架、视觉感知帐篷模式配和主题提取(OCR)。

音频和视频

  • 基本:使用音频和视频为见解编制索引和提取见解,并提供以下见解:听录、翻译、输出标题和字幕的格式(隐藏式字幕)、对象检测、OCR、场景(关键帧和镜头)和黑色帧。
  • 标准:使用音频和视频索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、情感、关键字、命名实体(品牌、位置、人员)、OCR、场景(关键帧和镜头)、黑帧、视觉 con帐篷模式ration、人员、情绪、说话人、主题提取和文本 con帐篷模式ration。
  • 高级:使用音频和视频索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、文本检测、文本检测帐篷模式配音、音频事件检测、情感、关键字、匹配人员、命名实体(品牌、位置、人员)、OCR、观察人员、人员、clapper 板检测、数字模式检测、特色服装见解、 无文本石板检测、情绪、扬声器、场景(关键帧和镜头)、文本徽标检测、黑色框架、视觉对象帐篷模式配给和主题提取。

流式处理质量选项

流式传输索引视频有两个选项:

  • 单比特率:如果视频高度大于或等于 720p HD,则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。 否则,其编码为 640 x 468。
  • 无流式处理:生成见解,但不执行流式处理操作,并且视频在 Azure AI 视频索引器网站上不可用。 如果选择“无流式处理”,则无需为编码付费。

排除模型

通过 VI 网站和 API 编制索引时,可以排除模型。 使用网站将视频上传到索引时,请选择“高级设置>索引预设”,然后选择要从索引结果中排除的 AI 模型。 这可以启用更高效的索引编制和 VI 结果,只包含你感兴趣的见解。

自定义内容模型

Azure AI 视频索引器允许自定义其某些模型,使其适应特定的用例。 这些模型包括 品牌语言人物语音

见解和媒体存储

见解存储

所有索引见解和元数据都保存在由 VI 管理的存储帐户中,不会为此存储付费。

媒体存储

VI 帐户已连接到Azure 存储帐户。 可以控制并支付此存储帐户的使用情况。 当为视频编制索引时,以下文件存储在此帐户中:

  • 源文件。 如果将来要重新编制视频索引,则会保留此内容。
  • 当流式处理质量设置为单比特率时,新的编码文件。

删除媒体

索引媒体及其所有关联的文件和见解可以通过三种方式删除:

  1. 使用 视频索引器门户删除文件。
  2. 使用“删除视频”或删除视频源文件请求。
  3. 如果使用 API 时,如果不需要将原始媒体文件保留在存储中,请将 retentionPeriod 参数设置为 1-7 之间。 索引视频及其相关内容、源文件、见解等在编制索引后 1-7 天内被删除。