索引编制配置指南
可以使用默认索引设置,也可以对其进行调整。 可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。
本文介绍每个选项。 使用 Azure AI 视频索引器网站 (请参阅 API 指南)时,相同的选项适用。 为大量内容编制索引时,请遵循大规模索引编制指南。
默认设置
默认情况下,Azure AI 视频索引器配置为:
- 源语言:英语
- 隐私:专用
- 音频和视频设置:标准
- 流式处理质量:单比特率
视频源语言
如果你知道视频中讲述的语言,请从视频源语言列表中选择该语言。 如果你不确定视频的语言,请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识(LID)来检测视频语言,并使用检测到的语言生成听录和见解。
如果视频包含多种语言且不确定哪些语言,请选择“自动检测多语言”。 在这种情况下,上传和编制视频索引时,将应用多语言(MLID)检测。
虽然当视频中的语言变化时,自动检测是一个很好的选择,但在使用 LID 或 MLID 时需要考虑两点:
- LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
- 在预先选择视频的适当语言时,听录质量更高。
详细了解语言支持和支持的语言。
隐私
使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。
索引选项
使用默认索引设置时,每个音频和视频索引选项的价格可能有所不同。 有关详细信息,请参阅 Azure AI 视频索引器定价 。
下面是索引类型选项,其中包含提供其见解的详细信息。 若要修改索引编制类型,请选择“高级设置”。
注意
光学字符识别(OCR)与多种见解类型一起使用。
高级设置
仅音频
- 基本:仅使用音频(忽略视频)编制索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)。
- 标准:仅使用音频索引和提取见解(忽略视频),并提供以下见解:听录、翻译、输出标题和字幕的格式(隐藏式字幕)、自动语言检测、情感、关键字、命名实体(品牌、位置、人员)、情绪、演讲者、主题提取和文本 con帐篷模式ration。
- 高级:仅使用音频索引和提取见解(忽略视频),并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、音频事件检测、情感、关键字、命名实体(品牌、位置、人员)、情绪、演讲者、主题提取和文本 con帐篷模式ration。
仅视频
- 基本:仅使用视频索引和提取见解(忽略音频),并提供以下见解:标签、对象检测、OCR、场景(关键帧和镜头),以及黑色帧检测。
- 标准:仅使用视频(忽略音频)编制见解的索引和提取见解,并提供以下见解:标签(OCR)、命名实体(OCR - 品牌、位置、人员)、OCR、人员、场景(关键帧和镜头)、黑帧、视觉 con帐篷模式ration 和主题提取(OCR)。
- 高级:仅使用视频(忽略音频)编制和提取见解并提供以下见解:标签(OCR)、匹配的人员、命名实体(OCR - 品牌、位置、人员)、OCR、观察人员、人员、场景(关键帧和镜头)、clapper 板检测、数字模式检测、特色服装见解、无文本石板检测、文本徽标检测、黑色框架、视觉感知帐篷模式配和主题提取(OCR)。
音频和视频
- 基本:使用音频和视频为见解编制索引和提取见解,并提供以下见解:听录、翻译、输出标题和字幕的格式(隐藏式字幕)、对象检测、OCR、场景(关键帧和镜头)和黑色帧。
- 标准:使用音频和视频索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、情感、关键字、命名实体(品牌、位置、人员)、OCR、场景(关键帧和镜头)、黑帧、视觉 con帐篷模式ration、人员、情绪、说话人、主题提取和文本 con帐篷模式ration。
- 高级:使用音频和视频索引和提取见解,并提供以下见解:听录、翻译、输出字幕和字幕的格式(隐藏式字幕)、自动语言检测、文本检测、文本检测帐篷模式配音、音频事件检测、情感、关键字、匹配人员、命名实体(品牌、位置、人员)、OCR、观察人员、人员、clapper 板检测、数字模式检测、特色服装见解、 无文本石板检测、情绪、扬声器、场景(关键帧和镜头)、文本徽标检测、黑色框架、视觉对象帐篷模式配给和主题提取。
流式处理质量选项
流式传输索引视频有两个选项:
- 单比特率:如果视频高度大于或等于 720p HD,则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。 否则,其编码为 640 x 468。
- 无流式处理:生成见解,但不执行流式处理操作,并且视频在 Azure AI 视频索引器网站上不可用。 如果选择“无流式处理”,则无需为编码付费。
排除模型
通过 VI 网站和 API 编制索引时,可以排除模型。 使用网站将视频上传到索引时,请选择“高级设置>索引预设”,然后选择要从索引结果中排除的 AI 模型。 这可以启用更高效的索引编制和 VI 结果,只包含你感兴趣的见解。
自定义内容模型
Azure AI 视频索引器允许自定义其某些模型,使其适应特定的用例。 这些模型包括 品牌、 语言、 人物和 语音。
见解和媒体存储
见解存储
所有索引见解和元数据都保存在由 VI 管理的存储帐户中,不会为此存储付费。
媒体存储
VI 帐户已连接到Azure 存储帐户。 可以控制并支付此存储帐户的使用情况。 当为视频编制索引时,以下文件存储在此帐户中:
- 源文件。 如果将来要重新编制视频索引,则会保留此内容。
- 当流式处理质量设置为单比特率时,新的编码文件。
删除媒体
索引媒体及其所有关联的文件和见解可以通过三种方式删除: