选择适当的图像来训练 AI
这部分比较棘手。 棘手的原因是它需要我们人类做一些思考。 我们需要选择能代表对象的适当照片集。 如上一单元所述,所有照片都应包含该对象,但在以下方面应有所不同:
- 照相机角度
- 照明
- 背景
- 视觉样式
- 个体/分组主体
- 大小
- 类型(如果适用于你的对象)
在此模块中,示例将使用电影《飞奔去月球》中 Bungee 的图像。 你将选择自己的图像。 如果需要,你甚至可以自己拍摄照片。 找到你最喜欢的宠物或毛绒玩具,并为其拍摄约 30 张照片。 请记住前面列表中列出的所有内容。
拍摄或查找这些图像时要记住的其他事项:
- 它们应该采用以下格式之一:.jpg、.png、.bmp 或 .gif。
- 它们的大小不应超过 6 MB。
- 它们的最短边缘应不少于 256 个像素。
你还需要查找或拍摄一组要用于测试 AI 的图像。 这些预测图像不应用于训练自定义视觉服务。 它们应该遵循相同的准则,只是你需要预测图像的大小不超过 4 MB。
花一些时间查找或拍摄图像。 要有创意! 拍摄一些具有透明背景的照片、一些只是将对象放在不同角度的照片,以及一些对象很小的照片。 这是你让服务了解你想要它能够识别的东西的机会。
图像识别的道德
在本模块的这一点上,有必要对道德进行简短的讨论。 与任何技术一样,道德始终应在你要构建的解决方案的最前端。 即使你只是在做实验或尝试某些事情,你也应该考虑自己所做的事情的含及其对他人的影响。
请记住,Fei Fei 制造了一枚火箭,飞向月球,试图使家人变得更加亲密。
选择图像时,请确保它们能代表对象。 避免偏见并具有包容性。 在计算实践中保持道德和包容性并不意味着需要解决问题的每一个可能版本。 而是要恰当地表现出你所要解决的问题。
以下是一个示例:
想象一下,你选择训练自定义视觉服务来识别建筑入口,这样你就可以将这些信息添加到由拍摄临街企业照片的相机创建的地图上。 你所提供的图像具有楼梯、坡道和平地。 如果你随后使用此训练的 AI 对该城市的一个新区域创建预测,并自动将这些预测信息作为可行的入口包含在你的地图中,这并不适用于所有人。 你可以向用户提供可以通过街道进入某个企业的信息。 但当需要使用坡道的用户到达时,可能会遇到只能走楼梯的入口。
你仍然可以构建这一完全相同的模型,但是要确保它在你的地图应用中被适当地标记为“有楼梯时不保证有坡道”。 或者,因为你已经将坡道作为训练数据集的一部分,所以你可以包含坡道标记,让人们可以选择他们适合且能够使用的入口类型,这样做更好。
在继续学习本模块之前,花几分钟时间思考你想要拍摄的图像,并让一个非人类、无同理心的 AI 代表你做出决定。 想想最糟糕的情况,并决定你想如何解决它们。 即使这个活动是一个“简单的实验”, 但当你在做一些可能会极大地影响你的人类同胞的生活的事情时,始终注意和考虑这些道德实践会让你自然地参与进来。