在Facebook和其他社交媒体平台上最常见的分享内容之一是照片。虽然大多数社交媒体用户都能看懂一张图片,并了解它所代表的内容,但对于那些盲人或视障人士来说就不那么容易了。Facebook表示,屏幕阅读器可以使用合成语音描述这些图片的内容,让盲人或视障用户能够理解Facebookfeed中的图片。
然而,许多照片在发布时没有alt文字,导致Facebook在2016年推出了自动替代文本(AAT)。该技术利用对象识别技术为盲人或视障用户按需生成照片的描述。自2016年以来,Facebook一直致力于改进AAT,并在最近推出了下一代技术。Facebook在AAT上的进步改善了用户的照片体验,AAT可以可靠地检测和识别照片中的概念数量扩大了十倍以上。这意味着没有描述的照片减少了,提供的描述也更加详细。AAT可以识别活动、地标、动物类型等等。
AAT现在会给出这样的描述:"可能是两个人的自拍,户外,比萨斜塔"。Facebook还表示,能够在照片中加入有关元素的潜在位置和相对大小的信息是行业首创。它不是简单地描述"可能是五人的合影",而是描述成“两个人在照片的中心,另外三个人向边缘分散。”
Facebook表示,这一进步可以帮助盲人或视力受损的用户更好地理解家人和朋友发布照片中的内容。最新版本的AAT使用了一个在数十亿张Instagram公开图片和标签数据上训练出来的模型。训练后产生的模型更加准确,并且在文化和人口统计方面更具包容性。改进后的AAT可以可靠地识别1200多个概念。
(7612632)