微軟上周宣布,包括Windows版、macOS版與Linux版的Microsoft Edge都已內置“替代文本”(Alt Text)功能,可自動替網絡上缺乏標簽的圖像或圖表產生文本敘述,并通過屏幕閱讀器讀取,以惠及視障人士。
屏幕閱讀器可用來替視障人士讀取網頁上的內容,包括文本以及含有替代文本的圖像/圖表,然而,微軟的數據顯示,屏幕閱讀器所遇到的圖像中,有超過半數都缺乏圖像標簽或替代文本。
當Microsoft Edge用戶通過設置允許微軟替用戶創(chuàng)造圖像描述(Get image descriptions from Microsoft for screen readers)之后,只要屏幕閱讀器遇見缺乏標簽的圖像,Edge就會自動把圖像送至Azure Cognitive Services的計算機視覺API進行分析,進而創(chuàng)造5種語言的文本摘錄,也能識別嵌入于圖像中的超過120種語言。該API支持包括JPEG、PNG、GIF及WEBP等常見的圖片格式。
圖片來源/微軟
該自動化圖說服務有某些限制,例如被網站作者標示為裝飾用的圖像,或者是文件小于50 x 50像素的圖像(如圖標),也無法分析太大的圖像,此外,計算機視覺API也會排除色情或血腥圖像。
不過,微軟強調,最了解圖像所要企圖表達意象的一定是網站作者,再加上以機器學習算法來描述圖像并不那么完美,而且品質不一,因此,最好的方式還是由作者親自撰寫圖說,但當缺乏圖說或圖像標簽時,由AI產生的替代文本還是優(yōu)于什么都沒有。
目前Microsoft Edge的替代文本功能只支持桌面版操作系統(tǒng),尚未支持Android及iOS等移動平臺。