微軟宣布:Skype 和 Powerpoint 幻燈片將有實(shí)時(shí)字幕

圖片來源:視覺中國

自認(rèn)為英語還可以的小探,最怕和別人說話時(shí),別人說了一句怎么也聽不懂的英文。

一般來講,第一次沒聽懂,你大可以放心大膽地請人家再說一遍。

第二遍如果還沒聽懂,小探覺得就有必要加上兩句 “不好意思,剛才沒聽見” 之類的客套話,請人家再重復(fù)一遍。

如果第三次還沒聽懂(而且這時(shí)對方的不耐煩一般已經(jīng)很難掩飾了),小探只好禮貌微笑+說一句 “yeah, right?”,然后默默祈禱人家剛才說的那句話不是一個(gè)問題。

這種略尷尬的情形,相信不少人都遇到過。每當(dāng)這時(shí)小探就忍不住想:要是所有人講的話都能和電影里一樣配上字幕就好了!

還別說,很快,微軟就會(huì)讓這個(gè)想法變成現(xiàn)實(shí)...

Skype 和 Powerpoint 幻燈片將有實(shí)時(shí)字幕

相信大家對視頻聊天軟件 Skype 并不陌生。本周微軟宣布,以后我們再用 Skype 的時(shí)候,就能有實(shí)時(shí)字幕功能了!

也就是說,不論視頻還是語音,你在和對方聊天的時(shí)候,不論是對方說的話、還是你說的話,Skype 都能同時(shí)把它變成字幕,呈現(xiàn)在屏幕下方 —— 就像我們看電影、看劇底下的那行字一樣,只不過它們不是預(yù)先寫好的臺(tái)詞,而是你在那時(shí)那刻說的話。

圖自 Microsoft,版權(quán)屬于原作者

使用 Skype 時(shí),點(diǎn)擊 “更多(+)” 按鈕,然后選擇 “打開字幕”,就可以使用這項(xiàng)功能啦!

圖自 Microsoft,版權(quán)屬于原作者

如果嫌麻煩,也可以直接調(diào)成默認(rèn)有字幕的設(shè)置:點(diǎn)擊你的頭像,進(jìn)入 “設(shè)置” 欄,然后進(jìn)入 “呼叫”、再點(diǎn) “呼叫字幕” 的 “顯示字幕”,就可以以后每次通話默認(rèn)顯示字幕了。

圖自 Microsoft,版權(quán)屬于原作者

“即時(shí)翻譯” 這個(gè)功能打開后,對方說的話的字幕就會(huì)像電影字幕一樣自動(dòng)滾動(dòng) —— 但字幕過去了就過去了,目前用戶還不能往前翻、查看之前的對話。

不過微軟說了,以后還會(huì)開發(fā)其它讓大家看字幕的方式,比如側(cè)窗滾動(dòng)字幕,這樣如果對方剛才說的東西你沒聽清,還可以往上滑動(dòng)字幕,找回去。

微軟還說,這個(gè)新功能不僅能夠快速、連續(xù)地給對話配上字幕,而且隨著對你說的話了解越來越多,AI 自己能通過研究上下文做 “閱讀理解”,讓自己越來越聰明、把字幕轉(zhuǎn)寫得越來越準(zhǔn)確。

雖然目前這個(gè)新功能只支持英語,但很快 Skype 將支持超過 20 種語言和方言翻譯的功能。到時(shí),Skype 不僅有即時(shí)字幕,還能用機(jī)器做到 “同聲傳譯”。

看到這個(gè)新聞,小探的第一反應(yīng)是:爽!再也不怕對方說話不清楚、口音重之類的問題,簡直是居家旅行、學(xué)習(xí)外語、跨國交友的必備良品。

不過,微軟發(fā)布這個(gè)新功能的本意,其實(shí)是想幫助耳聾或聽障人士,讓他們可以在用 Skype 時(shí),通過閱讀實(shí)時(shí)翻譯的對方說的話,來參與到對話里。

這就是為什么微軟特意選擇在本周一發(fā)布這個(gè)新功能:12 月 3 號(hào)是聯(lián)合國國際殘疾人日。微軟選擇在這一天給 Skype 加上實(shí)時(shí)字幕,就是希望通過這個(gè)小功能,讓聽障人士的生活簡單一點(diǎn)點(diǎn)。

除了 Skype,微軟還計(jì)劃把我們最熟悉不過的 “PPT” PowerPoint,也加上實(shí)時(shí)字幕。不僅如此,PowerPoint 也會(huì)有即時(shí)翻譯功能,甚至還能把字幕發(fā)到聽眾的手機(jī)上。

想象一下:假設(shè)一個(gè)有口音的人在以英文演講,但你聽不太懂,因?yàn)樗目谝魧?shí)在是太嚴(yán)重了(比如俄羅斯、新加坡或巴西口音)。這時(shí),你可以看大屏幕上的英文字幕,或者也可以讓 PowerPoint 直接把英文翻譯成中文,發(fā)到你的手機(jī)或電腦上。

哪里聽不懂點(diǎn)哪里,媽媽再也不怕我視頻開會(huì)時(shí)聽不懂印度老板的話了。

聽著不錯(cuò)吧?不過微軟說,這個(gè)功能正式發(fā)布,還需要等到明年年初。PowerPoint 將提供 12 種語言的實(shí)時(shí)字幕,還能把原語言翻譯成 60 多種語言。

小探認(rèn)為,PowerPoint 背后 AI 的語音識(shí)別技術(shù),有個(gè)其他語音識(shí)別技術(shù)沒有的優(yōu)勢:它不僅需要分辨出你說的話,還需要把你說的話,與幻燈片上的詞匯聯(lián)系起來,這樣可以更準(zhǔn)確地識(shí)別演講中提到的專有名稱和特定術(shù)語。

和 PowerPoint 頗為相似的 Google Slides 也推出了同樣的功能,但相比之下,PowerPoint 的功能更全面些:

Google slides 的實(shí)時(shí)字幕功能 / 版權(quán)屬于 Google

不論 PowerPoint 還是 Skype,微軟給這兩個(gè)產(chǎn)品新添加的功能,都是用 AI 把正在發(fā)生的談話實(shí)時(shí)以文本的形式呈現(xiàn)出來,讓 AI 變成我們的速記員和同聲傳譯。

除了方便不同語言的人之間的交流,微軟此舉更是意在幫助聽障人士。而微軟對殘疾人群體的關(guān)注,早已不是一兩天。

微軟:用 AI 改善殘疾人的生活

全球殘疾人人數(shù)超過 10 億,很多時(shí)候,這個(gè)群體并不能像其他人一樣享受科技帶來的便利 —— 在這 10 億人中,只有約 10% 的殘疾人用得上輔助工具(比如助聽設(shè)備、義肢等)。

殘疾會(huì)讓找工作變得格外艱難。根據(jù)美國人口普查局的統(tǒng)計(jì),在失聰及聽障人群里,只有 52% 的人有工作。無法保證工作,自然會(huì)導(dǎo)致生活水平下降,對殘疾人來說,無疑雪上加霜。

一直以來,微軟就想通過 AI 讓殘疾人能更好地參與到工作環(huán)境里,而 PowerPoint 和 Skype 的實(shí)時(shí)字幕只是微軟諸多動(dòng)作中的一兩種。要知道,在過去三年里,微軟給 Office 365 的各個(gè)產(chǎn)品陸陸續(xù)續(xù)加了 30 多個(gè)方便殘疾人用戶的功能。

而幫助殘疾人更適應(yīng)工作場所,其實(shí)只是微軟 “用 AI 改善殘疾人生活質(zhì)量” 這個(gè)宏大計(jì)劃下的一小部分。

今年 5 月 7 號(hào),微軟在其名為 “Build” 的年度開發(fā)者大會(huì)上宣布,將開展一個(gè)名為 “AI for Accessibility”(“用人工智能,讓生活無障礙”)的人工智能項(xiàng)目。

微軟計(jì)劃在未來五年里,專門拿出 2500 萬美元,幫助那些能改善殘疾人生活、工作、和與人交流相關(guān)的 AI 產(chǎn)品的開發(fā)。微軟認(rèn)為,語言不通、或者有某種身體殘疾,都不應(yīng)該成為交流的障礙。微軟之所以如此關(guān)注這一領(lǐng)域,不知道和微軟 CEO 的兒子身患?xì)埣彩欠裼嘘P(guān)。

這個(gè)計(jì)劃將通過三種方式來實(shí)現(xiàn)這一點(diǎn)。

首先,微軟將大學(xué)、科研機(jī)構(gòu)、開發(fā)者,任何提出幫助殘疾人生活更便利的 AI 解決方案的團(tuán)隊(duì)提供種子技術(shù)授權(quán),優(yōu)先使用 AI 方法,幫助更多殘疾人士找到工作、降低生活里的不便(比如我們上文提到的無法用 Skype、無法聽別人的演講)。

然后,微軟從這些項(xiàng)目里選出最有可能成功的項(xiàng)目,進(jìn)行更大規(guī)模的技術(shù)投資,同時(shí)微軟也會(huì)帶著自己的資源,比如讓微軟的 AI 專家、合作伙伴參與進(jìn)來。

接下來,在服務(wù)中注入人工智能和包容性設(shè)計(jì)時(shí),微軟也會(huì)將這些 AI 創(chuàng)新融入到平臺(tái)級(jí)的服務(wù)中,讓盡可能多的人能夠從中獲益。

其實(shí),微軟在殘疾人工具研發(fā)這件事情上,一直就沒少花心思。微軟在這方面比較有名的一個(gè)產(chǎn)品叫 Seeing AI —— 這也是微軟十多年計(jì)算機(jī)視覺的研究成果。

Seeing AI 是微軟 2017 年推出的一款 “利用電腦視覺,給盲人描述、解釋世界長什么樣” 的應(yīng)用,微軟自己管這個(gè)應(yīng)用叫 “為盲人群體服務(wù)的有聲相機(jī)”(Talking camera for the Blind)。這款應(yīng)用已經(jīng)在蘋果商店獲得了超過四星的評(píng)分,頗受好評(píng)??上У氖?,Seeing AI 目前還只支持英文版。

比如說,視障人士打開這款應(yīng)用,對著信封,Seeing AI 就能把信封上的信息讀出來:

再比如說,Seeing AI 可以告訴用戶它都看到了什么。 如下圖所示,它看到了 “一把黑色的吉他”,和 “一只手拿著一塊表”。

哦對了,小探在寫這篇文章查資料時(shí)看到,有視障用戶在用了 Seeing AI 的產(chǎn)品后,可以幫年幼的孩子檢查作業(yè)了。

微軟高級(jí)產(chǎn)品營銷經(jīng)理 Malavika Rewari 接受外媒采訪時(shí)表示,微軟的 “無障礙小組” 里,約 90% 的員工都有某種殘疾。

Ann 是微軟 Seeing AI 應(yīng)用研發(fā)小組的一名成員,同時(shí)也是一名盲人。

而他們?yōu)闅埣踩碎_發(fā)出來的像 Seeing AI 之類的產(chǎn)品,無疑使殘疾人離獨(dú)立、便利、更有尊嚴(yán)的生活又近了一步。

用科技改善殘疾人的生活

在提高殘疾人的生活質(zhì)量這件事上,微軟不是唯一一家。

民宿巨頭 Airbnb 就是其中之一。以前,用戶在 Airbnb 平臺(tái)搜索房屋時(shí),除了 “價(jià)格”、“位置” 等搜索條件,在 “無障礙” 這塊,只有 “方便輪椅進(jìn)出” 這一個(gè)相對比較粗糙的選項(xiàng)。

今年三月,Airbnb 新添加了 21 個(gè)更細(xì)致的 “無障礙” 篩選條件,比如 “是否有無障礙停車位”、“無障礙淋浴” 等條件,讓輪椅使用者出行更方便。

谷歌地圖相信大家也不陌生。今年,谷歌給用戶在選擇路線的時(shí)候,新添加了 “輪椅可行” 的選項(xiàng)。這樣,輪椅使用者就可以避開沒有輪椅配套設(shè)施的地方。目前只有紐約、倫敦、東京、波士頓、墨西哥城和悉尼的谷歌地圖配備了這個(gè)新功能,不過谷歌計(jì)劃把它推廣到更多城市。

當(dāng)然,不論是 Seeing AI 還是谷歌的地圖,在用戶體驗(yàn)上還有很多需要改善的地方,但這種趨勢讓人感到非常欣慰。

小探以前有種 “發(fā)達(dá)國家的殘疾人更多” 的錯(cuò)覺,因?yàn)樵诮稚峡偰芸吹綒埣踩?。相比之下,國?nèi)街上殘疾人出現(xiàn)的比率似乎低了不少。其實(shí),這不是因?yàn)橹袊臍埣踩巳丝诒壤?—— 據(jù)統(tǒng)計(jì),2017年中國各類殘疾人總數(shù)為8500萬人,也有統(tǒng)計(jì)認(rèn)為人數(shù)接近一億,是世界上殘疾人口最多的國家。之所以大街小巷上不怎么看得到殘疾人,是因?yàn)槲覀兊臒o障礙設(shè)施還做得很不到位。

不論出于溫情,還是龐大的殘疾人群體背后的巨大市場,硅谷的巨頭們紛紛開始關(guān)注無障礙領(lǐng)域里的機(jī)會(huì)。希望不遠(yuǎn)的將來,這類新技術(shù)能幫助殘疾人們獲得更便利的生活。

推薦DIY文章
聯(lián)想小新Air14 2023公開部分規(guī)格:新筆電將搭載下沉式鍵盤
朗科新推絕影NV5000-t固態(tài)硬盤 溫控技術(shù)更高 售價(jià)暫未公布
2022款iPadPro將可使用視頻編輯軟件達(dá)芬奇 使用軟件更專業(yè)
蘋果全新推出AppleTV 4K產(chǎn)品:流式傳輸可以千兆以太網(wǎng)進(jìn)行
智己L7SnakePerformance高性能版:新車瞄準(zhǔn)數(shù)秒級(jí)圈速提升
閃迪大師PRO-G40SSD外置固態(tài)硬盤:兼具極速傳輸與耐用優(yōu)點(diǎn)
精彩新聞

超前放送