微軟宣布:Skype 和 Powerpoint 幻燈片將有實時字幕

圖片來源:視覺中國

自認(rèn)為英語還可以的小探,最怕和別人說話時,別人說了一句怎么也聽不懂的英文。

一般來講,第一次沒聽懂,你大可以放心大膽地請人家再說一遍。

第二遍如果還沒聽懂,小探覺得就有必要加上兩句 “不好意思,剛才沒聽見” 之類的客套話,請人家再重復(fù)一遍。

如果第三次還沒聽懂(而且這時對方的不耐煩一般已經(jīng)很難掩飾了),小探只好禮貌微笑+說一句 “yeah, right?”,然后默默祈禱人家剛才說的那句話不是一個問題。

這種略尷尬的情形,相信不少人都遇到過。每當(dāng)這時小探就忍不住想:要是所有人講的話都能和電影里一樣配上字幕就好了!

還別說,很快,微軟就會讓這個想法變成現(xiàn)實...

Skype 和 Powerpoint 幻燈片將有實時字幕

相信大家對視頻聊天軟件 Skype 并不陌生。本周微軟宣布,以后我們再用 Skype 的時候,就能有實時字幕功能了!

也就是說,不論視頻還是語音,你在和對方聊天的時候,不論是對方說的話、還是你說的話,Skype 都能同時把它變成字幕,呈現(xiàn)在屏幕下方 —— 就像我們看電影、看劇底下的那行字一樣,只不過它們不是預(yù)先寫好的臺詞,而是你在那時那刻說的話。

圖自 Microsoft,版權(quán)屬于原作者

使用 Skype 時,點擊 “更多(+)” 按鈕,然后選擇 “打開字幕”,就可以使用這項功能啦!

圖自 Microsoft,版權(quán)屬于原作者

如果嫌麻煩,也可以直接調(diào)成默認(rèn)有字幕的設(shè)置:點擊你的頭像,進(jìn)入 “設(shè)置” 欄,然后進(jìn)入 “呼叫”、再點 “呼叫字幕” 的 “顯示字幕”,就可以以后每次通話默認(rèn)顯示字幕了。

圖自 Microsoft,版權(quán)屬于原作者

“即時翻譯” 這個功能打開后,對方說的話的字幕就會像電影字幕一樣自動滾動 —— 但字幕過去了就過去了,目前用戶還不能往前翻、查看之前的對話。

不過微軟說了,以后還會開發(fā)其它讓大家看字幕的方式,比如側(cè)窗滾動字幕,這樣如果對方剛才說的東西你沒聽清,還可以往上滑動字幕,找回去。

微軟還說,這個新功能不僅能夠快速、連續(xù)地給對話配上字幕,而且隨著對你說的話了解越來越多,AI 自己能通過研究上下文做 “閱讀理解”,讓自己越來越聰明、把字幕轉(zhuǎn)寫得越來越準(zhǔn)確。

雖然目前這個新功能只支持英語,但很快 Skype 將支持超過 20 種語言和方言翻譯的功能。到時,Skype 不僅有即時字幕,還能用機(jī)器做到 “同聲傳譯”。

看到這個新聞,小探的第一反應(yīng)是:爽!再也不怕對方說話不清楚、口音重之類的問題,簡直是居家旅行、學(xué)習(xí)外語、跨國交友的必備良品。

不過,微軟發(fā)布這個新功能的本意,其實是想幫助耳聾或聽障人士,讓他們可以在用 Skype 時,通過閱讀實時翻譯的對方說的話,來參與到對話里。

這就是為什么微軟特意選擇在本周一發(fā)布這個新功能:12 月 3 號是聯(lián)合國國際殘疾人日。微軟選擇在這一天給 Skype 加上實時字幕,就是希望通過這個小功能,讓聽障人士的生活簡單一點點。

除了 Skype,微軟還計劃把我們最熟悉不過的 “PPT” PowerPoint,也加上實時字幕。不僅如此,PowerPoint 也會有即時翻譯功能,甚至還能把字幕發(fā)到聽眾的手機(jī)上。

想象一下:假設(shè)一個有口音的人在以英文演講,但你聽不太懂,因為他的口音實在是太嚴(yán)重了(比如俄羅斯、新加坡或巴西口音)。這時,你可以看大屏幕上的英文字幕,或者也可以讓 PowerPoint 直接把英文翻譯成中文,發(fā)到你的手機(jī)或電腦上。

哪里聽不懂點哪里,媽媽再也不怕我視頻開會時聽不懂印度老板的話了。

聽著不錯吧?不過微軟說,這個功能正式發(fā)布,還需要等到明年年初。PowerPoint 將提供 12 種語言的實時字幕,還能把原語言翻譯成 60 多種語言。

小探認(rèn)為,PowerPoint 背后 AI 的語音識別技術(shù),有個其他語音識別技術(shù)沒有的優(yōu)勢:它不僅需要分辨出你說的話,還需要把你說的話,與幻燈片上的詞匯聯(lián)系起來,這樣可以更準(zhǔn)確地識別演講中提到的專有名稱和特定術(shù)語。

和 PowerPoint 頗為相似的 Google Slides 也推出了同樣的功能,但相比之下,PowerPoint 的功能更全面些:

Google slides 的實時字幕功能 / 版權(quán)屬于 Google

不論 PowerPoint 還是 Skype,微軟給這兩個產(chǎn)品新添加的功能,都是用 AI 把正在發(fā)生的談話實時以文本的形式呈現(xiàn)出來,讓 AI 變成我們的速記員和同聲傳譯。

除了方便不同語言的人之間的交流,微軟此舉更是意在幫助聽障人士。而微軟對殘疾人群體的關(guān)注,早已不是一兩天。

微軟:用 AI 改善殘疾人的生活

全球殘疾人人數(shù)超過 10 億,很多時候,這個群體并不能像其他人一樣享受科技帶來的便利 —— 在這 10 億人中,只有約 10% 的殘疾人用得上輔助工具(比如助聽設(shè)備、義肢等)。

殘疾會讓找工作變得格外艱難。根據(jù)美國人口普查局的統(tǒng)計,在失聰及聽障人群里,只有 52% 的人有工作。無法保證工作,自然會導(dǎo)致生活水平下降,對殘疾人來說,無疑雪上加霜。

一直以來,微軟就想通過 AI 讓殘疾人能更好地參與到工作環(huán)境里,而 PowerPoint 和 Skype 的實時字幕只是微軟諸多動作中的一兩種。要知道,在過去三年里,微軟給 Office 365 的各個產(chǎn)品陸陸續(xù)續(xù)加了 30 多個方便殘疾人用戶的功能。

而幫助殘疾人更適應(yīng)工作場所,其實只是微軟 “用 AI 改善殘疾人生活質(zhì)量” 這個宏大計劃下的一小部分。

今年 5 月 7 號,微軟在其名為 “Build” 的年度開發(fā)者大會上宣布,將開展一個名為 “AI for Accessibility”(“用人工智能,讓生活無障礙”)的人工智能項目。

微軟計劃在未來五年里,專門拿出 2500 萬美元,幫助那些能改善殘疾人生活、工作、和與人交流相關(guān)的 AI 產(chǎn)品的開發(fā)。微軟認(rèn)為,語言不通、或者有某種身體殘疾,都不應(yīng)該成為交流的障礙。微軟之所以如此關(guān)注這一領(lǐng)域,不知道和微軟 CEO 的兒子身患?xì)埣彩欠裼嘘P(guān)。

這個計劃將通過三種方式來實現(xiàn)這一點。

首先,微軟將大學(xué)、科研機(jī)構(gòu)、開發(fā)者,任何提出幫助殘疾人生活更便利的 AI 解決方案的團(tuán)隊提供種子技術(shù)授權(quán),優(yōu)先使用 AI 方法,幫助更多殘疾人士找到工作、降低生活里的不便(比如我們上文提到的無法用 Skype、無法聽別人的演講)。

然后,微軟從這些項目里選出最有可能成功的項目,進(jìn)行更大規(guī)模的技術(shù)投資,同時微軟也會帶著自己的資源,比如讓微軟的 AI 專家、合作伙伴參與進(jìn)來。

接下來,在服務(wù)中注入人工智能和包容性設(shè)計時,微軟也會將這些 AI 創(chuàng)新融入到平臺級的服務(wù)中,讓盡可能多的人能夠從中獲益。

其實,微軟在殘疾人工具研發(fā)這件事情上,一直就沒少花心思。微軟在這方面比較有名的一個產(chǎn)品叫 Seeing AI —— 這也是微軟十多年計算機(jī)視覺的研究成果。

Seeing AI 是微軟 2017 年推出的一款 “利用電腦視覺,給盲人描述、解釋世界長什么樣” 的應(yīng)用,微軟自己管這個應(yīng)用叫 “為盲人群體服務(wù)的有聲相機(jī)”(Talking camera for the Blind)。這款應(yīng)用已經(jīng)在蘋果商店獲得了超過四星的評分,頗受好評??上У氖牵琒eeing AI 目前還只支持英文版。

比如說,視障人士打開這款應(yīng)用,對著信封,Seeing AI 就能把信封上的信息讀出來:

再比如說,Seeing AI 可以告訴用戶它都看到了什么。 如下圖所示,它看到了 “一把黑色的吉他”,和 “一只手拿著一塊表”。

哦對了,小探在寫這篇文章查資料時看到,有視障用戶在用了 Seeing AI 的產(chǎn)品后,可以幫年幼的孩子檢查作業(yè)了。

微軟高級產(chǎn)品營銷經(jīng)理 Malavika Rewari 接受外媒采訪時表示,微軟的 “無障礙小組” 里,約 90% 的員工都有某種殘疾。

Ann 是微軟 Seeing AI 應(yīng)用研發(fā)小組的一名成員,同時也是一名盲人。

而他們?yōu)闅埣踩碎_發(fā)出來的像 Seeing AI 之類的產(chǎn)品,無疑使殘疾人離獨立、便利、更有尊嚴(yán)的生活又近了一步。

用科技改善殘疾人的生活

在提高殘疾人的生活質(zhì)量這件事上,微軟不是唯一一家。

民宿巨頭 Airbnb 就是其中之一。以前,用戶在 Airbnb 平臺搜索房屋時,除了 “價格”、“位置” 等搜索條件,在 “無障礙” 這塊,只有 “方便輪椅進(jìn)出” 這一個相對比較粗糙的選項。

今年三月,Airbnb 新添加了 21 個更細(xì)致的 “無障礙” 篩選條件,比如 “是否有無障礙停車位”、“無障礙淋浴” 等條件,讓輪椅使用者出行更方便。

谷歌地圖相信大家也不陌生。今年,谷歌給用戶在選擇路線的時候,新添加了 “輪椅可行” 的選項。這樣,輪椅使用者就可以避開沒有輪椅配套設(shè)施的地方。目前只有紐約、倫敦、東京、波士頓、墨西哥城和悉尼的谷歌地圖配備了這個新功能,不過谷歌計劃把它推廣到更多城市。

當(dāng)然,不論是 Seeing AI 還是谷歌的地圖,在用戶體驗上還有很多需要改善的地方,但這種趨勢讓人感到非常欣慰。

小探以前有種 “發(fā)達(dá)國家的殘疾人更多” 的錯覺,因為在街上總能看到殘疾人。相比之下,國內(nèi)街上殘疾人出現(xiàn)的比率似乎低了不少。其實,這不是因為中國的殘疾人人口比例更低 —— 據(jù)統(tǒng)計,2017年中國各類殘疾人總數(shù)為8500萬人,也有統(tǒng)計認(rèn)為人數(shù)接近一億,是世界上殘疾人口最多的國家。之所以大街小巷上不怎么看得到殘疾人,是因為我們的無障礙設(shè)施還做得很不到位。

不論出于溫情,還是龐大的殘疾人群體背后的巨大市場,硅谷的巨頭們紛紛開始關(guān)注無障礙領(lǐng)域里的機(jī)會。希望不遠(yuǎn)的將來,這類新技術(shù)能幫助殘疾人們獲得更便利的生活。

推薦DIY文章
聯(lián)想小新Air14 2023公開部分規(guī)格:新筆電將搭載下沉式鍵盤
朗科新推絕影NV5000-t固態(tài)硬盤 溫控技術(shù)更高 售價暫未公布
2022款iPadPro將可使用視頻編輯軟件達(dá)芬奇 使用軟件更專業(yè)
蘋果全新推出AppleTV 4K產(chǎn)品:流式傳輸可以千兆以太網(wǎng)進(jìn)行
智己L7SnakePerformance高性能版:新車瞄準(zhǔn)數(shù)秒級圈速提升
閃迪大師PRO-G40SSD外置固態(tài)硬盤:兼具極速傳輸與耐用優(yōu)點
精彩新聞

超前放送