新聞資訊

DeepMind最近做了個(gè)能讀懂唇語(yǔ)新軟件，為失聰者提供有力工具

日期：2016-11-11 09:04:48 閱讀數(shù)：2738

專(zhuān)業(yè)唇語(yǔ)閱讀者識(shí)別唇語(yǔ)的準(zhǔn)確率只有20%到60%。人類(lèi)在日常說(shuō)話(huà)過(guò)程中嘴唇的微小移動(dòng)很難被可靠地解讀，尤其是在有一定距離，或畫(huà)面不清晰的情況下。不過(guò)，唇語(yǔ)并不只是美劇《海軍罪案調(diào)查科》中的噱頭，對(duì)全球的失聰者來(lái)說(shuō)，這是一項(xiàng)有用的工具。如果能可靠地解讀，那么將給數(shù)百萬(wàn)人帶來(lái)幫助。

牛津大學(xué)的*新研究描述了一種名為L(zhǎng)ipNet的人工智能系統(tǒng)。通過(guò)“觀(guān)看”人類(lèi)說(shuō)話(huà)的視頻，以及輸入相應(yīng)文字，這一軟件對(duì)唇語(yǔ)的解讀準(zhǔn)確率高達(dá)93.4%。這項(xiàng)研究得到了谷歌（微博）旗下DeepMind的資助。

此前*佳的唇語(yǔ)解讀工具只能實(shí)現(xiàn)逐個(gè)單詞的解讀，準(zhǔn)確率只有79.6%。牛津大學(xué)研究員表示，新系統(tǒng)獲得成功的關(guān)鍵在于通過(guò)不同方式去思考這一問(wèn)題。這一系統(tǒng)不再利用可視元素，即說(shuō)話(huà)者嘴型的變化去訓(xùn)練人工智能，而是每次都處理一整個(gè)句子。這使得人工智能可以學(xué)會(huì)單詞對(duì)應(yīng)于什么樣的嘴型變化。

為了訓(xùn)練這一系統(tǒng)，研究員向人工智能展示了2.9萬(wàn)條帶文字標(biāo)簽的視頻，每段視頻長(zhǎng)度為3秒。而為了觀(guān)察專(zhuān)業(yè)唇語(yǔ)閱讀者做得如何，該團(tuán)隊(duì)還邀請(qǐng)了“牛津?qū)W生殘疾人社團(tuán)”的3名成員，用300條隨機(jī)視頻去進(jìn)行類(lèi)似的測(cè)試。這些專(zhuān)家的平均錯(cuò)誤率為47.7%，而人工智能的錯(cuò)誤率只有6.6%。

盡管這一項(xiàng)目取得了成功，但也暴露出了當(dāng)代人工智能研究的局限。在指導(dǎo)人工智能如何閱讀唇語(yǔ)的過(guò)程中，牛津大學(xué)團(tuán)隊(duì)使用了經(jīng)過(guò)設(shè)計(jì)的視頻。視頻中的所有人物都面向前方，光線(xiàn)明亮，說(shuō)出標(biāo)準(zhǔn)結(jié)構(gòu)的語(yǔ)句。

視頻中的典型語(yǔ)句時(shí)長(zhǎng)為3秒鐘，例如：“Place blue in m 1 soon?！边@其中包括命令、顏色、介詞、字母、數(shù)字，以及副詞。所有語(yǔ)句都采用這樣的模式。因此，人工智能的超高準(zhǔn)確率只是在一種極端情況下取得的。如果要求人工智能從隨機(jī)的YouTube視頻中閱讀唇語(yǔ)，那么結(jié)果可能很不準(zhǔn)確。

有其他研究人員指出，利用這種特殊視頻去訓(xùn)練并不符合真實(shí)世界場(chǎng)景。不過(guò)，論文作者南多·德弗雷塔斯（Nando de Freitas）為自己的成果進(jìn)行了辯護(hù)。他指出，該團(tuán)隊(duì)曾嘗試過(guò)其他視頻，但這些視頻帶來(lái)了太多“噪音”。這些視頻各不相同，因此人工智能無(wú)法取得有意義的結(jié)論。這也意味著，完美的數(shù)據(jù)集可能并不存在。德弗雷塔斯認(rèn)為，考慮到這一人工智能的準(zhǔn)確率，*終情況如何將取決于任務(wù)本身。

OpenAI的杰克·克拉克（Jack Clark）表示，如果希望在現(xiàn)實(shí)世界中得到應(yīng)用，那么這一人工智能還需要三方面的優(yōu)化：人們?cè)诂F(xiàn)實(shí)世界場(chǎng)景中大量的說(shuō)話(huà)視頻；讓人工智能可以從多個(gè)不同角度去閱讀唇語(yǔ)；以及讓人工智能可預(yù)測(cè)的短語(yǔ)類(lèi)型更多樣化。

克拉克表示：“這項(xiàng)技術(shù)具備顯而易見(jiàn)的應(yīng)用，但這看起來(lái)似乎并不可能?！比绻斯ぶ悄芸梢詫W(xué)會(huì)閱讀唇語(yǔ)，那么將適用于多種場(chǎng)景。此類(lèi)系統(tǒng)可以被用于幫助聽(tīng)力障礙人士了解周?chē)l(fā)生的對(duì)話(huà)，或是讓其他人工智能更好地辨別視頻中的聲音，生成準(zhǔn)確的字幕。

相關(guān)新聞

精品牛牛影视久久精品,caopeng在线观看,亚洲骚片,日本一本二本免费播放视频,欧美亚洲激情在线,麻豆视频免费在线,五月婷婷六月色

環(huán)球醫(yī)療器械網(wǎng)

新聞資訊

DeepMind最近做了個(gè)能讀懂唇語(yǔ)新軟件，為失聰者提供有力工具

精品牛牛影视久久精品,caopeng在线观看,亚洲骚片,日本一本二本免费播放视频,欧美亚洲激情在线,麻豆视频免费在线,五月婷婷六月色

環(huán)球醫(yī)療器械網(wǎng)

新聞資訊

DeepMind最近做了個(gè)能讀懂唇語(yǔ)新軟件，為失聰者提供有力工具

DeepMind最近做了個(gè)能讀懂唇語(yǔ)新軟件，為失聰者提供有力工具