關(guān)注微信公眾號(hào)
創(chuàng)頭條企服版APP
谷歌表示,它的人工智能技術(shù)讓智能手機(jī)能夠解讀和“朗讀”手語(yǔ)。
這家科技巨頭還沒(méi)有開(kāi)發(fā)出自己的應(yīng)用程序,但已經(jīng)發(fā)布了算法,它希望開(kāi)發(fā)者可以利用這些算法開(kāi)發(fā)出自己的應(yīng)用程序。
在此之前,這類軟件只能在個(gè)人電腦上使用。
來(lái)自聽(tīng)力受損社區(qū)的活動(dòng)人士對(duì)該舉表示歡迎,但他們表示,這項(xiàng)技術(shù)可能會(huì)難以完全掌握部分對(duì)話內(nèi)容。
在人工智能博客上,谷歌的兩位研究工程師瓦倫丁·巴扎列夫斯基(Valentin Bazarevsky)和Fan Zhang稱,這項(xiàng)免費(fèi)公開(kāi)的技術(shù)旨在成為“理解手語(yǔ)的基礎(chǔ)”。它是與圖像軟件公司MediaPipe合作打造而成的。
“我們很期待開(kāi)發(fā)者會(huì)產(chǎn)生什么樣的點(diǎn)子。就我們而言,我們將繼續(xù)展開(kāi)我們的研究,以使得這一技術(shù)變得更加強(qiáng)大,進(jìn)一步穩(wěn)定對(duì)手語(yǔ)手勢(shì)的跟蹤,增加我們可以可靠地檢測(cè)到的手勢(shì)的數(shù)量。”谷歌的發(fā)言人向媒體表示。
谷歌坦言這是第一步。活動(dòng)人士指出,僅僅依靠手勢(shì)生成語(yǔ)音的應(yīng)用程序,可能會(huì)忽略掉任何的面部表情或做手勢(shì)的速度,而這些因素可能會(huì)影響對(duì)實(shí)際手語(yǔ)意思的理解。
此外,該技術(shù)不會(huì)將任何存在于局部地區(qū)的地域性因素納入考慮。
該算法可以跟蹤兩只手
聽(tīng)力損失行動(dòng)(Action on Hearing Loss)的技術(shù)經(jīng)理杰塞爾·維什努拉姆(Jesal Vishnuram)說(shuō)道,這項(xiàng)計(jì)劃在聽(tīng)到耳聾者的“聲音”上是一個(gè)良好的開(kāi)端,但還需要配套其它的一些功能。
他說(shuō),“站在耳聾者的角度來(lái)看,開(kāi)發(fā)一種軟件將文本或音頻自動(dòng)翻譯成手語(yǔ),以幫助他們的日常溝通,減少其在聽(tīng)覺(jué)世界中的孤獨(dú)感,會(huì)更加有益。”
被遮擋的手指
過(guò)往,當(dāng)這類技術(shù)試圖在視頻中追蹤手部動(dòng)作的時(shí)候,手指的彎曲和手腕的擺動(dòng)會(huì)遮蓋住手其他的部分,因此無(wú)法全面進(jìn)行追蹤。這是這類軟件的早期版本的一個(gè)痛點(diǎn)。
而谷歌的技術(shù)則能夠在手指、手掌和手背上的21個(gè)3D點(diǎn)位上繪制出一個(gè)圖形,這樣當(dāng)手和手臂彎曲或兩根手指接觸時(shí),就能更容易理解手勢(shì)。
美國(guó)其他的大型軟件供應(yīng)商也開(kāi)發(fā)了一些技術(shù),來(lái)嘗試在個(gè)人電腦上解讀手語(yǔ)。去年,微軟與美國(guó)國(guó)家聾人工學(xué)院展開(kāi)合作,為教室配置臺(tái)式電腦,然后通過(guò)實(shí)時(shí)翻譯員幫助有聽(tīng)力障礙的學(xué)生。
在一篇博客中,學(xué)生們描述了他們之前錯(cuò)過(guò)了一些教授說(shuō)過(guò)的話,因?yàn)樗麄冊(cè)谏险n時(shí)無(wú)法同時(shí)查看人工手語(yǔ)翻譯和教授在黑板上寫的東西,得在二者之間來(lái)回轉(zhuǎn)移注意力。
但是通過(guò)讓電腦桌面顯示所有要查看的信息,這一問(wèn)題便得到解決。
在世界的其他地方,創(chuàng)新者們也已經(jīng)創(chuàng)造了他們自己的本土技術(shù)。
肯尼亞的一名25歲的開(kāi)發(fā)人員研制出了一副觸覺(jué)手套,它可以給一款A(yù)ndroid應(yīng)用程序翻譯手語(yǔ),然后該應(yīng)用程序會(huì)將對(duì)應(yīng)的文本朗讀出來(lái)。該款手套是羅伊·阿萊拉(Roy Allela)專門為他聽(tīng)力受損的侄女打造的,他的這一發(fā)明最近獲得了美國(guó)機(jī)械工程師協(xié)會(huì)的獎(jiǎng)項(xiàng)。