咨詢電話
400-682-9098
據美(mei)國(guo)每(mei)日科學(xue)網站近(jin)日報道,有史以來第一次,美(mei)國(guo)科學(xue)家研制(zhi)出(chu)的一套新(xin)系(xi)統(tong),借助語(yu)音合成器和(he)人(ren)(ren)工智能(neng),通(tong)(tong)過(guo)監控某人(ren)(ren)的大腦(nao)活動,將其想(xiang)法直(zhi)接轉化成了可(ke)理解、可(ke)識別的語(yu)音。研究人(ren)(ren)員(yuan)稱(cheng),最新(xin)研究為那些(xie)言語(yu)能(neng)力有限或無法說(shuo)話的人(ren)(ren)重(zhong)新(xin)獲得(de)與(yu)外界溝(gou)通(tong)(tong)的能(neng)力奠定了基(ji)礎(chu),也(ye)有望為計算(suan)機直(zhi)接與(yu)大腦(nao)通(tong)(tong)信開辟新(xin)途徑。
幾(ji)十年的(de)研究(jiu)表明,當人(ren)們說(shuo)話(甚至想象說(shuo)話)時,大腦(nao)中會(hui)出(chu)現明顯的(de)活動模式(shi)(shi)。當我們傾(qing)聽某人(ren)說(shuo)話或想象聆聽時,大腦(nao)也會(hui)出(chu)現可(ke)識別的(de)信號模式(shi)(shi)。專(zhuan)家(jia)們試圖記錄和解碼這些模式(shi)(shi),希(xi)望將人(ren)們的(de)想法(fa)翻(fan)譯成口頭(tou)語(yu)言。
但實現這一壯舉極具挑戰性。以前(qian)科學(xue)家進行的(de)(de)(de)(de)腦部信號解碼(ma)工作(zuo)主要集中于(yu)構建一些用于(yu)分析(xi)頻(pin)譜圖(tu)(聲音(yin)頻(pin)率的(de)(de)(de)(de)視(shi)覺(jue)表(biao)示)的(de)(de)(de)(de)簡(jian)單計算(suan)(suan)機模型,但這種方法(fa)不(bu)能(neng)產生(sheng)任(ren)何類似(si)于(yu)可理解的(de)(de)(de)(de)語音(yin)的(de)(de)(de)(de)東(dong)西。哥(ge)倫比亞大學(xue)莫蒂默·B.祖克曼(man)心腦行為研究所的(de)(de)(de)(de)莫斯尕拉尼(ni)團隊因(yin)此求諸聲碼(ma)器,這是一種計算(suan)(suan)機算(suan)(suan)法(fa),可在(zai)接受人們說話的(de)(de)(de)(de)錄音(yin)訓練后(hou)合成語音(yin)。
為了教(jiao)聲碼(ma)器解釋大腦活(huo)動,莫(mo)斯尕拉(la)尼與神(shen)經外科醫生阿希什·迪勒希-梅塔(ta)合(he)作。在(zai)研究中,他們要(yao)求接受過腦部手術(shu)的(de)癲癇患者聽取不(bu)同(tong)人說的(de)句(ju)子,同(tong)時測量他們大腦的(de)活(huo)動模式,這也是對聲碼(ma)器進(jin)行訓練(lian)。
接下(xia)來,他們要求這些(xie)患者聽說話者復述0到9之間的(de)數字,同時(shi)記錄可(ke)以通過聲(sheng)碼(ma)器運行(xing)的(de)大(da)(da)腦信號。然后,再借助模(mo)仿(fang)生物(wu)大(da)(da)腦中神經元結構的(de)人工智能(neng)——神經網(wang)絡,對聲(sheng)碼(ma)器響應這些(xie)信號所產(chan)生的(de)聲(sheng)音進行(xing)分(fen)析。
莫斯尕拉(la)尼說:“我(wo)們發(fa)現,這些人可以(yi)理解并重復75%的聲音,遠超(chao)以(yi)往任何嘗(chang)試。”
研究人員計(ji)劃接下來測試更復雜的單詞和(he)句子。他們希望該系統(tong)可(ke)以成(cheng)為植入物的一部分,將穿戴者的思想(xiang)直接轉(zhuan)化為文字(zi)。
莫斯尕拉尼說(shuo):“這將改(gai)變游戲規則。它有望讓任何失去講(jiang)話能力的(de)人,重新擁有與周圍世界聯系(xi)的(de)機會。”