人工智能的發(fā)展還有一段較長(zhǎng)的路要走,現(xiàn)有人工智能研究主要側(cè)重于性能方面的突破,但可靠性是一個(gè)不可忽視的問(wèn)題,下面列舉幾個(gè)典型問(wèn)題:
(1)第三方刻意攻擊對(duì)語(yǔ)音識(shí)別準(zhǔn)確率的影響
據(jù)《新科學(xué)家》報(bào)道,來(lái)自以色列巴伊蘭大學(xué)的研究人員和 Facebook 的人工智能團(tuán)隊(duì)已經(jīng)表明,可以對(duì)音頻剪輯進(jìn)行細(xì)微地調(diào)整,使語(yǔ)音識(shí)別系統(tǒng)理解出與音頻完全不同的內(nèi)容,但是這些細(xì)微的調(diào)整并不會(huì)影響人類(lèi)對(duì)音頻的正確理解。
實(shí)際上,這樣的情況并不僅限于語(yǔ)音識(shí)別,在圖像識(shí)別等領(lǐng)域同樣存在。在訓(xùn)練人工智能系統(tǒng)的過(guò)程中,在正常的輸入樣本中故意添加細(xì)微的干擾以誤導(dǎo)機(jī)器學(xué)習(xí)算法,使人工智能系統(tǒng)產(chǎn)生錯(cuò)誤的結(jié)果,這種添加了細(xì)微的干擾以誤導(dǎo)機(jī)器學(xué)習(xí)模型的樣本,就是“對(duì)抗樣本”。
(2)第三方刻意攻擊對(duì)無(wú)人駕駛可靠性安全性的影響
無(wú)人駕駛安全性應(yīng)該是無(wú)人駕駛研發(fā)的突出問(wèn)題。如果有人惡意使用對(duì)抗樣本,它可以用來(lái)欺騙自動(dòng)駕駛汽車(chē),使其不能識(shí)別道路上的停車(chē)標(biāo)志,進(jìn)而引發(fā)事故;可以欺騙語(yǔ)音識(shí)別系統(tǒng),讓系統(tǒng)聽(tīng)到虛假的命令;可以將一只貓識(shí)別成一條狗;可以將惡意軟件誤分類(lèi)為良性軟件,也可以阻止閉路電視監(jiān)控系統(tǒng)在人群中找出嫌犯。而由對(duì)抗樣本引發(fā)的欺騙策略也就是常說(shuō)的“對(duì)抗性攻擊”。
Cissé 發(fā)現(xiàn),自動(dòng)駕駛汽車(chē)中的圖片分類(lèi)算法可能會(huì)忽略行人和停放的車(chē)輛。他說(shuō):“我認(rèn)為我們應(yīng)該擔(dān)心我們?nèi)绾未_保汽車(chē)中使用的神經(jīng)網(wǎng)絡(luò)是安全的”。 Cissé 的團(tuán)隊(duì)將少量的數(shù)字噪音引入到一個(gè)人的錄音片段,并將該錄音播放給谷歌語(yǔ)音(Google Voice)這款語(yǔ)音識(shí)別應(yīng)用程序。在這個(gè)對(duì)抗性的示例中,該應(yīng)用程序聽(tīng)到了一個(gè)與事實(shí)完全不同的句子。
但是,并不是所有人都認(rèn)為對(duì)抗性攻擊將會(huì)在現(xiàn)實(shí)世界中發(fā)揮作用。伊利諾伊大學(xué)香檳分校的大衛(wèi)?福塞斯(David Forsyth)建立了一個(gè)經(jīng)數(shù)字化改變的虛假的停車(chē)標(biāo)志試圖欺騙這種算法。
雖然沒(méi)有證據(jù)表明對(duì)抗性攻擊已經(jīng)被用于現(xiàn)實(shí)世界中,但是牛津大學(xué)的 Marta Kwiatkowska 說(shuō),這只是時(shí)間問(wèn)題;機(jī)器學(xué)習(xí)可能會(huì)被用于攻擊系統(tǒng)。需要做出更多的研究去發(fā)明新的機(jī)器學(xué)習(xí)技術(shù)抵御對(duì)抗性攻擊。
或許最有趣的是,找到一種避免人工智能系統(tǒng)被對(duì)抗樣本欺騙的方法是相當(dāng)困難的。正如我們過(guò)去解釋的那樣,我們并不理解深度神經(jīng)網(wǎng)絡(luò)的內(nèi)在工作方式,這也意味著,我們并不知道為什么神經(jīng)網(wǎng)絡(luò)能夠接受聲音片段和圖像中的細(xì)微特征,而人類(lèi)卻不能覺(jué)察到。
(3)信息內(nèi)容的可靠性
基于大數(shù)據(jù)的智慧城市,離不開(kāi)網(wǎng)絡(luò)信息的提取與支撐?,F(xiàn)代社會(huì)網(wǎng)絡(luò)信息極度豐富,作為當(dāng)前網(wǎng)絡(luò)信息檢索的主要工具,搜索引擎已成為人們?cè)L問(wèn)互聯(lián)網(wǎng)資源的有效途徑。其中,用戶(hù)反饋是算法優(yōu)化、系統(tǒng)維護(hù)和性能評(píng)估的重要手段,也是網(wǎng)絡(luò)搜索和知識(shí)挖掘的重要研究領(lǐng)域之一,已越來(lái)越受到研究人員和系統(tǒng)開(kāi)發(fā)者的關(guān)注。作為用戶(hù)反饋的傳統(tǒng)模式,手工評(píng)價(jià)需要耗費(fèi)大量的人力和時(shí)間資源,難以大規(guī)模地實(shí)時(shí)開(kāi)展。因此,如何有效挖掘和利用網(wǎng)絡(luò)用戶(hù)檢索反饋的群體智慧信息已受到研究界的廣泛關(guān)注。
真實(shí)網(wǎng)絡(luò)檢索環(huán)境下的用戶(hù)點(diǎn)擊行為信息往往含有大量噪音,其中摻雜了包括網(wǎng)絡(luò)爬蟲(chóng)等非正常的網(wǎng)絡(luò)用戶(hù)。Joachims展開(kāi)了一項(xiàng)稱(chēng)為眼睛跟蹤研究,結(jié)果表明個(gè)體用戶(hù)的點(diǎn)擊信息由于搜索引擎結(jié)果排序、內(nèi)容展示等多方面原因而具有偏向性,搜索查詢(xún)和點(diǎn)擊文檔之間沒(méi)有明顯的絕對(duì)相關(guān)性。上述相關(guān)研究表明,有必要對(duì)網(wǎng)絡(luò)用戶(hù)的行為日志進(jìn)行分析,進(jìn)而提煉網(wǎng)絡(luò)用戶(hù)點(diǎn)擊的有效信息,過(guò)濾噪音。當(dāng)前用戶(hù)行為信息的研究方法主要基于大規(guī)模用戶(hù)點(diǎn)擊行為的宏觀統(tǒng)計(jì)分析,此類(lèi)分析方法適用于處理用戶(hù)訪問(wèn)頻度高的熱門(mén)詞查詢(xún),不適合處理用戶(hù)訪問(wèn)量較小但數(shù)量眾多的長(zhǎng)尾詞查詢(xún),也不適合應(yīng)用于用戶(hù)的個(gè)性化搜索,針對(duì)不同興趣的用戶(hù)有區(qū)別地返回搜索結(jié)果。
上面列舉的三個(gè)問(wèn)題是僅僅近期網(wǎng)絡(luò)上關(guān)注的,在此僅作拋磚引玉之用。任何產(chǎn)品的研發(fā),質(zhì)量與可靠性方面是產(chǎn)品的核心競(jìng)爭(zhēng)力之一。若要提高人臉識(shí)別、語(yǔ)音識(shí)別、無(wú)人駕駛汽車(chē)等人工智能產(chǎn)品的可靠性水平,不僅僅要關(guān)注硬件,更為關(guān)鍵的將是軟件。
參考了以下文章:
https://www.technologyreview.com/s/608381/ai-shouldnt-believe-everything-it-hears/
http://www.sohu.com/a/168112664_505819