高新技術企業(yè)認定 增值電信業(yè)務 ISO體系認證 CMMI軟件成熟度認證 專精特新企業(yè)認定 新技術新產品
李彥宏說互聯網的下一幕就是人工智能。機器學習是其中熱門的分支之一,主要研究如何在經驗學習中改善具體算法的性能。機器學習有著光輝的愿景,但眼下卻存在一些難以克服的障礙。TechRepubic網站撰文,從技術角度分析了為什么會出現這些困難。以下是原文翻譯:
專家們紛紛炒作人工智能和機器學習就是未來的一切??墒敲總€對Siri喊過話的人都明白Siri在對我們提問的基本理解上還很欠缺。我們離實現人工智能的理想也還有很長的路要走。
人工智能和機器學習有哪些難以克服的難關呢?
第一個可以歸結為信任。Google研究主任Peter Norvig的一份聲明中表示,我們看不到機器內部來真正明白正在發(fā)生什么:“機器學習產生的東西并不是代碼,而是被稱作一個黑盒。里面發(fā)生的事情我們知道一點,但并不能把握全部?!?/span>
第二個原因是很難教會一個機器足夠多的東西,去理解語境和上下文。Facebook的人工智能研究員Yann LeCun稱,想要機器達到無障礙溝通,需要讓機器理解這個世界是如何運轉的,需要學習大量的背景知識,感受在任何給定的時刻里這個世界所處的狀態(tài),并且還要有理性和計劃。
這是個不小的壯舉。
以一種精確的方式去做這件事的麻煩在于,我們“喂”給機器的數據必然被人的主觀性所左右。但這一點很難避免。
最后,機器學習的困難之處還在于進入它的編程,Norvig指出:
“缺乏明確的抽象壁壘”,讓調試更加困難,因為它很難隔離一個bug;“非模塊性”(non-modularity),如果你改變了其中一部分,你最終就改變了一切;“不穩(wěn)定性”——需要持續(xù)輸入新的數據;“這是誰的數據?“涉及到隱私、安全性和公平性的問題;缺乏足夠的工具和流程進行傳統(tǒng)軟件的開發(fā)。
盡管看起來困難重重,但是未來的曙光仍落在機器學習和人工智能上。
我們曾經生活的世界是一個相對有序、整齊的關系數據庫,現在的世界則是一團亂麻,一個松散的、半結構化的關系數據庫。但是我們缺乏數據基礎設施來構建。在用了Apache Hadoop, Apache Spark等等NoSQL數據庫,我們終于獲得了正確的工具,以一個合適的價格(免費、開源)來處理我們的數據。
但是我們還在努力尋找這個龐大混亂的數據庫中隱含的模式。在這方面,機器學習將變得無比重要。Nervana公司的聯合創(chuàng)始人和CEONaveen Rao說:“我的聰明之處大概是在數據中找出結構的能力。”這并不是說今天機器可以以人力難及的方式解釋這個世界。它們所做的事情是在看起來雜亂無章的海量數據中找出結構,而在同樣的時間里人腦不可能發(fā)現其中的模式。
解決問題的訣竅在于讓機器和人類協同工作。這是未來十年人工智能和機器學習的挑戰(zhàn)所在。盡管機器學習有其內在的困難,人工智能和機器學習還是值得期待的。
關注公眾號
在線客服