首頁 > 知識干貨 > 為什么機器學習這么困難？

為什么機器學習這么困難？

2016-11-22

李彥宏說互聯網的下一幕就是人工智能。機器學習是其中熱門的分支之一，主要研究如何在經驗學習中改善具體算法的性能。機器學習有著光輝的愿景，但眼下卻存在一些難以克服的障礙。TechRepubic網站撰文，從技術角度分析了為什么會出現這些困難。以下是原文翻譯：

專家們紛紛炒作人工智能和機器學習就是未來的一切?？墒敲總€對Siri喊過話的人都明白Siri在對我們提問的基本理解上還很欠缺。我們離實現人工智能的理想也還有很長的路要走。

人工智能和機器學習有哪些難以克服的難關呢？

第一個可以歸結為信任。Google研究主任Peter Norvig的一份聲明中表示，我們看不到機器內部來真正明白正在發(fā)生什么：“機器學習產生的東西并不是代碼，而是被稱作一個黑盒。里面發(fā)生的事情我們知道一點，但并不能把握全部?！?/span>

第二個原因是很難教會一個機器足夠多的東西，去理解語境和上下文。Facebook的人工智能研究員Yann LeCun稱，想要機器達到無障礙溝通，需要讓機器理解這個世界是如何運轉的，需要學習大量的背景知識，感受在任何給定的時刻里這個世界所處的狀態(tài)，并且還要有理性和計劃。

這是個不小的壯舉。

以一種精確的方式去做這件事的麻煩在于，我們“喂”給機器的數據必然被人的主觀性所左右。但這一點很難避免。

最后，機器學習的困難之處還在于進入它的編程，Norvig指出:

“缺乏明確的抽象壁壘”，讓調試更加困難，因為它很難隔離一個bug；“非模塊性”（non-modularity），如果你改變了其中一部分，你最終就改變了一切；“不穩(wěn)定性”——需要持續(xù)輸入新的數據；“這是誰的數據?“涉及到隱私、安全性和公平性的問題；缺乏足夠的工具和流程進行傳統(tǒng)軟件的開發(fā)。

盡管看起來困難重重，但是未來的曙光仍落在機器學習和人工智能上。

我們曾經生活的世界是一個相對有序、整齊的關系數據庫，現在的世界則是一團亂麻，一個松散的、半結構化的關系數據庫。但是我們缺乏數據基礎設施來構建。在用了Apache Hadoop, Apache Spark等等NoSQL數據庫，我們終于獲得了正確的工具，以一個合適的價格（免費、開源）來處理我們的數據。

但是我們還在努力尋找這個龐大混亂的數據庫中隱含的模式。在這方面，機器學習將變得無比重要。Nervana公司的聯合創(chuàng)始人和CEONaveen Rao說：“我的聰明之處大概是在數據中找出結構的能力。”這并不是說今天機器可以以人力難及的方式解釋這個世界。它們所做的事情是在看起來雜亂無章的海量數據中找出結構，而在同樣的時間里人腦不可能發(fā)現其中的模式。

解決問題的訣竅在于讓機器和人類協同工作。這是未來十年人工智能和機器學習的挑戰(zhàn)所在。盡管機器學習有其內在的困難，人工智能和機器學習還是值得期待的。

崇左即嘉新能源有限公司

知識產權

工商財稅

數字化建設

資質認證

人事服務

為什么機器學習這么困難？

推薦閱讀

崇左即嘉新能源有限公司

知識產權

工商財稅

數字化建設

資質認證

人事服務

為什么機器學習這么困難？

推薦閱讀

為什么機器學習這么困難？