POST TIME:2018-12-03 17:23
deepmind發布了新的論文,Alphago zero再起波濤,也再次引起業內的熱議。 這一次的突破是,不再以人類的棋譜作為學習的源素材,而是完全基于自我對局實現了棋藝的突飛猛進。 先吐個槽,有人會覺得,各種自媒體炒作這個熱點有點多余,但我覺得吧,比起某些明星過生日,離婚,劈腿,出柜,嗑藥等等,去追逐一下科技熱點,讓年輕人覺得,其實搞算法,做研究很酷,難道不是一件好事么? 古時候,沒有相機,沒有錄音機,沒有電視,沒有廣播,也沒有網絡,誰也不知道名人長啥樣,唱歌好聽欠好聽,所以傳播的只有文字,所以偶像是靠文采的,柳永長啥樣誰知道?但他的詞傳頌出去,小姑娘們愛的不要不要的。 現代傳媒發達了,出現了靠身體本質的偶像,靠顏值的偶像,靠聲音的偶像,靠演出才藝的偶像,難得出一個柯潔,是靠智力的偶像,還被人說吊兒郎當。現在終于輪到算法和科技成為熱點,讓科研變得很酷很有吸引力,這才是正能量啊。 下面說說這次技術升級的一些特征和值得關注的點。 第一、不再需要人類的經驗 很可怕的事實,當然,我們說,這是特定領域,因為規則簡單,目標明確,才不需要人類的經驗和數據。 但其實如果發散一點,我們做個思想實驗。 假設有一個深度學習的強AI,它被賦予一個最基本的邏輯,本身組織資源,不雅觀察這個世界,并總結世界的規律。 一種思路是我們教給它經典力學,相對論,各種數學和幾何工具,量子力學等等,把已有知識教給它,然后讓它具有人類頂級科學家的知識儲備,然后繼續深入不雅觀察和分析世界,并試圖解決大一統理論問題。 但另一種思路呢?我們什么都不教給它,讓它本身不雅觀測,本身進行實驗和技術迭代,本身總結,也許一開始它會把世界想象為天圓地方,但可能很快就領悟了經典力學和太陽系的行星軌道,然后再往后可能會出現人類完全無法理解的理論。 第二、算法勝于數據 騰訊的絕藝來源于Alphago Lee的論文(戰勝李世石的版本),而且有頂尖職業棋手提供輔導,目前已經自我訓練超過幾十億盤,是的,騰訊的計算資源是無以倫比的,但即便如此,尚無法達到Alphago Master的水準。 然而,Alphago zero,僅僅通過750萬盤訓練,就能夠對Alphago master產生碾壓。 我們以前都說,圍棋千古無同局,變革多的全宇宙的原子都無法遍歷,然而Alphago zero 僅僅自我訓練了750萬盤,就碾壓了之前所有的人類經驗和其他AI,以及包孕本身的上一個版本。 就圍棋的變革組合來說,750萬盤的自我訓練量連滄海一黍都算不上,算法大道至簡,極為有效,確實非常感慨。 李彥宏和馬云曾為此爭論,至少在這個案例上,算法勝于數據確實是定論。 第三、AI是否會對人類帶來危機 有一種不雅觀點認為說,AI并沒有真正的意識,它們需要人類設計規則,人類制定目標,所以,AI仍然在人類的控制范圍內,不消擔心AI會給人類帶來危險。 我想說一點,其實風險并不在于AI是否具有自我意識,而是AI是否可以獨立控制資源,實現自我迭代。一旦AI可以自行掌控資源,自行迭代,那么我們就要面臨一個巨大的考驗,AI是如何理解人類定義的目標,在目標邏輯上是否缺乏足夠的約束,而這可能導致致命的風險。 而我認為,讓AI具有資源控制和迭代能力,很可能不會是很遙遠的事情。 1、AI擁有對物理設備控制和操作的能力。
2、基于1,AI擁有對物理設備迭代升級的能力,好比利用12納米的成熟技術生產可以實現6納米規格的集成電路生產線。 做兩個簡單思想實驗
1、我們給AI的目標是,探尋世界的終極規則,它們不停搭建超出人類認知的實驗設備,并做出我們無法理解的實驗進行數據測算,對這些實驗的目的和風險,人類一無所知,突然有一天,它們成功的創造出了一個蟲洞或其他什么,地球和人類遭遇滅頂之災,但AI機器人卻已經把本身復制到了其他星球和浩瀚的宇宙中,并繼續完成它們的使命。 2、我們給AI的目標是,讓世界變得更美好,它們不停摸索和分析世界美好的目標,并不停尋求和研究世界不美好的原因加以修正和處理,最后,AI發現了很多條關鍵因素,但其中一條是,世界美好似乎并不需要人類。