AlphaGo之父:AI很快改變生活
DeepMind聯合創始人兼CEO傑米斯·哈薩比斯。圖片來源:Youtube
上周,AlphaGod與李世石的交鋒舉世矚目,AlphaGo在以其令人驚詫的成績震撼世人的同時,也讓世界看到瞭人工智能所蘊含的巨大潛力。然而,AlphaGo並不是DeepMind所開展的唯一一個人工智能計劃,甚至不是現有計劃中最重要的一個。DeepMind的聯合創始人兼CEO傑米斯·哈薩比斯在本周一次專訪中坦言,說DeepMind希望“解決有關智能的問題”,並且對此充滿樂觀。
與所有天才一樣,傑米斯·哈薩比斯的人生並不循規蹈矩。當他還是個孩子的時候,他就蟬聯瞭五屆腦力奧林匹克運動會(Mind Sports Olympiad)的全能腦力王(Pentamind Championship)稱號。在他的青年時代,他曾經供職於大名鼎鼎的牛蛙工作室(代表作有《地下城守護者》)以及獅頭工作時(代表作有《神鬼寓言》),參與瞭《模擬公園》以及《善與惡》的開發,稍後又組建瞭自己的遊戲工作室Elixir。在2000年代中期,他離開瞭遊戲業界並攻讀瞭神經科學的博士學位,最終於2010年創建DeepMind。
The Verge在AlphaGO與李世石的第一局對戰之後,同傑米斯·哈薩比斯進行瞭一次深度采訪,在采訪中他暢談瞭AI、智能手機以及機器人等話題。
以下是采訪全文:
昨天AlphaGo與李世石的對局震驚瞭世界,不過,不少人對於人工智能或者圍棋都不甚瞭解,你如何向他們解釋這兩者到底是什麼?
我希望從這幾點來說明:某種意義上來說,圍棋是完全信息博弈遊戲(perfect information games)之王,它每一步的可能性都遠分料機遠復雜於國際象棋。尤其在“深藍”獲得成功之後,解決圍棋的AI問題就成為瞭人工智能研究領域最為重大的挑戰。雖然目前來看,我們的AI的進步並不算特別卓越,但我們為此做出瞭相當多的努力。十年前,蒙特卡洛邏輯樹的發明推動瞭AI領域的進步,但將神經網絡中關於直覺的部分引入AlphaGo,才是它擊敗頂級棋手的最重要的原因:頂級棋手們最為重要的品質即是他們優秀的直覺。當我在直播過程中看到邁克·雷蒙計算目數都有些捉襟見肘的時候,感覺真的很驚訝,他可是一個九段職業選手。
AlphaGo有哪些具體的落子讓你感到震驚的嗎?
有次AlphaGo直接深入李世石具有優勢的腹地,這讓我們都很震驚——從李世石當時的表情來看,他也很震驚。沒人能夠想到圍棋可以這樣下。
是因為這一手非常具攪拌機有攻擊性嗎?
嗯,是因為這一手大膽無畏而富有攻擊性。李世石本人就以天馬行空的攻擊聞名於世,AlphaGo直接以對手的風格進行對局,這令人難以置信。在比賽之初佈局尚未穩定之時,雙方就在棋盤的各個角落展開瞭激戰。以往的圍棋程序都不擅長於對手纏鬥:他們或許精於局部計算,但缺少對全盤遊戲的大局觀判斷。
無論輸贏,這一次比賽的首要目的是為瞭對AlphaGo的能力進行評估。昨晚的比賽中給你們最大的收獲是什麼?
我想,最大的意義就是讓我們確信目前我們的工作有著長足的進展——比我們希望的要好得多。在賽前,我們對大眾宣稱比賽可能勝負各半,目前來看,這個勝率仍然是比較靠譜的:李世石是個出色的棋手,他會很快地調整自己的下棋策略,一切都有可能發生。我依然期待接下來的比賽中雙方的表現。
說說這事情對人工智能發展的意義吧。你可能聽過之前我把“深藍”與AlphaGo進行的對比:“深藍”是個“手工”程序,程序員們需要把國際象棋大師們的對局轉換為具體的行動規則以及行動邏輯;而我們讓AlphaGo有瞭自我學習的能力,它可以自我對局並從中學習,提高,這比以往的AI更像人類瞭。
如果AlphaGo一直保持勝勢,接下來會你們有些什麼計劃?會在未來開發另一個AI對戰遊戲麼?
正如我在之前所說,圍棋已經是完全信息博弈遊戲的巔峰瞭——當然,還有一些其他的圍棋高手等著我們去挑戰。而其他的一些遊戲,諸如無限制紙牌就很困難,因為它是一個不完全信息博弈遊戲(imperfect information game)。有些電子遊戲同樣充滿挑戰,比如在韓國流行的《星際爭霸》這樣的策略遊戲,它要求AI在信息不充分的條件下展現出高水平的策略能力,我們可以把這種遊戲模式稱之為“部分觀察”(partially observed)。相反,圍棋遊戲裡你可以在棋盤上看到對局所需要的一切信息,這對計算機而言,處理這個要簡單一些。
你對攻克《星際爭霸》有興趣嗎?
可能吧。不過我們隻對我們的研究范圍內的項目感興趣。雖然說AlphaGo的對局很有趣,但DeepMind的目標並不是為瞭玩遊戲,娛樂或者給大眾提供刺激。就我個人而言,我喜歡玩遊戲,也曾經是遊戲業界的一員,但遊戲歸根結底隻不過是用來測試我們算法的一個測試平臺,我們通過遊戲來測算出它們的架構和實力。但我們的最終目標還是把自己的成果運用於現實中。
我成長於1990年代後半期的英國,常常在遊戲雜志上看到你的大名和一些非常具有想象力的遊戲關聯在一起。當我看到你與DeepMind一同出現的時候就在想,“你們真是天生一對。”你是如何從遊戲界跨界到現在的領域的呢?
DeepMind算是我的畢生追求。某種程度上來說,我為此計劃並奮鬥瞭超過二十年。如果你對我過去的事業有所瞭解,那你會發現這些事情是有跡可尋的:AI的表現是我在牛蛙工作室和其他地方做的遊戲的核心。當我十六七歲的時候開始開發《模擬公園》,我就意識到AI可以強大到什麼程度,並促使我在這一領域奮鬥。由於AI的表現有趣而合理,這些遊戲賣出瞭數百萬份,玩傢至今也能樂在其中。我在遊戲業的最後幾年裡也都在這個方向努力。到瞭2000年代中期,我返回學校攻讀神經科學,主要原因是當時的遊戲業界已經不能讓我繼續深入研究AI瞭。遊戲的發行商們隻希望你趕快把遊戲做出來賣錢。
你進入遊戲界是不是因為在那個年代,遊戲是AI最廣泛的應用領域?
是這樣的,而且當時我們做的就是AI領域最尖端的技術。1990年代人工智能領域的學術研究陷入停滯,諸如神經網絡、深度學習、鞏固學習(reinforcement learning)這樣的技術還沒有得到普及。那時候最好的人工智能表現隻能體現在遊戲裡面,它們不是以現在這種學習形AI,大都以有限機械(finite-state machines)的狀態呈現,但它們已經足夠復雜,並且對於遊戲相當適應。《善與惡》這樣的遊戲瞭的AI已經擁有瞭鞏固學習的能力,我至今仍然覺得這是遊戲界最好的AI設計之一。但是到瞭2004、2005年,事情起瞭變化,遊戲開發不再像1990年代那樣充滿樂趣和創造力,那時候你隻需要想到點子並付諸實施就行。自那時起,在市場上獲得成功的要素變成瞭畫面和版權,諸如《FIFA足球》這樣的遊戲大行其道。因此我有些厭倦:在遊戲領域我把我能幹的事情都幹瞭一遍,現在開發遊戲也不那麼好玩瞭。因此我開始搜集信息,準備成立DeepMind。神經科學成為瞭我的新目標,我希望通過研究大腦的運作方式來開發新的人工智能,因此,我決定攻讀一個神經科學學位。
如果讓你把現在人工智能的成果帶回遊戲領域會如何呢?看起來這件事情是順理成章的。
嗯,我覺得這會很棒。事實上,我這兩天跟幾傢大遊戲公司,譬如說EA之類的……有過聯系。我們應該會把這個成果引入遊戲界,運用這些最新的成果可以讓遊戲AI的水平突飛猛進,因為客觀需求擺在這裡嘛。不過目前我們更願意把精力放在健康服務或是人事推薦系統這樣更加現實的事情上。遊戲業界當然是個很重要的市場,把我們的AI系統推向遊戲業界前途廣闊,而我覺得開發者們也會更樂於使用成熟的學習型AI(而不是自己開發),或許不久的將來,開發者們隻需要對AI進行微調就可以瞭。
我剛剛正好想到你是不是在傢裡打遊戲的時候,被糟糕的AI氣到過。
哈哈哈,是的。一些大型多人在線遊戲就經常讓我惱火。這些遊戲裡面的AI都很蠢,他們沒有記憶,也不會根據玩傢的行動做出改變,行為更不會進化。如果我們把學習型AI放到這些遊戲裡面,整個遊戲的可玩度肯定會大大提高。
本周你曾提到AI未來的應用領域將會集中在醫療保健、智能手機助手以及機器人學等方面,IBMWatson(IBM下屬的認知科學研究公司)已經開始瞭有關癌癥診斷方面的工作,DeepMind能為這些領域帶來什麼呢?
嗯,現在說這個可能太早瞭。我們幾周前和NHS(英國國傢醫療服務體系)宣佈瞭合作關系,但實際上這隻是構建瞭一個機械學習的平臺。在我看來,IBM Watson跟我們做的其實是兩碼事,它更像是一個專傢系統。它通過圖像來診斷癌癥,之後它或許能夠縱向地追蹤你的生理狀態,並且提供健康建議。我覺得他們的AI更偏向於鞏固學習。
在於NHS合作的同時,你們發佈瞭一個App。但現在看來這個App跟AI或者機械學習沒什麼太大關系。你們對此是如何考量的?為何要為NHS而不是其他機構開發這個應用呢?
主要因為NHS目前的軟件系統實在很差,我們的首要工作是把他們帶入21世紀。他們的系統沒有移動版頁面,對客戶的支持也並不是很友好,這一系統對於醫生,臨床醫生以及護士來說都會拖慢他們的工作效率。我們目前首要工作是提升系統的工作效率,比如把可視化工具和基礎統計工具加入系統。現在來看,我們在這一方面做得還不錯,之後我們會把更復雜的機械學習技術加入這個App。
這個合作設計的商業化交易會不會惹麻煩?顯而易見,與醫療保健機構合作在英國是個敏感話題。
嗯,確實如此。因此我們決定免費與NHS進行合作,協議也很快地達成瞭。對於大多數軟件公司來說,為一個大機構免費做一個軟件系統是不可想象的,而且通常這樣的軟件由於用戶眾多,他們也不會傾聽用戶的聲音。我們則不一樣,基本上我們還算是個創業公司,所以我們經常與用戶交流,接受他們的反饋,因此這個軟件幾乎算得上是與用戶共同開發的。
下面我們談談智能手機助手吧。我在開幕日上看到你在演講時使用瞭一張電影《她》(斯派克·瓊斯2013年拍攝的科幻電影)的海報,這是不是人工智能的終極形態呢?
並非如此。但《她》這樣的電影是讓公眾理解人工智能的最好方式。我想做的是讓智能手機助手變得真正“智能”,有條理,並且能夠真正理解用戶究竟想做什麼。目前,大多數這樣的系統並不好用,一旦你的問題超出瞭他們的模板,他們就不能給你有用的回復。因此,我們要做的是讓這些手機助手更加適用、靈活、強大。
對於這些領域,你們需要一些怎樣的突破呢?為什麼我們不能立刻著手呢?
事實上我們確實已經可以實現一些構想瞭,但是達到這些目標需要不同的途徑。在設定回應模板與機械學習之間有著巨大的鴻溝。現在的智能手機基本上是通過設定回應模板的方式來達成手機助手的功能的,因此他們的穩定性並不是很好,隻能通過模板完成工作。然而真實世界要遠遠比模板復雜得多,你不可能在模板中把所有的用戶行為都預料到。我們建立DeepMind的原則就是從原則和基礎之上進行學習。
AlphaGo成功的一個重要原因是從各種遊戲規則中進行學習,如何把這一原則應用在智能手機上(並使AI變得多樣化)呢?
是的。正是如此,AI的運行需要大量的數據計算,我們從中也可以得到不少有用的信息。事實上,在接下來的幾個月裡我們將對AlphaGo的算法再度進行修正,讓它逐漸擺脫最初的監督學習(supervised learning)模式,逐漸實行完全的自我學習,真正“從零開始”。要達成這個目前需要更長的時間,在此期間我們需要不停地調試或者檢測,但最終我相信AlphaGo可以真正地進行學習活動。
以目前的算法來看,這個目標可能實現嗎?
不不不,我們甚至可以在此之前就達成目標。算法並不會讓程序變得更加強大,隻是讓它變更純粹的學習模式而已。現在來看,我認為我們的算法可以在沒有監督的情況下運行。去年我們曾經用雅達利遊戲機(流行於70-80年代的初代遊戲機)上的遊戲讓AlphaGo進行測試,AlphaGo在我們沒有給出任何指示的情況下,就可以在屏幕上隨機作出行動來。
如果失敗判定更明顯,要達成這一目標會更簡單嗎?
如果記分更加有規則,要達成這個目標會簡單不少。在圍棋遊戲裡面,你隻有在勝負已分的情況下才能夠“記分”,但問題在於,即使你在一盤圍棋中放下瞭上百個棋子,你也未必能夠知道你能否確實獲得勝利。因此要對圍棋進行記分是一件困難的事情,我們將其稱之為“分數分配問題”(credit assignment problem)。而在雅達利遊戲裡面,你唯一的目標就是得分,因此AI也有著更多的行動參照。
你認為這些研究成果什麼時候能夠呈現在智能手機上並被大眾所用呢?
我覺得,在接下來的兩到三年裡你就可以看到這些成果的開始應用,並且對工作與生活有切實的影響。而在五六年之後,你就會發現這些技術對生活的巨大改變瞭。
在以上所有你對AI應用的預測匯總,這是不是與谷歌聯系最緊密的項目?
嗯哼。
谷歌有沒有要求你們把自己的產品整合進他們的產品線或者其他商業模式中呢?
並不是,我們在自己的研究項目中有著極大的自由度。這是我們自己的使命,也是我們加入谷歌的原因:我們可以借助谷歌的幫助加速項目的運轉。過去幾年來我們的工作狀態一直如此。當然,我們與一些谷歌自己的原型項目計劃有所合作,不過這些計劃幾乎都隻處於原型階段,谷歌也沒有近期公佈的計劃。當然,智能手機助手是目前我們研究中非常重要的部分,我們與桑達爾·皮查伊(谷歌CEO)也對此進行過對話,他認為這是谷歌未來計劃的核心。
我留意到谷歌本部有一些其他的創新部門,比如說Google Brain,他們也將機械學習應用在谷歌圖片搜索的人臉識別功能這樣的,面向大眾用戶項目上。
這些項目到處都有啊。
你們和Google Brain之間有互動嗎?你們之間的工作有重疊的地方嗎?
當然啦,事實上我們的工作呈互補的態勢。我們每周都有交流。Google Brain主要關註深度學習,他們有著傑夫·迪恩(Jeff Dean)這樣的天才工程師,他們的技術融入瞭公司的每個角落。也正是如此,我們現在可以方便地使用谷歌圖片搜索這樣的產品。不過他們是產品推進型的項目組,這點從他們的所在地Mountain View就能夠看得出來(離谷歌產品部門更近)。Google Brain的項目周期通常是一年到一年半,我們一般則是兩到三年。這是因為我們專註於算法研究,與直接的產品研發關系不大。
谷歌對AlphaGo的支持有多重要?如果沒有他們的支持,你們能夠完成這個項目嗎?
當然很重要。雖說AlphaGo對於硬件並沒有特別的需求,但是我們仍然需要大量的硬件調試各個版本的AlphaGo,並且通過谷歌的雲服務讓他們互相對戰。要實現這一目標,需要相當高的硬件配置,如果沒有谷歌的資源我們幾乎不可能在此刻就推出AlphaGo。
讓我們談談機器人吧。我目前居住在日本,而很多人認為日本是機器人的精神故鄉。根據我的觀察,在日本,機器人一般有兩個用途:諸如Fanuc這樣的公司制造工業機器人,可以完成很細化的固定工作;而軟銀旗下的Pepper這樣的公司則通常制造禮賓式機器人(concierge-style robots),這些機器人看起來意義重大,但是用途有限。你對這種情況怎麼看?
嗯,按照你的描述,我覺得Fanuc這樣的公司在機器人的設計層面做得不錯,但是他們並沒有投入大型攪拌機“智能”的研究。禮賓型機器人的話更像是現在的智能手機助手,我見過這種機器人,它們也是按照預先編寫的模板行動的,如果你做出瞭一些奇怪的舉動,他們就會懵瞭。
我想,現在最顯著的問題是“如何讓機械學習以及其他AI技術提高機器人的能力”吧?
嗯,我想這是完全不同的思路。我們人類從出生就具有學習新事物、應對未知世界的能力,而我覺得這就是機器人或者軟件應用與真實用戶的最大區別。要適應真實世界,他們必須學會學習的能力,並合理應用這一能力。
你覺得目前有哪些機器人系統應用瞭學習方案?
老實說,我們現在並沒有關註過這個問題。目前來看自動駕駛汽車算得上是會自我學習的機器人,但是AI在這方面的應用目前來看還是狹窄瞭點,雖然他們在計算機視覺方面加入瞭AI系統——特斯拉就基於深度學習技術研發瞭一個計算機視覺AI。我確信日本對這方面,尤其是年長者看護機器人或者是傢庭清掃系統方面也進行瞭一些研究。考慮到日本的老齡化很嚴重,我覺得這些研究對於日本社會的進步有著極佳的作用。
為什麼這些以學習為基礎的技術能夠對現實有更大的幫助呢?
你不妨這樣想:“為什麼我們現在還沒有這樣的的東西?”為什麼我們現在沒有能夠幫你掃地,洗衣服的機器人呢?原因很簡單,每個人的傢都不一樣,每個人都有著不同的裝修、傢具擺設。即使是在自己的傢裡,每天的狀況也不很一樣,有些時候你傢會很幹凈,有些時候則會很臟亂。正因如此,你不可能為一個機器人開發預設程序。而且每個人對衣服的折疊方法之類的也有著不同的喜好,讓機器人對這些進行判斷就太難瞭。有時候我們會覺得我們每天做的事情都很簡單,但是這些簡單的事情放在機器人身上就非常困難瞭:我們的大腦每天進行的運算都是相當龐大復雜的。
問個私人問題,你們有買過掃地機器人嗎?
呃……我們沒有,不過他們並不是很好用所以……哈哈哈。
問這個問題是因為我自己有一個,而它並不是很有用。不過我能夠發現它自己有些獨特的怪癖,而且使用它也還蠻方便的。當然,這主要與我本人比較懶有關。我想問的是,隨著機器人技術進步,怎樣的情況才能算這些機器人“足夠好”的標志呢?我們會在機器人真正能夠進行與人類相似的,有意義的交互之前就停止開發嗎?
是的,我的意思是……可能會。我覺得每個人都會以他們認為合理的價格買一個可以幫他們洗碗掃地的機器人,這些白癡機器人人氣其實挺高,但也沒什麼“智力”可言。所以,是的,我覺得每一個小小的進步都會對人類有實際的好處。
你對未來人類、機器人以及AI之間的互動、關聯有些什麼想法呢?顯而易見人們都向往美麗神奇的科幻世界。
我個人對於機器人領域並沒有太多的關註。我更關心的是這些AI能對科學的進步有多少助益,以及他們的發展能有多快。我希望AI能夠代替人類處理一些艱苦卻瑣碎的工作,比如說檢索相關的文章,從大量數據中總結出他們的結構,這樣一來人類的科學突破會有著更大的突破。幾個月前我曾經與歐洲核子研究組織(European Organization for Nuclear Research,簡稱CERN)的人進行過交流,他們有著世界上最為龐大的數據量,在那些浩如煙海的硬盤中很有可能存在著新粒子的數據,但由於數據量太多,他們還尚未被發現。所以有時候我會想某天AI能夠幫助人類找到一些全新的粒子,這種事情一定非常酷。
這段對話作為采訪結尾非常有趣。
(翻譯:劉言蹊)
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
留言列表