誰怯場了?人工智慧程序還是足球員

Luke Dormehl 在《Thinking Machines: The Quest for Artificial Intelligence–and Where It’s Taking Us Next》談起 1960年代以 symbolic reasoning 入手的人工智慧研究的成果,順手「狠狠」的調侃了英國足球隊。立馬查了下作者的國籍,沒錯,英國人。

-

令人擔憂的是,那些在實驗室環境下表現不凡的工具並不能很好地適應現實狀況。符號人工智能主要涉及自上而下建立以規則為基礎的系統,該系統在實驗室中表現出色,各元素都能夠得到很好的控制。這些「微型世界」幾乎不包含任何物質,因此可以採取的措施也十分有限。然而,一旦進入現實世界,在訓練中表現優異的程序就像世界盃揭幕戰中的英格蘭隊一樣變得怯場了

距離本書成書時間最近的 2014 世界盃,英國在小組賽前兩場都輸,最後一場和局,以小組賽最後一名收場,難怪英國籍的作者怨念這麼深,即使寫人工智慧的書也要費篇幅修理英國足球隊。幫維基百科撰稿的鄉民更狠,一次修理兩個國家代表隊:

英格蘭的暱稱為「三獅軍團」,但因其近年世界盃及歐洲足球錦標賽不理想的表現被廣泛球迷戲稱為「三喵軍團」及「歐洲中國隊」。

比起英國和強國的球迷,不需抱任何期待,不會傷心也毋庸傷肝的臺灣球迷,究竟有沒有比較幸福?

你行嗎?

Luke Dormehl 的《Thinking Machines: The Quest for Artificial Intelligence–and Where It’s Taking Us Next》在第六章談機器人是不是有創造力,在卷首抖了一個小包袱。中信出版社的簡體中譯版的翻譯還算到位:

-

2004 年的電影《機械公敵》(I, Robot)中有一個絕妙的場景,威爾‧史密斯(Will Smith)扮演的主角有一段關於計算機的創造力的對白:「機器人能創作交響樂嗎?」他問道:「機器人能在畫布上繪出美麗的傑作嗎?」與之對話的機器人反詰道:「你能嗎?」

 

 

Will Smith 和機器人的對話原文是這樣的

Human –  “Can a robot write a symphony? Can a robot turn a canvas into a beautiful masterpiece?

Robot –  “Can you?

電影裡面,Will Smith 被機器人堵的抓耳撓腮,硬是被堵住一口氣,僵住一小會兒對話才繼續下去。按 Luke Dormehl 的看法,他是同意軟體和算法具有創造力的,若是讓他改寫劇本,他會讓 Will Smith 和機器人如何「再反詰」和「再再反詰」呢?

 

百年一幕,一脈相承

趙焰的《滿清有個袁世凱》,不知今夕何夕的感覺特別強烈,裡面的好多句子和段落,尤其當時各界賢達的自省或點評,放在今時今日的環境,完全不顯脫節,嚴絲合縫猶如今人心聲。

作者夾敘夾議的說:

在那些幼稚的人們看來,社會的運轉,完完全全地取決於政治,似乎只要一個口號,一種政體,就可以把這個世界輕輕鬆鬆地改換了局面。

這句話放在今日,要怎麼說呢,只能說,真 TMD 太對了。「只要一個口號」,呵呵。

-

民國初年面臨政體抉擇時,所謂的「國際友人」,辛辣的評語令人臉紅,但也令人拍案叫絕。一百年後,遍地都是小暴君啊。

日本《上海信使報1》業主兼主編佐原篤介,在給英國駐華記者莫里循的信中,也對中國革命的選擇充滿了失望:「無論如何,我對共和制的中國沒有信心,因為中國人不論地位高低,就其稟性氣質來說,個個都是小暴君。可是在目前,中國人幾乎滿腦袋都是可以從共和制得到賜福的想法,而不知道共和制為何物……」

說到改革,民國大總統的顧問早就說了,改革只是口頭上說說罷了:

袁世凱的英國顧問莫里循曾寫道:「至於中國,事情並未好轉,很少或全無成就。這裡看不見有作為的政治家氣魄,沒有始終一貫的目標。要做的事很多,而一切精力都用在草擬那無盡無休的規章法令上,改革只是口頭上說說

看了趙的書,不由讓人覺得,1911 的那場戲,拖了百年有餘啊!不管今時今日台前幕後的演員、編導們夸夸其言說自己的師承、立場、黨派是什麼,理想有多崇高,要說演員們不是一脈相承自 1910,我才不信


  1. 維基百科的資料說佐原篤介創辦的是上海日報,《魔都上海──日本知識人的“近代”體驗》則說佐原是上海週報的社長。佐原是當時的著名報人是沒有疑問的,但他究竟創辦的是那個報紙,則有疑問,上海市地方志辦公室網頁資料查不到佐原的名字。 

既老謀深算,又自作聰明

趙焰的《滿清有個袁世凱》說到義和團之所以在清廷上層獲得生存的倚仗,明顯是缺乏常識造成的。

-

趙說:

清廷上上下下對於義和團的判斷缺失,明顯地是缺乏常識所造成的。當歐洲在十九世紀工業化的背景下,思維已在理性和科學的軌道上行駛的時候,在東方古國,義和團民以及清國統治層的思維還停留在蒙昧的中世紀,無論是那些大權在握的官宦們,還是沒權無勢的百姓,既缺乏基礎的科學常識,也缺乏實事求是的精神和能力。他們既愚蠢,又天真;既充滿幻想,也缺乏想像力;既老謀深算,又自作聰明

這按語真好用,這會兒的廟堂中人,至今不是依然如此嗎。

Our (Like-minded) Doppelganger

-

同樣是談 Big Data ,今年五月才出版的 Everybody Lies 比起 Weapons of Math Destruction ( WMD 1),好看許多。所謂好看,是指題材震撼、故事好看,作者給讀者提示了更多未來的可能性。WMD 的題材也很吸引人,內容也夠震撼,但是作者 Cathy O’Neil 在書裡面一直不停的說「這個不道德」、「這是懲罰不該懲罰的人」、「我們要小心這是不公不義的」,雖然作者的提醒大部分是對的,但是看故事的樂趣就減了三分,看到書末不免生出「我知道這是不對的,不要再說了」的情緒。

Everybody Lies 書裡面的亮點很多,如種族問題之於美國大選、如何預估職業運動員的生涯表現、佛洛伊德的性心理學是不是現代人內心最大的壓抑等等,我猜作者 Seth Stephens-Davidowitz 在選擇題材的時候,對如何設定「鉤子」這件事,是下了大功夫的。

書裡面好幾次提到 Money Ball 和 Nate Silver 的書 The Signal and the Noise,並且從不同角度闡述 Nate Silver 的研究,對職業運動數據分析的影響。 尤其 Nate Silver 發明的 PECOTA 模型,使用尋找分身(DOPPELGANGER)的思維,預測波士頓紅襪隊球星 David Ortiz 的生涯表現,令人印象深刻。

所謂尋找分身(doppelganger),就是從數據母體(population)中,找出和你最相像的人。2009年的老爹 Ortiz,陷入生涯低潮,棒球相關媒體都預言這是他該謝幕的時候,畢竟運動員是「不許英雄見白頭」的,就像 Bill SimmonsESPN 專欄所說

Beefy sluggers are like porn stars, wrestlers, NBA centers and trophy wives: When it goes, it goes.

Nate Silver 從大聯盟球員的生涯攻守資料裡,找出和 David Ortiz 在 34歲之前的表現最相像的幾個球員,比如 Jim ThomeJorge Posada,根據這些「分身」的記錄,Nate Silver 斷定 David Oritz 的職業球員生涯還不到結束的時候。事實證明,Nate Silver 是對的,Seth 說的有趣 But for Ortiz’s doppelgangers, when it went, it came back.

就如作者所說,Doppelganger searches are promising in many fields, not just athletics。尋找分身,不就是推薦系統的文獻裡面,提到「協同過濾」的精髓,常常用的字眼 like-minded 嗎?推薦系統商用化的先驅者 Netflix、Pandora 和 Amazon,都是深知 doppelfanger 威力的好例子啊:

And this is how Netflix figures out the movies you might like. The impact has been so profound that when Amazon engineer Greg Linden originally introduced doppelganger searches to predict readers’ book preferences, the improvement in recommendations was so good that Amazon founder Jeff Bezos got to his knees and shouted, “I’m not worthy!” to Linden.

很巧,今年 IEEE Internet Computing 恰逢 20 週年紀念,選出這二十年來,對網際網路產業影響最深遠的文章, 編輯們把 The Test of Time 殊榮給了 Greg Linden 為協同過濾研究奠基的 Amazon.com Recommendations: Item-to-Item Collaborative Filtering

從 like-minded 到 doppelganger 。同一個思維,不同的闡述方式,在不同的領域得到不同但是一樣耀眼的結果,這就是所謂的萬法歸宗


  1. 作者 Cathy O’Neil 把具有莫大傷害的大數據模型 Weapons of Math Destruction 簡稱為 WMD 

很傻很天真

-

私心以為,Weapons of Math Destruction 這本書的基調就是「很傻很天真」,作者 Cathy O’Neil 不惦惦悶聲的做個金領 quant,反而跳出來告訴大家這裏有很多不公不義之事,你們千萬要小心啊。有點 naïve ,不是嗎?

所謂的 naïve,雖沒有貶義,但不免帶點唏噓和遺憾。良藥苦口,中肯實在的話不好聽啊

閱讀這本書的時候,字裏行間彷彿可以看見作者抿嘴不甘的畫面。在遍歷各個「幹壞事」的模型時,常常可以見到「我知道資本主義社會就是這樣運作的,但是我一定要說,這是不對的」,「這樣做,是懲罰貧窮,不是因為他做了什麼」這樣的句子。

尤其「天真」的是,作者在書末《結論》大聲呼籲,大數據分析的從業者一定要記得,設計演算法、建立模型的時候,一定要把公平(fairness )放在效率前面,不能「有意」做不道德的事情。很傻很天真,或許是吧?

另外一方面,作者也不時提醒讀者,你們千萬不要很傻很天真,以為大數據帶給你們的是從此幸福快樂的生活,不論貧富智愚,你們都可能是思慮不清甚至立意做惡的大數據分析模型的受害者啊!

要言不繁,這本書的基調就是 naïve 啊。說到底,這天真是苦的啊。

從來不學什麼,也不忘記什麼

時代變了,自從有了谷歌,有了維基百科,我們是不是還需要教孩子背誦和解方程式?谷歌重塑、接管我們的教育系統,是不是我們的最佳選項!?擔任谷歌高管的 Jonathan Rochelle 當然說凡事 ask google 就對了,但是答案真的那麼簡單,那麼 promising 嗎?

-

傅月庵在《一心惟爾》裡說到 Jean-Claude Carrière 和 Umberto Eco 關於書的對話,Jean-Claude Carrière 對電腦、讀書與記憶的關係,提出一連串非常深刻的問題:

如果現在我們掌握了一切的一切,不經篩選,我們在終端機上擁有無線量資訊,那麼記憶是什麼?這個詞的意義為何?當我們身邊有個電子僕人可以回答我們所有問題,甚至連我們問不出來的問題它也知道答案,那還有什麼是我們該知道的?當我們的輔助器具什麼都知道,無所不知,那還有什麼是我們該學的

如果有那麼一天,我們每個人都是路易十四,從來不學什麼,也不忘記什麼!在維吉尼亞大學心理系執教的 Daniel T. Willingham 教授在紐約時報的文章講的好,沒有結合 context 的思考,我們還能學會什麼?