樹洞 Tree Hole 2.0

Reading, Caffeine, Alcohol, Peanuts, Cynicism…

含金量十足的對話 — June 6, 2019
黑白人生的味道 — April 11, 2019

黑白人生的味道

用 k-means 演算法弄了一個 image sementation 的範例,順手把農曆年假期間去南寮海邊拍的照片當作測試標的,把照片降階之後,赫然發現只剩下兩個顏色的照片別有一番味道,不輸全彩的原始照片。

(從上至下,是兩色、四色、全色)

牛人與凡人的差距 — May 19, 2017

牛人與凡人的差距

-

Image Source: Wikipedia

Pedro Domingos終極算法(The Master Algorithm)這本書1裡面提到:

我在大四时,用了一个夏天玩俄罗斯方块游戏,这是一个涉及方块叠加的电子游戏,游戏中由正方形组成的各种形状的图案往下掉,你要将这些图案堆起来,堆得越紧密越好。如果图案堆到屏幕顶部,那么游戏就结束了。当时我完全没有意识到,这就是我接触NP完全问题的开始,这是理论计算机科学最重要的一个问题。

這就是牛人和凡人的差距嗎?Pedro 玩電玩想到 NP-Complete,我輩玩俄羅斯方塊,想到什麼?


  1. 這本書的簡體中文版書名是《終極算法:機器學習和人工智能如何重塑世界》,由中信出版社出版 
來塗鴉吧! — March 31, 2017

來塗鴉吧!

Google 的人工智慧研究團隊,設計了一個 A.I. Experiments 網站,展示人工智慧技術能做些什麼,裡面有個 QuickDraw 遊戲,讓你用滑鼠或是手指,依照畫面指示用20秒畫出指定的圖形,比如鴨子、犀牛、房屋、汽車,Google 研究員們利用神經網路技術,判斷你畫的像不像。這個遊戲用手指玩比較方便,用滑鼠畫畫比較不容易。

如果玩者同意,畫的圖形就提供給研究員加入資料庫,大家都聽說過了,神經網路技術技術能發揮作用靠的就是龐大的訓練集(training set),畫的越多,資料越多,QuickDraw 就越準。

有意者盍興忽來,來玩吧

機器學習 vs. 統計 — March 27, 2017

機器學習 vs. 統計

機器學習越發受到大眾矚目之後,比較機器學習和統計有什麼不同的各種說法越來越多,我自己也在各種資料上,和各種討論(打嘴炮)場合,見過和聽說過各種偏見和意見。有一點小意外, Data Mining 圈大名鼎鼎的 KDNuggets ,竟然找了投資銀行出身的 Astash Shah 來說說機器學習和統計有什麼不同?

Source: SAS Institute – A Venn diagram that shows how machine learning and statistics are related

從教科書抄出來的定義,和一般大眾的印象,得到的總結是這樣的:

Machine learning is all about predictions, supervised learning, unsupervised learning, etc.

Statistics is about sample, population, hypothesis, etc.

然後 Astash Shah 說統計是數學的分枝科目,而機器學習的理論技術則是源自人工智慧。

Machine learning is a subfield of computer science and artificial intelligence. It deals with building systems that can learn from data, instead of explicitly programmed instructions.

statistical model, on the other hand, is a subfield of mathematics.

既然內功源流不同,打磨熬煉的經脈不同,若是面對同一件事,機器學習專家和統計專家會如何描述這件事呢?老實說,從下面的例子還真不容易分出來。

ML professional: “The model is 85% accurate in predicting Y, given a, b and c.”

Statistician: “The model is 85% accurate in predicting Y, given a, b and c; and I am 90% certain that you will obtain the same result.”

最後的結論:

The difference between the two has reduced significantly over the past decade. Both the branches have learned from each other a lot and will continue to come closer together in the future.

But, understanding the association and knowing their differences enables machine learners and statisticians to expand their knowledge and even apply methods outside their domain of expertise. This is the notion of “data science” itself, which aims to bridge the gap.

好像,真的沒有什麼不同!?做投資的人,就是有辦法。

Source: Machine Learning vs Statistics – KDnuggets