樹洞 Tree Hole 2.0

Reading, Caffeine, Alcohol, Peanuts, Cynicism…

從數據中發現自己? — August 25, 2017

從數據中發現自己?

又一個從 data 瞭解人與世界的實驗,如果 Everybody Lies 闡述的是宏觀角度的探索之道,Giorgia Lupi 在影片裡陳述的就是聚焦到一個人的微觀視角。也許,等我有時間看完 Williams Poundstone 的 Rock Breaks Scissors,會有不一樣的想法要說吧,sigh。

 

Advertisements
縫合碎片 #3 — June 19, 2017

縫合碎片 #3

下載羅輯思維思維團隊製作的《得到》App 已經三個月,一年過去四分之一。這三個月,試著每天早上聽每天的免費音頻節目知識新聞和「羅輯思維專欄」,也買了十來本「每天聽本書」系列的「長書摘」音頻。

除此外,這幾個月也看了不少讚揚、批評《得到》的文章,從文字的內容和語氣,很容易就分別出哪些人是出於「公心」,哪些人滿腔的「羨慕嫉妒恨」。

不管別人怎麼說,我的看法三個月來一直沒怎麼變,每天的知識新聞,即使多了萬學鋼加持,還是水水的,「乾」貨比例不大夠。至於長書摘,品質有點起伏,但是品質多半還可以,都不算太差。

但是我個人期盼許久的全本有聲書,一直沒有在中文互聯網圈子看到任何「火苗」出現。在「縫合碎片 #2」 的筆記裡,就記錄了當時我對得到團隊戰略的判斷,我想是八九不離十吧。

其實我更希望中文市場裡,能有真正的「全本」有聲書,若是得到團隊願意在這個市場試水溫,那是再好不過。不過,既然得到以「善用碎片時間學習」做為主訴求,長書摘才是他們的主戰場,我猜他們是不會碰全本有聲書這個市場的(希望我是錯的)。

不過這兩個星期,倒是找到一個「曲線救國」的方式,掌閱科技的電子書閱讀器 iReader 有朗讀功能,,雖然比不了 Audible 出品有聲書真人錄製的品質,勉強還可接受。

-

簡而言之,洗碗拖地,除了聽 Podcast 之外,又多了一個選擇。

Um, Netflix thinks its real competitor is… sleep — April 19, 2017

Um, Netflix thinks its real competitor is… sleep

羅振宇去年底跨年演講裡講的五隻黒天鵝,第一隻是「時間戰場」:

當黒天鵝起飛的時候,所有的戰場格局、地形、河流、山川全部在發生變化。 我們今天給大家的第一個答案是,有一個戰場,全新的戰場正字擺開,叫時間戰場

羅胖在講時間戰場的時候,提到 Netflix 的CEO 曾經講過:「所有爭奪時間的企業都是我的競爭對手」,最近我們又在國外媒體看到 Netflix 的掌舵人說,我們最大的競爭者是睡眠:

You know, think about it, when you watch a show from Netflix and you get addicted to it, you stay up late at night. You really — we’re competing with sleep, on the margin. And so, it’s a very large pool of time.

唯偏執狂得以生存Reed Hastings 是不是偏執狂我不知道,但他對時間的重視,無疑是需要我們好好想想的。羅胖的解讀是:

未來,在時間這個戰場上,有兩門生意會特別值錢:第一,就是幫別人省時間。第二,就是幫別人把省下來的時間浪費在那些美好的事物上。

Um, Time will tell…

Source: Amazon? HBO? Netflix thinks its real competitor is… sleep – Recode

記一次推薦系統對話 — April 16, 2017

記一次推薦系統對話

兩個禮拜前,網友從谷歌找到接近十年前關於推薦系統評估指標的舊文,跟網友在臉書上聊了幾句,有點意猶未盡;又有點想稍稍彌補當初系列文章泡湯的遺憾,所以又續貂一篇《如何評估推薦系統(二)》。

續貂之後,正在 hands-on 的網友說了幾句他的心得,於是我又多嘴了幾句。所以索性再多寫幾句,為這次對話做個小結

推薦系統早就遠離 MovieLens 那個時代,基本的框架和演算法,都相對成熟許多。而且因為確實有不少提高業務收入和客戶黏性的具體實例,產學互相刺激促進,已經發展成一個生氣蓬勃又接地氣的領域。

-

依不才愚見,推薦系統的實務,固然還有許多必須再深究、細究的題目。但是學界角度的研究,則到了一個需要重新盤整的時候了。

不只一位從學界跑到業界的推薦系統大老,說過不要擔心用什麼演算法,先建一個系統起來(Build it and they will come. 的推薦系統版本 ?),有了數據,再慢慢調整演算法和優化實做細節。

有些指標確實對發表論文有顯著意義,但是在真實世界這一個演算法和那個演算法其實沒有什麼差別。真正的現實是,目前比較好的推薦系統實蹟的例子,都有一句隱臺詞沒有說出來,系統背後有一個強大的運營團隊在搞東搞西(說的粗俗一點啦)。

演算法如果循著以前的思路走下去,當然還有許多東西可以深挖,去年 Xavier AmatriaiaACM RecSys 2016 的演講中特別提到隱式回饋(implicit feedback)的問題,設計演算法時用那些數據,不用那些數據,數據怎麼解讀,還有很多地方需要去探索。

從文獻上來看,像 usefulness 、confidence 、serendipity 這些指標的思考角度,其實早在 2004 之前就有學者已經踏出一步了,但是實務界那時還沒顧及到這個層次。

但以目前線上使用的演算法的思路,要顧及再評估系列前文 中談到的 relevance 和 serendipity,恐怕很難。過去的演算法,說穿了本質上,都是 numerical-based reasoning 的思路,促進銷路不能說沒有用,但是在 familiarity、relevance & serendipity 上這些已經觸及人類消費心理疆域的思考上,有對牛彈琴的問題。

ResysChina 的核心團隊中,有人在微信上聊到用 AI 技術,讓推薦系統往前跨一步,從滯後一步的解讀你以前是怎樣的一個人,真正往前跨到預測 你可能變成怎樣的人。竊以為這個想法值得再深鑽下去。

借用 ResysChina 發起人谷文棟兄的說法,做為一個「曾經」的推薦系統選手,心裡確實有許多遺憾,但是實在有許多課要補,才能真正面對推薦系統的詩和遠方這個問題。

至於怎麼補課天知道咯….

縫合碎片 #2 — April 12, 2017

縫合碎片 #2

自從手滑下載羅輯思維團隊出品的《得到》,已經過了一個月。剛剛使用得到 App 頭幾天,我的觀察和想法是這樣的:

得到裡面的音頻產品有幾類,第一種是付費專欄的解說音頻;第二種是《XX說書》,用 20 ~40 分鐘解說一本政經社科類的書籍,將重點精髓用盡可能最少的時間勾勒出來,讓聽者可以快速的拿來應用在生活與學習中(拿來顯擺無疑也是應用之一);第三種是企劃式的系列,比如介紹小吃的《吃貨系列》;最後一種,是每天早晨五、六則的知識新聞,我認為沒什麼[乾貨][乾貨],水水的

過了一個月,付費專欄從 19 個變成 23 個,目前我還沒訂閱過付費專欄,偶爾聽或看促銷用的「試聽」、「試讀」內容,談不上深刻印象,不足以判斷是否符合需要,符合「期望」。

原本存在的零星付費音頻完全消失,併入各個「系列」,用得到自己的說法,叫做「併入小課題」。每天凌晨更新的知識新聞,還是水水的,不過也不是全無價值,按我自己的喜好和視野,大約 1/5 的知識新聞,還是有些乾貨,或者足以點起一些些火花。

-

得到團隊確實很有活力,在各個疆域以及變現的方式,仍在不斷的嘗新和試誤。雖然客觀的說,不得不稱讚得到團隊的活力,但得到的每個變化,並不是每個都讓我感受到「進步」,有些方向,我希望得到能做的更多,走的更遠,但是得到還沒有怎麼做。

有些不屬說書系列的零星付費音頻,在併入小課題的大說法之下,不知道跑到哪裡去。或許這些音頻沒有達到回收效益門檻值,產品經理只好出手「收縮」戰線,讓他們從舞臺退下來。但是有些零星主題的音頻,其實還是蠻有意思的,就這麼找不到了(或是變得不好找了),有點可惜。

XX說書,以及「每天聽本書」系列,並不是真正的「有聲書」,嚴格來說,這些項目是比較長的書摘,再加上些許點評與總結,讓聽者可以快速分享、顯擺、咀嚼、應用。這個系列最大的問題是,每本書的錄音品質、內容總結的精準有效,差異有點大。比如《耶路撒冷三千年》的書摘,總結精簡,該提的東西一點也沒漏,比喻有趣精準,讓人聽了很有感;《海都物語》的書摘就平淡了點,比起羅胖自己為了賣這本書而錄的羅輯思維第189集《商人這物種》,精彩度就差多了。

前面兩本書,雖有高下,但品質都有一定水準,都可接受。聽書系列產品中,我最失望的當屬《三體中的物理學》,無論是錄音品質、講者口條、內容的條理分明幾個指標,我都很不滿意。

聽書系列的選材、數量,可以更多更廣,內容要更精準更吸引人。其實我更希望中文市場裡,能有真正的「全本」有聲書,若是得到團隊願意在這個市場試水溫,那是再好不過。不過,既然得到以「善用碎片時間學習」做為主訴求,長書摘才是他們的主戰場,我猜他們是不會碰全本有聲書這個市場的(希望我是錯的)。