小玲子漫遊雲端.

鬼谷子是春秋戰國時期一位通天徹地的奇人，相對于莊子、墨子、荀子等人來說，精通百家學問，幾千年來受到道家、兵法家、縱橫家、謀略家等各家推崇，影響深遠。戰國時期李悝在鬼谷子學說的基礎上，總結出識人五法，通過這五種方法能考察一個人的品性和將來取得的成就。一、樂之以驗其僻。如果你想要了解一個人，通過他的喜好就能夠看出來，因為一個人在做自己真正喜歡的東西的時候，是不會有很大的戒心的，這個時候所呈現出來的也是最真實的一面，所以說通過了解對方的喜好，然后再去分辨他是否可交，是一個非常實用的選擇。二、觀其感變，以審常度。觀察他平時處理緊急事務的能力，這是最能看出一個人處理事情的能力，而且在緊急情況下，做出的判斷一般都是他最真實的反應。如果他并不能很好的處理，特別慌亂的話，就證明他抗壓能力不行，不能將重大事情拜托于他。三、達視其所舉。身處高處時，看他舉薦的人才和任命的部下都是一些什么樣人。從古至今，成大事的人都是交到了好的朋友，有了用的都是賢才，而不管雙方的私交如何。反之，一個目光短淺者任人唯親的人，一人得道雞犬升天，最后把事情弄得烏煙瘴氣。像這樣的人是成不了什么大事的，如果你身邊有，最好敬而遠之。四、貧視其所不取。這句話，也就是說，如果一個人在自己非常貧窮的時候沒有去取那些不義之財，說明這個人的品格非常的高尚。他們會憑借著自己的堅持，最終有一個很好的結果。還有的人如果一旦經受了貧窮的生活，那么他們就會干一些見不得人的勾當，這種人是會為了一些小的利益，就把自己的親朋好友給出賣了。五、哀之以查其人。成功者往往有著強大的內心且極具韌勁，故此，使他感受到哀傷、失敗，就此來考察他的韌勁與為人，成大事者不懼失敗，從哪里跌倒就會從哪里站起來，而如果受到一點點的打擊，就一蹶不振的人，終究成不了大事兒，所以說，想要識破一個人，掌握住這點也很重要。

(繼續閱讀...)

sss66sf33f 發表在痞客邦留言(0) 人氣()

▲top

技巧一：時間管理要和你的價值觀吻合如果沒有明確的價值觀，很難判定哪些是你生命中重要的事情。與其管理時間，不如分配時間。你永遠沒時間做每件事，但是你又時間做對你重要的事。技巧二：設立明確的目標時間管理只是方法，目標才是王道。你可以把年度4到8個目標寫出來，依次排列重要性，制定計劃。技巧三：改變你的態度拖延，每個人或多或少都會有，不要企圖一下子就能夠推翻你的整個習慣，你要做的就是強迫自己現在就去做你所拖延的事情。然后，每天從你的工作計劃中挑出你最不想做的事情先去做。技巧四：遵循80//20原則把時間和精力花費在足夠影響到你未來的20/%的事情上面。技巧五：安排一段不被打擾的時間每天至少要有半小時到一小時的“不被干擾”時間。假如你能有一個小時完全不受任何人干擾，把自己關在自己的空間里面思考或者工作，這一個小時可以抵過你一天的工作效率，甚至有時侯這一小時比你3天工作的效率還要好。技巧六：嚴格規定完成期限“你有多少時間完成工作，工作就會自動變成完成需要多少時間。”（帕金森定律）如果你有一整天的時間可以完成，那么工作就會變成一天才能完成；如果只有一個小時完成工作，那么你就會在這一個小時內做完它。技巧七：做好時間日志把你每天花費多少時間在做什么事情上，你就會清晰發現你在哪些方面浪費了時間，只有知道了時間用在哪里，才能更好地利用。關于這一點，大家可以閱讀柳比歇夫的《奇特的一生》這本書。時間記錄的方法有很多，可以用紙質本記錄或者用手機APP記錄，只要適合自己的就可以。技巧八：樹立時間大于金錢的意識我們經常會陷入這樣的一個誤區：為了省幾塊錢和賣家爭得面紅耳赤，吵得不可開交。其實只要自己是能夠承受的范圍內就行，沒必要花費時間和別人爭吵，既浪費時間又影響心情。再比如想當初逛淘寶只是為了省錢，結果沉溺其中，每天都要花時間去比較價格，不能自拔，還以此為樂，每天的大多數時間浪費其中。在自我成長方面，我們可以用金錢換取別人的經驗，向牛逼的人學習，使自己更進一步，不要吝惜金錢忘了投資自己的未來。技巧九：學會列清單把自己需要做的事情列成清單，這樣做能夠讓你對自己的計劃明確，而其能夠產生緊迫感去完成這件事。技巧十：同類的事情合并一次性完成假如說你要整理資料，那你那段時間可以和整理辦公室一起完成，拜訪同個路線的或者順路的客戶，需要打電話的時候一次性打完。在分享了十大技巧之后，下面和大家分享下有關時間管理的6個竅門1、合理分配娛樂時間。娛樂時間要有，但是不要過多投入。2、不同的時間段做不同的事情。必須要有機會利用長時間做大事又能利用零碎時間做小時的本事。如何利用零碎時間，以下幾點可以參考：a、利用排隊等人或者坐車上下班的時間做一些“可以隨時被中斷的事情”。比如說看看新聞，或者看看自己喜歡的文章和漫畫之類的。b、一時多用，學會統籌時間。c、可以一分鐘搞定的事情絕不拖延。3、不要讓別人浪費自己太多的時間。4、在做一件事的時候想著如何高效完成，以免重復勞動，避免浪費時間。5、如果有選擇困難癥的時候，不管選擇A或者B 都不會有太大的影響，那就隨意選擇一個。6、有些事情，該慢就慢。工作要快，生活要慢。以上就是我的一些分享，大家如果感興趣的話可以繼續關注我們的公眾號（某一天BuildYourLife：ToBest-2016），在以后的日子里，將會分享更多關于時間管理的文章，敬請期待。本文為頭條號作者發布，不代表今日頭條立場。

(繼續閱讀...)

sss66sf33f 發表在痞客邦留言(0) 人氣()

▲top

所有人都離不開鹽，因為大家都知道做菜不放鹽的話，那味道是簡直了！當然了，所有人也都應該知道，鹽是維持機體正常生命活動的必須物質。如果沒有鹽的話，一個人就活不下去。人可以去超市買鹽，然后做飯的時候加進去吃。那么動物們沒有超市去買鹽，難道它們就不吃鹽嗎？動物不需要鹽嗎？說實話，提這個問題有點兒缺乏常識了，動物們當然要吃鹽，它們當然不用去超市就可以吃到鹽！生物對鹽的追求是從生命之初就奠定了的大家都知道，地球上的生命起源于海洋，而這就決定了我們最基本的身體機能模式——機體必須要維持滲透壓的平衡。這對于陸地上的動物來說的話，就是水鹽平衡！在這個根本需求下，鹽分的重要性普遍存在于陸生的脊椎和非脊椎動物中。當然，哺乳動物對于鹽分的需求量更大，因為我們排汗、排尿量都比較大，因此鹽分流失嚴重。那大型哺乳動物們都怎么攝入鹽分呢？對于食肉動物來說，這不是一個特別困難的事情。因為動物的血液和內臟都含有大量的鹽分，它們可以在捕食中順便獲得足夠的鹽分。而對于食草動物來說，獲取鹽分就麻煩多了，它們要去舔舐一些礦物鹽。比如說野牛和山羊會不惜長途跋涉到富含鹽分的天然礦獲取鹽分，很多山羊也有通過舔舐石頭和尿液來獲取鹽分的行為。有一個有趣的故事：在美國的一些國家公園中，原本膽小、謹慎的雪羊卻反常的對游客十分親近。原來是因為雪羊可以從游客留在欄桿上的汗漬，或者是石頭邊的一泡尿中，來獲取到鹽分！再者就是蝴蝶，它們會到河流邊大量的飲水，然后再排除多余的水分，從而積累到足夠的鹽分。還有就是家畜，像是羊、牛等，會有舔舐墻根的行為，其實這就是它們在吃墻上析出的鹽。

(繼續閱讀...)

sss66sf33f 發表在痞客邦留言(0) 人氣()

▲top

虎嗅注：本文作者李沐，前百度員工，大規模機器學習和優化算法等方面的大牛，在別人繼續在職場高歌猛進，或者創業淘金的時候，毅然決然選擇了另一條路：跑去卡內基梅隆大學（Carnegie Mellon University，簡稱CMU）讀博士，師從機器學習專家Alex Smola，并且一去就是五年。他在今天發表在知乎上的文章中說，“人一生要工作五十年，為什么不花五年來追求下理想和情懷呢？”倒是也沒耽誤，在完成了最后一個博士報告后，沒有留戀，就踏上了回國的航班。他說：“回想過去的五年，是折騰的五年，也是自我感悟和提升的五年。這里我嘗試記錄這五年主要做過的事情和其中的感想，希望對大家有所啟發。”以下是他的8000多字長文，希望對每一個看到的人都有啟發，讓你的情懷和理想都更豐滿一些。前言12年8月提著一個行李箱降落在匹茲堡機場。沒找住的地方，也不知道CMU應該怎么去。對未來一片迷茫，但充滿樂觀。現在，剛完成了博士期間最后的一場報告，在同樣的機場，不過是在等待離開的航班。回想過去的五年，是折騰的五年，也是自我感悟和提升的五年。這里我嘗試記錄這五年主要做過的事情和其中的感想，希望對大家有所啟發。第0年：3//11-8//12我第一次申請美國的博士是在11年，但拿到的offer并沒有特別合適的導師，于是就北上投奔文淵去了。我當時在百度商務搜索部門做廣告的點擊預估。具體是使用機器學習來預測一個廣告是不是會被用戶點擊。這時候離“大數據”這個詞流行還有兩年，但百度那時候的數據即使現在來看仍然是大的。我的任務是如何高效的利用數百臺機器快速的在數十T的數據上訓練出模型。當時產品用的算法基于LBFGS，我于是想是不是可以換個收斂更快的算法。沒幾天就找到個不錯。但實現上發現了各種問題，包括性能，收斂，和穩定性。而且那時有的就是一個裸的Linux和很老版本的GCC，什么都是需要從頭開始寫。花了大量時間做系統優化，算法改動，和線上實驗，最后一年后在整個廣告流量上上了線。現在再回顧會覺得整個一年時間都在打磨各種細節上，有時候為了5/%的性能提升花上上千行代碼。這些都導致算法過于復雜，有過度設計之嫌。但深入各個細節對個人能力提升很大，而且很多遇到的問題成為了之后研究方向的來源。一些算法上的思考曾寫在這里，當時候深度學習剛剛出來，冥冥中覺得這個應該是大規模機器學習的未來，不過真正開始跟進是好幾年以后了。11年12月中的時候突然心血來潮隨手把材料重新寄了一遍，就選了CMU和MIT，結果意外收到了CMU的offer。有天在百度食堂同凱哥（余凱）和潼哥（張潼）吃飯，我說收了CMU offer，在糾結去不去。他們立馬說去跟Alex Smola啊，他要加入CMU了，我們給你引薦下。記得是離開的前一天才開始打包行李，早上去公司開完會，中午離職，跟小伙伴打招呼說出個國，然后就奔機場了。那天北京天氣特別好，完全不記得前一天霧霾剛爆了表。第一年：9//12-8//13第一年的主要事情是熟悉環境和上課。CMU課程比較重，博士需要學8門課，每門課工作量巨大。而且要求做兩門課助教，做助教比上課更累。這一年上的課中對我最有用的是“高級分布式系統”。之前在上交ACM班的時候已經學過很多質量都還不錯課，純知識性的課程一般對我幫助不大。但這門課主要是讀論文，然后大家討論。不僅僅是關于知識，很多是對設計理念的領悟。大家知道對于系統而言，設計是一門藝術而不是科學，這是設計者審美和哲學理念的體現。同時系統界歷史也是由一波又一波的潮流組成，了解歷史的發展以及其中不斷重復的規律非常有意義。那年這門課上課老師是Hui Zhang（神人之一，20多歲就在CMU任教了，學生包括了Ion Stoica，他是Spark作者Matei的導師），他有非常好的大局觀，對于“Why”這個問題闡述非常到位。我是通過這門課才對分布式系統有了比較清晰的認識。兩年之后我偶然發現我的一篇論文也在這門課的閱讀列表里了，算是小成就達成。除了上課，更重要是做研究。我去CMU的時候Alex那時還在Google，而且沒經費，所以把我丟給了 Dave Andersen。于是我有了兩個導師，一個做機器學習，一個做分布式系統。前面半年都是在相互熟悉的過程。我們每周會一起聊一個小時。前半年因為Alex不在，所以我們只能視頻。Alex那邊信號經常不好，而且他有德國和澳大利亞口音，外加思維跳躍，經常我聽不懂他說啥只能賣萌傻笑。還是靠著Dave不斷的打字告訴我Alex說了什么才度過了前幾次的會。兩個導師風格迥異。Alex是屬于反應特別快，通常你說一點，他已經想好了接下來十點，要跟上他節奏很難。一般拋出問題的時候他就想好了好幾個解決方法。這時候要證明自己的想法比他的更好不容易，需要大量的溝通和實驗數據支撐。我想我大概是花了兩年證明了在某些方向上我的方案一般更好，所以這時候他就不那么hands-on了。Dave不會給很多想法，但會幫助把一個東西理解透，然后講得很清楚。因為我研究方向主要是機器學習上，基本上前兩年基本都是我在教Dave什么叫機器學習，而且是盡量不用公式那種教法。我的第一個研究工作是關于如果劃分數據和計算使得減少機器學習求解中的網絡通訊量。Alex體現了他的強項，幾分鐘就把問題歸納成了一個優化問題，然后我們三各自提出一個解法。我做了做實驗發現Dave的算法更好。接下來兩個月把算法做了很多優化，然后又做了點理論分析就把論文寫了。可惜這個想法似乎有點超前，雖然我們一遍又一遍的改進寫作，但投了好幾個會審稿人就是不理解，或者覺得這個問題不重要。那個時候學術界已經開始吹噓“大數據”，但我覺得其實大部分人是不懂的，或者他們的“大數據”仍然是幾個GB的規模，烤U盤需要十來分鐘的那種。這是我在CMU的一個工作，我覺得挺有用，但卻是唯一沒能發表的。當時跟我坐同一個辦公室的是Richard Peng，他做的是理論研究。我經常跟他討論問題，然后有了些想法合作了一個工作。大體思想是把圖壓縮的快速算法做到矩陣的低秩近似上。這個工作寫了三十頁公式但沒有任何實驗，我主要當做寫代碼間隙的悠閑娛樂，不過運氣很好的中了FOCS。坦白說我不是特別喜歡純理論這種，例如在bound的證明中很多大量的項直接丟掉了，導致我覺得bound特別的近似。對于做系統的人來說，最后拼的是常數。這個工作中這種大開大合的做法我覺得很不踏實。所以我覺得以后還是應該做更實在點的東西。在CMU回到了去百度前的一周七天工作無休的節奏。每周至少80個小時花在學校。如果累了就去健身房，我一般晚上12點去。不僅是我一個人，大家都很努力，例如凌晨的健身房，早3點的辦公室，四處都可以見到中國或者印度學生。我那時候的室友田淵棟花在學校的時候比我多很多。那一陣子有讀了很多關于優化的文章。其中對我啟發最大的是Bertsekas寫于80年代末的那本關于分布式計算的書。此書可以認為是MIT控制領域黃金一代研究成果總結，換到現在仍然不過時。受啟發我轉去研究異步算法，就是分布式下不保證數據的及時性來提升系統性能。我基于在百度期間做的算法，做了一些改進和理論分析，然后投了NIPS。投完NIPS就動身去了Google Research實習。那時候Google Brain成立不久，在“宇宙的答案”42樓，包括Jeff Dean，Geoffrey Hinton，Prabhakar Raghavan好些大牛擠在一起，加起來論文引用率能超80萬。Alex跟我說，你去讀讀Jure Leskovec的文章，學學人家怎么講故事。我在Google也嘗試用了些用戶GPS數據來對用戶行為建模。可是寫文章的時候怎么也寫不出Jure的那種故事感，發現自己不是那塊料。這篇文章因為用了用戶數據，恰逢Snowden讓大家意識到隱私的重要性，歷經艱辛刪了一半結果Google才允許發出來。有些累覺不愛。不過在Google期間我主要時間花在研究內部代碼和文檔上。Google的基礎架構很好，文檔也很健全。雖然沒有直接學到了什么，但至少是開了眼界。第二年：9//13-8//14這學期上了Tuomas Sandholm的機制設計，此乃另一大神，例如最近德州撲克贏了專業選手，之前開公司也賣了上億。不過這門課我是完完全全沒學懂，連承諾的課程大作業都沒怎么做出來。之后的兩年里我一遇到Tuomas他都會問下有什么進展沒。我只能遠遠看見他就繞開。NIPS被拒了，發現審稿人不懂線程和進程的區別，有點沮喪。隔壁實驗室一篇想法類似但簡單很多的論文倒是中了oral，所以那陣子壓力很大。Alex安慰說這種事情常有發生，看淡點，然后舉了很多自己的例子。之后想了想，一篇好文章自然需要有足夠多的“干貨”，或者說信息量，但一篇能被接受的文章需要滿足下面這個公式：文章的信息量 // 文章的易讀性 /< 審稿人水平 * 審稿人花的時間對于機器學習會議，因為投稿量大，所以審稿人很多自然平均水平就會下降。而且很多審稿人就花半個小時到一個小時來讀文章，所以公式右邊數值通常是很小，而且不是我們能控制。如果文章的信息量不大，例如是改進前面工作或者一些簡單的新想法，那么公式成立的概率很大。而對于信息量大的文章，就需要努力提升易讀性，包括清晰的問題設定，足夠的上下文解釋等等。而前面投的那篇NIPS，以及更早的那個被拒工作，就是因為我們假設了審稿人有足夠多的相關專業知識，而我們塞進了太多干貨使得大家都讀糊涂了。即使對于已經發表的文章，上面那個公式同樣可以用來衡量一篇論文的引用率。例如經常見到干貨很多的文章沒有什么人引用，而同時期的某些工作就是考慮了其中簡單特殊情況結果被大引特引。接下來的半年我主要在做一個通用的分布式機器學習框架，是想以后做實驗方便些。名字就叫parameter server，沿用了Alex 10年論文提出的名字。花了很多時間在接口設計上，做了好幾個版本實現，也跑了些工業界級別的大規模的實驗。不過真正花了我大量時間的是在寫論文上。目標是把這個工作投到OSDI上，OSDI是系統界兩大會之一。我們預計審稿人跟Dave兩年前狀態差不多，不會有太多機器學習和數學背景，所以需要盡量的少用公式。整整一個月就花在寫論文上，14頁的文章滿滿都是文字和示意圖。不過努力沒有白費，最終論文被接受了。隨后又花了好幾周準備大會報告上。相對于平時花一周寫論文，兩三天準備報告，這次在寫作和報告水平上有了很大的提升。沒有放進去的公式和定理投了接下來的NIPS，這次運氣很好的中了。有了文章后稍微心安了點可以更自由的做些事情。寒假回了趟國，跑去百度找了凱哥和潼哥。潼哥說他最近有個想法，于是快糙猛的把實驗做了然后寫了篇論文投了KDD。同時期Alex一個學生也把他一個一直想讓我做但我覺得這個小trick不值得我花時間的想法投了KDD，結果中了最佳論文。作報告那天我在的會場稀稀疏疏幾個人，他們隔壁會場人山人海。這個使得好長一段時間我都在琢磨是不是還是要跟著導師走比較好。那時凱哥在百度搞少帥計劃，覺得蠻合適就加入了。這時凱哥正帶著一大幫兄弟轟轟烈烈的搞深度學習，我自然也是跳坑了。試過好幾個想法后，我覺得做做分布式的深度學習框架比較對胃口。我挑了CXXNet作為起點，主要是因為跟天奇比較熟。同時也慢慢上手跑一些Alexnet之類的實驗。我是因為少帥計劃才開始開始做深度學習相關項目，凱哥也很支持我做開源開發回饋社會而不是只做公司內部的產品。但在少帥期間并沒有做出什么對公司有幫助的事，很是慚愧。第三年：9//14-8//15回CMU后Alex看見深度學習這么火，說我們也去買點GPU玩玩。但我們比較窮，只能去newegg上掏點便宜貨。這個開啟了轟轟烈烈的機器折騰之旅。整個一年我覺得我都在買買買裝裝裝上。最終我們可能就花了小幾萬刀攢出了一個有80塊GPU的集群。現在想想時間上花費不值得，而且為了圖便宜買了各種型號的硬件導致維護成本高。但當時候樂在其中。具體細節可以看這篇blog這一年寫了很多parameter server代碼，同時花了很時間幫助用戶使用這些代碼。很難說做得很成功，現在想想有幾個原因。寫代碼時我會優先考慮性能和支持最多的機器學習算法。但正如前面的錯誤，忽略了代碼的易讀性，從而導致只有少部分人能理解代碼從而做一些開發。例如我嘗試讓Alex組的學生來使用這些代碼，但其中的各種異步和callback讓他們覺得很是難懂。其次是沒有人能一起審核代碼接口，導致這些接口有濃濃的個人味道，很難做到對所有人都簡單明了。不過幸運的是找到一幫志同道合的小伙伴。最早是我發現天奇在寫xgboost的分布式啟動腳本，我看了看發現挺好用，就跟他聊了聊。聊下的發現有很多基礎部件例如啟動腳本，文件讀取應該是可以多個項目共同使用，而不是每個項目都造一個輪子。于是跟天奇在Github上創建了一個叫DMLC的組織，用來加強合作和溝通。第一個項目是dmlc-core，放置了啟動和數據讀取代碼。DMLC的第二個新項目叫wormhole。想法是提供一系列分布式機器學習算法，他們使用差不多相同的配置參數來統一用戶體驗。我把parameter server里面的機器學習相關算法移植了過來，天奇移植了xgboost。Parameter server原有的系統代碼簡化到了ps-lite。中途我聽百度同學說factorization machine（FM）在廣告數據上效果不錯，所以在wormhole上實現了下。針對分布式做了一些優化，然后投了WSDM。前后沒有花到一個月，但神奇的竟然拿了最佳論文提名。在wormhole的開發中發現一個問題，就是各個算法還是挺不一樣，他們可以共用一些代碼，但又有各自的特點，需要特別的優化來保證性能。這樣導致維護有些困難，例如對共用代碼的改動導致所有項目都要檢查下。總結下來覺得一個項目最好只做一件事情。所以天奇把xgboost代碼放回原來項目，我也把FM獨立出來一個項目叫difacto。通過一系列的項目，我學到的一點是，以目前的水平和人力，做一個通用而且高效的分布式機器學習框架是很難的一件事情。比較可行的是針對一類相似的機器學習算法做針對性的項目。這個項目的接口必須是符合這類算法結構，所以做算法開發的同學也能容易理解，而不是過多暴露底層系統細節。真正的讓DMLC社區壯大的項目是第三個，叫做MXNet。當時的背景是CXXNet達到了一定的成熟度，但它的靈活性有局限性。用戶只能通過一個配置項來定義模型，而不是交互式的編程。另外一個項目是zz和敏捷他們做的Minerva，是一個類似numpy的交互式編程接口，但這個靈活的接口對穩定性和性能優化帶來很多挑戰。我當時候同時給兩個項目做分布式的擴展，所有都有一定的了解。然后一個自然的想法是，把兩個項目合并起來取長補短豈不是很好。召集了兩個項目的開發人員討論了幾次，有了大致的眉目。新項目取名MXNet，可以叫做mixed-net，是前面兩個名字（Minerva和CXXNet）的組合。放棄開發了幾年的項目不是容易的決定，但幸運的是小伙伴都愿意最求更好，所以 MXNet進展挺順利。很快就有了可以跑的第一個版本。第四年：9//15-8//16前半年為difacto和MXNet寫了很多代碼。其實一開始的時候我覺得difacto更重要些，畢竟它對于線性算法的提升非常顯著而且額外的計算開銷并不大，這對廣告預估之類的應用會有非常大的提升。但有次遇到Andrew Ng，我跟他說我同時在做這兩個項目，他立即告訴我我應該全部精力放在MXNet上，這個的未來空間會大很多。我一直很佩服Andrew的眼光，所以聽了他的建議。11月的時候MXNet就有了很高的完成度。寫了個小論文投去了NIPS的workshop也算是歇了口氣。但隨后就聽到了TensorFlow（TF）開源的消息。由 Jeff Dean領導大量全職工程師開發，Google龐大的宣傳機器支持，不出意料迅速成為最流行的深度學習平臺。TF對我們壓力還是蠻大，我們有核心開發者轉去用了TF。不過TF的存在讓我領悟到一點，與其過分關心和擔憂對手，不如把精力集中在把自己的做得更好。NIPS的時候MXNet的小伙伴聚了一次，有好幾個我其實是第一次見面。隨后Nvidia的GTC邀請我們去做報告。在這兩次之間大家爆發了一把，做了很多地方的改進。同時用戶也在穩步增長。我們一直覺得MXNet是小開發團隊所以做新東西快這是一個優勢，但隨著用戶增加，收到抱怨說開發太快導致很多模塊兼容性有問題。有段時間也在反思要在新技術開發速度和穩定性之間做一些權衡。這時一夜之間大數據不再流行，大家都在談深度學習了。我也花了很多力氣在宣傳MXNet和爭取開發者上。包括微博知乎上吼一吼，四處給報告。在大量的點贊聲中有些陶醉，但很多中肯的批評也讓我意識到重要的一點，就是應該真誠的分享而不是簡單的吹噓。因為大量的媒體介入，整個深度學習有娛樂化的趨勢。娛樂化的報道很多都只是一些簡單信息，（有偏見）的觀點，而沒有太多干貨。不僅對別人沒營養，對自己來說也就是滿足虛榮心。與其寫這些簡單的水文，不如靜下心做一些有深度的分享，包括技術細節，設計思路，和其中的體會。此類分享一個容易陷入的誤區是只關注自己做了什么，結果多么好。這些確實能證明個人能力，對于想重復這個工作的人來說會有很大幫助。但更多的人更關心的是適用范圍在哪里，就是什么情況下效果會減弱；為什么結果會那么好；insight是什么。這個需要更多深入的理解和思考，而不是簡單的展示結果。這個對寫論文也是如此。只說自己的結果比基線好多少只能說明這是不錯的工作，但結果再好并不能意味這個工作有深度。深度學習的火熱導致了各種巨資收購初創司不斷。Alex也有點按耐不住，結果是他，Dave，Ash（曾經是YahooCTO）和我合伙弄了一家公司，拿了幾十萬的天使投資就開工了。Alex寫爬蟲，Dave寫框架，我跑模型，風風火火干了好一陣子。可惜中途Dave跑路去跟Jeff做TF了。后來這個公司賣給了一個小上市公司。再后來我們覺得這個公司不靠譜也就沒考慮跟他們干了。第一次創業不能說很成功，從中學到幾點：一是跟教授開公司一定要注意有太多想法但沒死死的掐住一個做，二是找一堆兼職的博士生來干活不是特別靠譜，尤其是產品不明確的時候，三是即使要賣公司也一定要做一個產品出來。我們賣的時候給很多人的感覺是團隊人太強但產品太弱，所以他們只想要人而已。四是試圖想要通過技術去改變一個非技術公司是很難的事情，尤其是過于新的技術。然后我們就奔去折騰下一個公司。Ash早財務自由所以想做一個大的想法，但這時Alex剛在灣區買了個房，有還貸壓力，他選擇去了Amazon。于是算是胎死腹中。隨后收到Jeff的郵件說有沒有興趣加入Google，自然這是一個很誘人的機會。同時我覺得小的創業技術性強的公司是不錯的選擇。但從MXNet的發展上來書，去Amazon是最好選擇之一。自己挖的坑，總是要自己填的。所以我以兼職的身份去了Amazon，領著一幫小弟做些MXNet開發和AWS上深度學習的應用。第五年：9//16-2//17早在15年初Alex就表示我可以畢業了，但作為拖延晚期患者，遲遲沒開始準備。這時候感覺不能再拖了，于是窩在灣區寫畢業論文。Alex覺得畢業論文應該好好寫，但我對把前面都做完的東西再搗鼓寫寫實在是沒興趣，尤其是加州太陽那么好，大部分時間我都是躺在后院曬太陽。此時B站已經完全被小學生占領，這邊買書也不方便，無聊之余刷了很多起點。然后還寫了篇煉丹文。CMU要求答辯委員會需要有三個CMU老師和一個學校外的。除了兩個導師外，我找了Jeff Dean和剛加入CMU的Ruslan Salakhutdinov. 結果Russ隨后就加入了Apple，整個委員會的人都在灣區了。Jeff開玩笑說可以來Google答辯。可惜跟CMU爭吵了好多次，還是不允許在校外答辯，而且必須要三個人委員會成員在場。這些限制導致答辯一拖再拖，而且臨時加了Barnabas Poczos來湊人數。最后是Jeff的助理快刀斬亂麻的協調好了時間把所有東西定好了。沒有她估計我還可以拖幾個月。答辯的時候是一個比較奇異的狀態，委員會里有Google, Amazon, Apple的AI負責人，剩下兩個和我又分別在這三家公司兼職。這個反應了當下AI領域學術界紛紛跑去工業界的趨勢。不過答辯這個事情倒是挺簡單，跟平常做個報告沒什么太多區別。一片祥和，即使Russ問了MXNet和TensorFlow哪家強這個問題也沒有打起來。答辯后我問委員會說，我在考慮找個學術界的工作，有什么建議沒。大家介紹了一大堆經驗，不過大家都強調的一個重點是：學術界好忙好忙，而且好窮好窮，工業界的薪水（就差指自己臉了）分分鐘秒掉CMU校長。你要好好想。總結答辯前一天的晚上，我想了兩個問題，一個是“博士收獲最大的是什么”，另一個是“如果可以重來會怎么辦”。對于第一個問題，這五年時間自然學到了很多東西，例如系統的學習了分布式系統，緊跟了機器學習這五年的發展，寫文章做幻燈片做報告水平有提升，代碼能力也加強了些。自信上有所提高，覺得既可以做一流的研究，也可以寫跟大團隊PK的代碼。只要努力，對手沒什么可怕的。但更重要的是博士的五年的時間可以專注的把一些事情從技術上做到最好，做出新的突破，這個氛圍沒有其他地方能給予。第二個問題的一個選項是當年留在國內會怎么樣？當年百度的伙伴們多數現在都做得很好，都在引領這一波AI的潮流，甚至有好幾個創造了上億價值的公司。所以從金錢或者影響力角度來看，一直在工業界也不差，說不定現在已經是土豪了。不過我覺得還是會選擇讀博。賺錢以后還有大把時間可以，但是能花幾年時間在某個領域從入門到精通甚至到推動這個領域發展的機會就一次。站在這個領域的高點會發現世界雖然很大，但其實其他領域也使用差不多的技術，有著同樣的發展規律。博士期間領悟到的學習的方法可以在各個方向上都會大有作為。更重要的是理想和情懷。人一生要工作五十年，為什么不花五年來追求下理想和情懷呢？

(繼續閱讀...)

sss66sf33f 發表在痞客邦留言(0) 人氣()

▲top