今日頭條張一(yī)鳴:機器學習能帶來更有趣的世界嗎(ma)?

2015年11月20日    本站原創    佚名    關鍵詞:

騰訊科技 徐安娜 1月17日報道

,極客公園創新大(dà)會在北(běi)京開(kāi)幕。頭條創始人張一(yī)鳴作了主旨演講。他分(fēn)享了頭條在機器學習上的實踐。他認爲,過去(qù)是依靠人總結知(zhī)識,現在可以通過系統、學習用戶的行爲特征來存儲智慧。

 

張一(yī)鳴表示,這種系統本身具有自我(wǒ)(wǒ)成長的三大(dà)特征,感知(zhī)、理解與判斷。首先系統感知(zhī)到用戶的搜索行爲,獲取其數據,然後解讀數據背後用戶的意圖,感知(zhī)、理解了這個知(zhī)識之後可以對用戶新的行爲産生(shēng)判斷。比如頭條可以判斷這條新資(zī)訊這位用戶是否會喜歡。

頭條從早的版本是用人的知(zhī)識編成一(yī)些策略進行個性化的推薦,之後進行了改進,用了海量的特征和精細化的特征,來實現推薦。張一(yī)鳴說,未來還會有更豐富的特征,不僅是用一(yī)種模型,可能更多的是模型的組合來進行行爲的理解判斷。

張一(yī)鳴表示,機器智商(shāng)未必高于見多識廣的人,主要是人的記憶力有限,處理的數據量有限,而機器不知(zhī)疲倦,每時每刻都可以輸入海量數據。機器可以連接衆多的設備,觀察衆多的設備産生(shēng)的行爲,通過感知(zhī)理解判斷形成機器的智慧之後,可以大(dà)規模抹平信息的鴻溝,減輕人的負擔。

機器還知(zhī)道什麽?比如頭條的系統在過去(qù)一(yī)年中(zhōng)它從這麽多用戶行爲中(zhōng)還了解了什麽呢?它知(zhī)道哪些人所不知(zhī)道的知(zhī)識點呢?比如過去(qù)一(yī)年中(zhōng)哪個事件被人快遺忘了?哪個城市的人喜歡某個?

這些問題機器是否都能知(zhī)曉,張一(yī)鳴會在下(xià)周二他們舉辦的題爲“算數”的年度發布會上揭曉答案。

以下(xià)是騰訊科技整理的張一(yī)鳴的演講實錄:

很高興與大(dà)家分(fēn)享我(wǒ)(wǒ)們頭條在機器學習上的實踐。創業之初,我(wǒ)(wǒ)們要招機器學習的工(gōng)程師,很多獵頭問,“你們不是做媒體(tǐ)的嗎(ma)?爲什麽要招機器學習的工(gōng)程師?你們不是做一(yī)個APP嗎(ma)?爲什麽需要這麽多人?”我(wǒ)(wǒ)當時想告訴他們,機器學習能給資(zī)訊閱讀和信息獲取帶來很大(dà)的價值,今天我(wǒ)(wǒ)就跟大(dà)家分(fēn)享這塊内容。

首先我(wǒ)(wǒ)們回顧一(yī)下(xià)前面幾位演講者講到的機器學習的使用場景和技術背景。11年底,12年初時,我(wǒ)(wǒ)強烈地感受到移動互聯網的出現會使物(wù)理世界在網絡世界有更多的數字投影。比如微博的出現,讓很多公共機構和名人有了網絡ID,很多照片、文字、用戶生(shēng)成的内容在網絡世界有了投影,換句話(huà)說,人類的活動痕迹越來越多地出現在網絡上。

同時,雲端開(kāi)始能處理海量的數據。特别是2012年之後,越來越多的雲存儲、雲技術技術應用誕生(shēng)了。在移動端出現了強烈的業務需求,因爲技術條件還不夠,有強烈的業務需求才可以帶來技術在産品上的應用。

 

手機上的傳感器越來越多,智能硬件其實是手機的外(wài)設,而手機是人的外(wài)設,可能不隻是手機,也包括志(zhì)飛說的手表,越來越多的傳感器、智能硬件成爲外(wài)設之後,手機本身又(yòu)具備本地運算處理能力、聯網能力,所以它成爲物(wù)理世界的信息投影到網絡世界的一(yī)個通道。當然也有其他設備,如GoPro相機,谷歌(微博)眼鏡等,能實時分(fēn)析路面交通情況并投影至數字世界。

 

過去(qù)是依靠人總結知(zhī)識,不同曆史階段都會有藝術、文學等經典著作,是将各領域知(zhī)識彙聚到一(yī)起産生(shēng)的。現在我(wǒ)(wǒ)發現通過書(shū)籍彙聚知(zhī)識不是的方式,通過系統,學習用戶的行爲來存儲智慧才是的。

比如我(wǒ)(wǒ)們希望查詢過去(qù)幾年的春運變化情況,可以在百度指數上查到,百度指數囊括了曆年春運的交通情況。通過系統,通過用戶行爲生(shēng)成的知(zhī)識可能會是未來知(zhī)識存儲的一(yī)種主要方式。