21世紀(jì)最性感的職業(yè)——數(shù)據(jù)科學(xué)家
21世紀(jì)最性感的職業(yè),你覺得是什么?美國媒體認(rèn)為,是數(shù)據(jù)科學(xué)家。
大數(shù)據(jù)炙手可熱,每家公司都在試圖利用大數(shù)據(jù)做點什么。與此同時,一個新的工作職位應(yīng)運而生——數(shù)據(jù)科學(xué)家。別小看了這個聽起來貌似還略顯青澀的名稱,先來看看它掀起了怎樣的波浪吧:它被美國媒體稱為21世紀(jì)最性感的職業(yè),因為這個職位聽起來充滿誘惑卻又不被大眾所了解;在知名招聘網(wǎng)站INDEED上,它的需求百分比在短短一年之內(nèi)由0增長到現(xiàn)在的近0.02%;中國的各大網(wǎng)站如阿里巴巴等公司也相繼貼出了高薪聘請數(shù)據(jù)科學(xué)家的OFFER……
那么,數(shù)據(jù)科學(xué)家,到底是做什么的呢?
數(shù)據(jù)科學(xué)家這個職位來源于喬納森·高德曼(Jonathan Goldman)。他在2006年的6月份進入商務(wù)社交網(wǎng)站LinkedIn工作。在那時,LinkedIn只有不到800萬用戶。高德曼在之后的研究中創(chuàng)造出新的模型,利用數(shù)據(jù)預(yù)測注冊用戶的人際網(wǎng)絡(luò)。具體來講,他以用戶在LinkedIn的個人資料,來找到和這些信息最匹配的三個人,并以推薦的形式顯示在用戶的使用頁面上——這也就是我們熟悉的“你可能認(rèn)識的人(People you may know)"。這個小小的功能讓LinkedIn增加了數(shù)百萬的新的頁面點擊量。從此,數(shù)據(jù)在Linkedin的重要性被不斷提升,而高德曼的角色就是一位數(shù)據(jù)科學(xué)家。
曾經(jīng)投資過Facebook,LinkedIn的格雷洛克風(fēng)險投資公司把數(shù)據(jù)科學(xué)家描述成“能夠管理和洞察數(shù)據(jù)的人”。在IBM的網(wǎng)站上,數(shù)據(jù)科學(xué)家的角色被形容成“一半分析師,一半藝術(shù)家”。他們代表了商業(yè)或數(shù)據(jù)分析這個角色的一個進化。
真正區(qū)別數(shù)據(jù)科學(xué)家與傳統(tǒng)職位的是對于商業(yè)的強烈敏感,以及以何種組織來處理商業(yè)問題的影響力,將研究結(jié)果傳達給商業(yè)和IT界的覺得者們。優(yōu)秀的數(shù)據(jù)科學(xué)家將不僅僅處理商業(yè)問題,他們還要有具備發(fā)現(xiàn)對于公司影響最大的問題的能力。Anjul Bhambhri是IBM的大數(shù)據(jù)產(chǎn)品副總裁,她認(rèn)為 “數(shù)據(jù)科學(xué)家是一個好奇的,不斷質(zhì)疑現(xiàn)有假設(shè),能盯著數(shù)據(jù)就能指出趨勢的人。這就好像在文藝復(fù)興時期,一個非常想為組織帶來挑戰(zhàn)并從挑戰(zhàn)中學(xué)習(xí)的人一樣。”
我們可以從大家的描述中看到數(shù)據(jù)科學(xué)家的輪廓:既是分析師,也是數(shù)學(xué)家,有可能是個黑客,也有可能是個解碼員。不一定必須是個博士才能成為一個數(shù)據(jù)科學(xué)家,但“能在數(shù)據(jù)的海洋里暢游”一定得是他的長項。并且,被人們反復(fù)提到的詞是:洞察力(insight)。數(shù)據(jù)科學(xué)家必須要通過大量的數(shù)據(jù)產(chǎn)生對商業(yè)發(fā)展的洞察力。他們應(yīng)該能推理出數(shù)據(jù)上尚未顯示出來的被掩蓋的事實和趨勢。
提出“數(shù)據(jù)科學(xué)家”這個詞的Thomas H. Davenport 和 D.J. Patil在他們的文章中談到數(shù)據(jù)科學(xué)家的能力:數(shù)據(jù)科學(xué)家傾向于用探索數(shù)據(jù)的方式來看待周圍的世界。把大量散亂的數(shù)據(jù)變成結(jié)構(gòu)化的可供分析的數(shù)據(jù),還要找出豐富的數(shù)據(jù)源,整合其他可能不完整的數(shù)據(jù)源,并清理成結(jié)果數(shù)據(jù)集。
新的競爭環(huán)境中,挑戰(zhàn)不斷地變化,新數(shù)據(jù)不斷地流入,數(shù)據(jù)科學(xué)家需要幫助決策者穿梭于各種分析,從臨時數(shù)據(jù)分析到持續(xù)的數(shù)據(jù)交互分析。數(shù)據(jù)科學(xué)家會遇到技術(shù)的局限性,但不會讓技術(shù)阻擾他們尋找新穎的解決方案。當(dāng)他們有所發(fā)現(xiàn),便交流他們的發(fā)現(xiàn),建議新的業(yè)務(wù)方向。通常他們很有創(chuàng)造力的展示視覺化的信息,也讓找到的模式清晰而有說服力。他們會把蘊含在數(shù)據(jù)中的規(guī)律建議給產(chǎn)品經(jīng)理和主管們,從而影響產(chǎn)品,流程,和決策。
Nate Silver利用收集到的數(shù)據(jù),在美國2012年總統(tǒng)大選預(yù)測對了50州的投票結(jié)果以及最終的大選的結(jié)果。數(shù)據(jù)科學(xué)家們正在向世界昭示他們愈來愈重要的作用。
在可見的未來,數(shù)據(jù)科學(xué)家這個新興職業(yè)將愈發(fā)活躍商業(yè)世界。當(dāng)他們在硅谷的各大科技公司站穩(wěn)腳跟后,更多的傳統(tǒng)行業(yè)將很有可能擁抱這個目前還不被大多人了解的群體,因為他們在大數(shù)據(jù)分析領(lǐng)域的聰明才智可以為公司節(jié)省上千萬的資金并且發(fā)現(xiàn)更具價值的投資方向。
他們這么看數(shù)據(jù)科學(xué)家 John Rauser, 亞馬遜大數(shù)據(jù)科學(xué)家:
數(shù)據(jù)科學(xué)家是工程師和統(tǒng)計學(xué)家的結(jié)合體。從事這個職位要求極強的駕馭和管理海量數(shù)據(jù)的能力;同時也需要有像統(tǒng)計學(xué)家一樣萃娶分析數(shù)據(jù)價值的本事,二者缺一不可。
Steven Hillion, EMC Greenplum數(shù)據(jù)分析副總裁:
數(shù)據(jù)科學(xué)家是具有極強分析能力和對統(tǒng)計和數(shù)學(xué)有很深研究的數(shù)據(jù)工程師。他們能從商業(yè)信息等其他復(fù)雜且海量的數(shù)據(jù)庫中洞察新趨勢。
Monica Rogati, LinkedIn資深數(shù)據(jù)科學(xué)家:
所有的科學(xué)家都是數(shù)據(jù)學(xué)家,因為他們整天都在和海量數(shù)據(jù)打交道。在我眼中,數(shù)據(jù)學(xué)家是一半黑客加一半分析師。他們通過數(shù)據(jù)建立看待事物的新維度。數(shù)據(jù)學(xué)家必須能夠用一只眼睛發(fā)現(xiàn)新世界,用另一只眼睛質(zhì)疑自己的發(fā)現(xiàn)。
Daniel Tunkelang,LinkedIn首席數(shù)據(jù)科學(xué)家:
我是bit.ly 首席科學(xué)家Hilary Mason的忠實崇拜者。關(guān)于這個新概念的定義我也想引用她的說法:數(shù)據(jù)科學(xué)家是能夠利用各種信息獲取方式、統(tǒng)計學(xué)原理和機器的學(xué)習(xí)能力對其掌握的數(shù)據(jù)進行收集、去噪、分析并解讀的角色。
Michael Rappa,北卡羅萊納州立大學(xué)教授:
盡管數(shù)據(jù)科學(xué)家這個名稱最近才開始在硅谷出現(xiàn),但這個新職業(yè)的產(chǎn)生卻是基于人類上百年對數(shù)據(jù)分析的不斷積累和衍生。和數(shù)據(jù)科學(xué)家最接近的職業(yè)應(yīng)該是統(tǒng)計學(xué)家,只不過統(tǒng)計學(xué)家是一個成熟的定義且服務(wù)領(lǐng)域基本局限于政府和學(xué)界。數(shù)據(jù)科學(xué)家把統(tǒng)計學(xué)的精髓帶到了更多的行業(yè)和領(lǐng)域。