您的位置: 首頁 >科技 >

學(xué)習(xí)數(shù)據(jù)科學(xué)的12個關(guān)鍵技巧

2022-08-26 11:11:50 編輯:單建舒 來源:
導(dǎo)讀 數(shù)據(jù)科學(xué)家在Glassdoor上被評為2019年最佳職位。基本工資中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預(yù)計的開放數(shù)量,這并不...

數(shù)據(jù)科學(xué)家在Glassdoor上被評為2019年最佳職位。基本工資中位數(shù)為108,000美元,工作滿意度排名為4.3,滿分為5,加上預(yù)計的開放數(shù)量,這并不奇怪。問題是:為了順利完成這項工作,我們必須做些什么?

為了找到答案,我們尋找那些尋求進(jìn)入這個職業(yè)軌道的人的建議。很大程度上歸結(jié)于編碼和數(shù)學(xué)方面的硬技能。但僅憑強(qiáng)大的計算并沒有削減它。成功的數(shù)據(jù)科學(xué)家還需要能夠以自己的方式與商業(yè)人士交流,這需要與軟技能和領(lǐng)導(dǎo)力相關(guān)的能力。

建立教育基金會:三個主要技巧

紐約數(shù)據(jù)科學(xué)學(xué)院的數(shù)據(jù)科學(xué)家Drace Zhan 強(qiáng)調(diào)需要一個教育基礎(chǔ),其中包括編碼和數(shù)學(xué)能力的基本要素:

R / Python + SQL。如果你沒有編碼技能,你需要很多網(wǎng)絡(luò)能力和其他方面來加強(qiáng)這種不足。我見過的數(shù)據(jù)科學(xué)家數(shù)學(xué)能力差,領(lǐng)域經(jīng)驗不多,但他們總是有很強(qiáng)的編碼能力。Python是理想的,但R是一個很棒的后備工具。最好同時擁有你的武器庫。SQL對于Data Analyst來說也非常重要。

強(qiáng)大的數(shù)學(xué)技能。對一些常用方法有很好的理解:廣義線性模型,決策樹,K均值和統(tǒng)計檢驗優(yōu)于具有各種模型或?qū)I(yè)化(如RNN)的廣泛圖景。

一些專家補(bǔ)充說,這些是建立在上面的核心技能。例如,KDnuggets列表包含Zhan提到的編碼組件,并在技術(shù)方面添加了一些其他有用的東西,包括Hadoop平臺Apache Spark,數(shù)據(jù)可視化,非結(jié)構(gòu)化數(shù)據(jù),機(jī)器學(xué)習(xí)和AI。

但是,如果我們通過對Kaggle調(diào)查中確定用于現(xiàn)實生活的最常用工具的調(diào)查得出我們的線索,我們會得到一些不同的結(jié)果。從下面的前15個選項圖中可以看出,Python,R和SQL很容易進(jìn)入前三,但第四個是Jupyter筆記本,其次是TensorFlow,Amazon Web Services,Unix shell,Tableau,C / C ++,NoSQL,MATLAB / Octave和Java,都領(lǐng)先于Hadoop和Spark。微軟的Excel數(shù)據(jù)挖掘是另一個令人驚訝的新增功能。

該KDnuggets名單中還包括關(guān)于正規(guī)教育小費。大多數(shù)數(shù)據(jù)科學(xué)家擁有高級學(xué)位:46%擁有博士學(xué)位,88%至少擁有碩士學(xué)位。他們擁有的本科學(xué)位一般分為相關(guān)領(lǐng)域。大約三分之一是數(shù)學(xué)和統(tǒng)計學(xué),這是這個職業(yè)軌道中最受歡迎的。其次是最受歡迎的是計算機(jī)科學(xué)學(xué)位,占19%,工程學(xué)占16%。當(dāng)然,數(shù)學(xué)科學(xué)專用的技術(shù)工具通常不會在學(xué)位課程中學(xué)習(xí),而是在專業(yè)訓(xùn)練營或在線課程中學(xué)習(xí)。

不僅僅是課程:還有兩個提示

Hank Yun是威爾康奈爾醫(yī)學(xué)院肺科系的研究助理,也是紐約數(shù)據(jù)科學(xué)學(xué)院的學(xué)生,他建議有抱負(fù)的數(shù)據(jù)科學(xué)家計劃他們將要做的工作并尋找導(dǎo)師。他說:

不要因為你參加課程并獲得證書而告訴自己你知道數(shù)據(jù)科學(xué),從而犯了我的錯誤。這是一個很好的開始,但是當(dāng)你開始學(xué)習(xí)時,請記住一個項目。然后找到該領(lǐng)域的導(dǎo)師,立即開始一個激情項目!當(dāng)你新鮮的時候,你不知道你不知道什么,所以當(dāng)有人在那里指導(dǎo)你對你重要的事情和什么不重要時,它會有所幫助。你不想花很多時間學(xué)習(xí)沒有任何東西可以展示它!

知道從工具箱中取出哪種工具:提示保持曲線前進(jìn)

鑒于數(shù)據(jù)科學(xué)工具排名的差異,有些人可能會對應(yīng)該關(guān)注什么感到困惑。安全軟件公司邁克菲首席數(shù)據(jù)科學(xué)家Celeste Fralick在一篇CIO文章中解決了這個問題,該文章著眼于數(shù)據(jù)科學(xué)家的基本技能,宣稱“數(shù)據(jù)科學(xué)家需要在研究中保持領(lǐng)先地位,以及了解什么技術(shù)適用時。“這意味著沒有被”性感“和新的誘惑,當(dāng)實際問題”需要更多的普通問題。“意識到生態(tài)系統(tǒng)的計算成本,可解釋性,延遲,帶寬,以及其他系統(tǒng)邊界條件 - 以及客戶的成熟度 - 本身有助于數(shù)據(jù)科學(xué)家了解應(yīng)用哪種技術(shù)。“

基本軟技能:另外六個技巧

Fralick提出的觀點與數(shù)據(jù)科學(xué)家工作所需的非技術(shù)技能有關(guān)。這就是為什么KDnuggets列表包括以下四個:求知欲,團(tuán)隊合作,溝通技巧和商業(yè)頭腦。Zhan還在數(shù)據(jù)科學(xué)家的技巧中包含了關(guān)鍵的軟技能,識別了像KDnuggets這樣的“溝通技巧”,但是使用“領(lǐng)域?qū)I(yè)知識”代替了“商業(yè)敏銳”。無論它被稱為什么,它都指的是數(shù)據(jù)科學(xué)的實際應(yīng)用。商業(yè)。(要了解有關(guān)溝通技巧的更多信息,請參閱技術(shù)專業(yè)人員溝通技巧的重要性。)

奧利維亞·帕爾魯?shù)?Olivia Parr-Rud)對此提出了自己的想法,增加了兩種軟技能,強(qiáng)調(diào)了創(chuàng)造力的作用,斷言“我認(rèn)為數(shù)據(jù)科學(xué)既像藝術(shù)又像科學(xué)一樣”,需要借鑒大腦兩側(cè)的優(yōu)勢。“很多人都把數(shù)據(jù)科學(xué)稱為主要使用左腦的職業(yè)。我發(fā)現(xiàn)要成功,數(shù)據(jù)科學(xué)家必須使用他們的整個大腦。“

她解釋說,在該領(lǐng)域取得進(jìn)步不僅需要技術(shù)能力,還需要創(chuàng)造力和領(lǐng)導(dǎo)力所需的愿景:

大多數(shù)左腦/線性任務(wù)可以自動化或外包。為了提供數(shù)據(jù)科學(xué)家的競爭優(yōu)勢,我們必須能夠識別模式并使用我們大腦的兩側(cè)來合成大量信息。我們必須是創(chuàng)新思想家。許多最好的結(jié)果來自左腦和右腦的整合。

她還強(qiáng)調(diào)為什么清楚地傳達(dá)愿景是至關(guān)重要的:

作為數(shù)據(jù)科學(xué)家,我們的目標(biāo)是利用數(shù)據(jù)幫助客戶增加利潤。大多數(shù)高管不了解我們做什么或我們?nèi)绾巫觥K晕覀冃枰耦I(lǐng)導(dǎo)者一樣思考并用我們的利益相關(guān)者理解和信任的語言來傳達(dá)我們的發(fā)現(xiàn)和建議。

關(guān)鍵技巧包含了大量的技術(shù)工具,技能和能力,以及不太可量化的品質(zhì),如創(chuàng)造力和領(lǐng)導(dǎo)能力。最終,它不僅僅是一場數(shù)字游戲。由于數(shù)據(jù)科學(xué)不僅僅是在真空中創(chuàng)建模型,而是提出實際應(yīng)用來解決企業(yè)的現(xiàn)實生活問題,那些在該領(lǐng)域取得成功的人不僅要掌握技術(shù),還要了解他們的業(yè)務(wù)領(lǐng)域并了解他們的需求。工作團(tuán)隊的各個成員。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

猜你喜歡

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。