3個月里修了12門數據科學課程后,我學到了什么?
神譯局是36氪旗下編譯團隊,關注科技、商業、職場、生活等領域,重點介紹國外的新技術、新觀點、新風向。
編者按:目前,數據科學已經發展到可以實現任何事情的程度。怎樣才能學好數據科學呢?學習任何一門課程的效果都取決于你是否有充分利用它的能力。作者就學習數據科學課程之前需要具有怎樣的洞察力、以及如何最大化數據科學課程的有效性給出了以下5點建議:(1)對無限的可能性保持開放的心態;(2)需要接受標準的教育;(3)要提前熟悉Python,為機器學習和分析打好基礎;(4)提高溝通技能;(5)加強人際交往。本文來自翻譯,希望對您有幫助。
作者咨詢了學過不同數據科學專業課程的人后了解到:為了精通數據,您需要提前熟悉一些自己能夠發現的與數據科學教育相關的最好的資源。
數據科學不僅僅是一個隨機的計算機專業。我讀過很多與數據科學相關的文章,也聽過播客,看過如何通過基本的計算機知識來掌握數據科學的視頻。
一個IT或計算機科學學位是很有用的,但如果想深入研究數據科學,僅僅獲得一個學位是遠遠不夠的。還需要有相關的經驗、聯系、實踐,以及具有現實生活用例的項目。
據研究,要想從技術專業中獲得最有用的知識,學到的必須超越自己的學歷水平。幸運的是,可以通過學習幾門與所學領域相關的課程,來獲得超越學位水平的知識,這是最好的方法。
有大量的數據科學課程在那等著你去學,想多學幾門根本就不是啥問題。問題是要在上課之前做好準備。
學習任何一門課程的效果都取決于你是否有充分利用它的能力。本文將為你介紹在學習數據科學課程之前需要具有怎樣的洞察力,以及如何最大化數據科學課程的有效性。
1. 對無限的可能性保持開放的心態
目前,數據已經發展到可以實現任何事情的程度。
這是一個一切皆有可能的世界。
大約20年前,分析本地企業的交易往往是一個漫長的過程。首先,收集和整理過程具有挑戰性且浪費時間,主要的分析資料是傳統的票據和資產負債表,還要做成幻燈片將相關信息展示給管理層。
今年年初,我在一家快餐店做分析師,其財務分析是典型的日常交易分析,不得不說,當時使用的數據分析方法和分析技術與現在的有很大不同,也沒有那么復雜。
我想說的是,學習數據科學需要心胸開闊。要做好準備,將自己在學習數據科學課程時讀到、看到或聽到的任何東西都消化吸收。
如何去做:
大多數人都已經掌握了一些數據科學概念的知識,這還不錯,但是,系統的課程可能會提供一種不同的方法或更好的方法來實現自己之前已經了解的內容。
學習課程時你需要理解新的概念,并將它們與自己之前學到的知識聯系起來。
你會遇到不同的數據專業人士,他們可能各有不同的教學方法,與其比較哪一種更好,不如兩種方法都去了解。那么你就會有兩種方法來解決同一個問題。
把自己變成易教的人。
2. 需要接受標準教育
真不想讓你覺得自己不夠優秀。但事實是,88%的數據科學家擁有碩士學位,46%擁有從統計學、數學到計算機科學和物理科學等領域的博士學位。這些數據證明,需要有良好的教育背景,才能理解數據科學和大數據分析中使用的術語、概念和模型。
在成為數據科學家的早期,我曾向許多需要數據分析師的初創公司和企業申請過職位。我的簡歷上羅列著許多項目還附有一份精雕細琢的作品集,唯獨缺少一樣東西:就是一個大學學位。在我申請過的眾多機構中,沒有任何一家錄取我,盡管有些機構很好心地給我發了回復:
“你很聰明,但你得完成大學學業”
“你忘記在簡歷中添加自己的大學信息了”
“你經驗尚不足”
這些話語在某種程度上聽起來很像父親的叮嚀。但事實上,他們說的都是對的。我需要接受良好的教育。在攻讀學位期間學到的技能將提高自己的熟練程度,還能幫助自己過渡到任何數據分析領域。
如何去做:
這很簡單,如果你還沒有獲得大學學位,那就去拿一個吧。如果你已經有了第一學位,可以考慮去攻讀碩士或博士。繼續學習,讓自己從眾多的數據科學家中脫穎而出。
我不認為“獲得學位”是必須要做的事情,但如果真的握有數學、統計學或計算機科學等方面的學位,這對個人前景發展當然會有很大的幫助。
3.要提前熟悉Python,為機器學習和分析打好基礎
你可能會問,為了數據科學,我真的需要學習編程嗎?
根據《數據科學學位》(Data Science Degree)的這篇研究文章,數據科學行業對編程的需求程度之強,不可形容。隨著越來越多的雇主逐漸地意識到了這一點,社會上對具有高級編程技能的數據科學家的需求也直線上升。
除了Java和R, Python是科技行業最常見的編程語言。這并不奇怪,因為使用Python你可以有效和輕松地執行大多數涉及到數據分析的過程,顯然,Python也是開發和維護端到端項目的首選。這就是為什么O"Reilly采訪的40%的受訪者使用Python作為他們的主要編程語言的原因。
我學過的大多數數據科學課程,選修的學生必須在學習之前就具備Python知識基礎。
在課程的某一進程,可能會有關于某些模塊的描述,告訴學生在學習課程之前要先學習Python。這只是一種方式:告訴數據科學家、專業人士或業余愛好者,Python將減輕其在整個數據科學職業生涯的旅程。
如何去做:
開始去使用python。它的功能和效果會令人興奮不已而不容錯過。
這可能需要考慮安裝Anaconda發行版,因為它可以提高你的代碼質量,并簡化Windows和OSX上的Python包安裝。
如果你正在尋找一門Python入門課程,Datacamp是不錯的選擇,它可為初學者提供廣泛的Python培訓。
4. 提高溝通技能
分享一個有趣的事實:所有的課程都是由講普通話的人來教授和解釋的。
這聽起來雖然很好笑,但卻是事實。最好的課程對每個模塊中包含的概念進行了深入的解釋。大多數課程都是技術性很強的,少說多練。他們也可以學到理論,多說少練。無論課程采取哪種形式,你都需要首先為任何事情做好準備。
教授數據可視化方面內容的導師讓我大開眼界,看到了數據行業中一些非常微妙的東西。他說,“最好的數據科學家是那些能夠完美平衡人類交流和技術交流的人”。
他說的那幾句話讓我一直堅強不息。在人類交流和技術交流之間創造完美的和諧對自己的成功至關重要。不幸的是,大多數數據科學家往往忽視了高質量溝通技能的力量。他們認為,一旦能夠部署模型、編寫代碼、對變量排序、編寫Python腳本和操作數據,就可以解決問題了。
而我的想法是,當能夠整理并平衡自己的編程技能和溝通技能時,才能在數據科學領域站穩腳跟。
如何去做:
閱讀與數據相關的好書或研究文章。從作者的角度出發去獲得見解,并認識到作者試圖傳遞的要點。
如果你不喜歡閱讀,多聽演講者的播客或互動視頻也會幫到你。閱讀和觀看的主要目標是獲得詳細的想法,并用自己的話恰當地總結出來。
5. 加強人際交往,可以消除業余錯誤
人脈基本上是指在同一行業中與其他有共同興趣的專業人士建立聯系。根據Gray Group International的觀點,要想在任何行業獲得成功,很大程度上取決于自己多年來建立的人脈和經驗。
今年,我第一次選修了數據科學課程,坦率地說,這段經歷與我預期的不同:并未順利進行和取得進步。3周后,我開始了第二個星期的學習,也不怎么積極,糟糕的經歷和第一個學期一個樣。
“需要幫助無需多看一眼,但請求幫助總是看起來很美。”
——布列塔尼勃艮第(Brittany Burgunder)
在花費了時間和努力之后,我卻一無所獲,決定與同一機構的同事們分享我面臨的困難。我們聚在一起,仔細地瀏覽著我的課程模塊,并分享著理解課程不同方面的獨特方法。
現在聽起來這像是在工作,但一旦你付出了一次性的犧牲,你就會在整個職業生涯中都享受到它給你帶來的益處。
如何去做:
每一次會議、峰會、工作或休閑聚會都是建立新關系的機會。
別讓這些機會溜走。
除了加強線下的實際聯系,還要建立一個活躍的在線形象。比如加入最好的數據科學社區和論壇。
適用的要點
數據科學的美妙之處在于總有改進的空間,我就喜歡這一點。你可能會在編碼或分析時犯了一些錯誤,這肯定會傷害到你。但是可以通過重溫大量的優質資源來提高技能。
要做好充分的準備和擁有良好的學習心態,堅持不懈地努力,這樣就會走上通往專業最高水平的道路。
譯者:甜湯