網盛創新研究院 - AI、區塊鏈、云計算、大數據技術的研究與應用交流平臺!

網盛創新研究院/大講堂/正文

數據科學家與數據工程師有何不同?

地址:杭州

2019-03-29

隨著機器智能領域的不斷發展,新角色不斷產生,現有角色不斷擴大。許多人并沒有對數據科學家和數據工程師之間的差異有清楚的認識。這些文章闡述了這兩種不同職業道路所需的具體技能。

以下是數據科學家和數據工程師的一些核心競爭力和重疊領域:

數據科學家——數學與統計學、計算機科學、機器學習以及人工智能/深度學習,高級分析和用數據講故事。

數據工程師——生產級編程、分布式系統、數據轉換、數據分析和數據管道。

重疊領域——數據分析和編程。

讓我們深入了解這些領域,以便更好地理解差異化因素。

blob.png

數據科學家所需要的技能

數據科學家通常來自應用數學和/或統計背景以及計算機科學。機器學習基于統計學習的數學基礎。在沒有數學知識的情況下,即使努力在數據科學方面取得優異成績,也很難完整的視角。

數據科學家還需要與業務領域專家進行交互,以培養所需的見解。 數據科學家還需要分析數據(探索性數據分析),以幫助企業利用其數據資產。

數據科學家還將具備選擇適當的機器學習算法,訓練它們并設計測試其準確性的方法的背景。

此外,當數據科學項目的結果需要以可理解的方式傳達給業務利益相關者時,數據科學家必須精通利用數據講故事的藝術。這項工作需要能夠以利益相關者能夠理解并采取行動的方式,口頭和視覺地傳達復雜的結果和觀察。

數據科學家們還必須開發出編碼技能,大多數都是在R或Python語言環境中。數據科學家的編程技能通常不在數據工程師的水平之上——他們也不應該!

數據工程師所需要的技能

數據工程師通常具有計算機科學學位。他們的背景通常是Python,Java或Scala等語言。他們的重點是分布式系統和大數據。與數據科學家相比,他們的編程技能更先進,特別適合構建高可用性生產系統。

利用這些編程技能,數據工程師可以大規模創建數據管道。這涉及整合大量大數據技術。數據工程師的任務是決定哪些工具適合這項工作。數據工程師還對數據技術和框架以及如何將它們與數據管道集成有深入的了解。此外,數據工程師與負責集群、DevOps和DataOps的人員密切合作。

數據工程師還實施數據科學家為生產環境選擇的機器學習算法。例如,這可能涉及將數據科學家所使用的R中的分類算法部署到更強大的生產平臺。

重疊技能

當然,兩者在編程方面存在重疊技能,盡管數據工程師的編程技能往往超過數據科學家的編程技能。例如,讓數據科學家計劃生產數據管道可能是過度擴展,而這種任務直接在數據工程師的工作范圍之內。在這里,他們的技能是互補的,因為數據科學家可以設計數據管道,數據工程師將對其進行編程和維護。通常不應期望數據科學家對數據管道進行編程。

另一個重疊領域是數據分析。數據科學家的分析技能通常比數據工程師的分析技能進化得更多。數據工程師可能能夠進行一些基本分析,但無法滿足數據科學家很容易做到的更高級分析的需求。

企業中的錯位

許多企業在將上述技能組合與實際職稱相匹配方面犯了錯誤。首先,不要陷入試圖找到一個人可以獨當兩面的死循環中,不要期望他可以完成數據科學家和數據工程師的工作。當然,可能會有一些獨角獸,但他們的需求非常高,而且薪水很高。另外,如果你雇用的獨角獸決定離開,會發生什么?

另一個錯誤是讓數據科學家完成數據工程師的工作。創建數據管道并不容易,它需要生產編程框架的高級知識。數據科學家可能能夠獲得這些技能,但這并不是對這種資源的最有效利用。數據科學家不是建立生產系統、創建數據管道和暴露機器學習結果的工程師。

另一方面,數據工程師完成數據科學家的工作是一個錯誤,盡管這種情況不太常見。一些數據工程師通過提高他們的數學和統計知識以及相應的機器學習技能來擴大他們的技能。這條職業道路有時會產生另一個職業類別,即“機器學習工程師”。

機器學習工程師通常來自數據工程背景,但他們已經熟練掌握數據科學的某些方面,并且在數據科學和數據工程之間徘徊。這個類別真的不是獨角獸,而是一個了解如何操作和優化機器學習的數據工程師。機器學習工程師采用數據科學家創建的內容并使其產品就緒。

如何提升我的技能?

ODSC East 2019有完整的重點領域涵蓋這兩個領域的多個軌道。 無論你是數據科學家還是數據工程師,ODSC研討會、講座和培訓課程都是數據科學專業人員的理想選擇!以下數據科學和數據工程重點領域中的一些杰出會議:

數據科學家

blob.png

數據工程師

blob.png

總之,重要的是要了解數據科學家和數據工程師如何相互補充。有才華的數據科學團隊由兩種技能組成。讓數據科學家完成數據工程師的工作是浪費良好的資源,反之亦然。你很難找到一只獨角獸——一個既是熟練的數據工程師又是專家數據科學家的人。因此,你需要建立一個團隊,每個成員都可以補充其他人的技能,并且能夠很好地協同工作。

blob.png

【版權提示】網盛創新研究院網倡導尊重與保護知識產權。未經許可,任何人不得復制、轉載、或以其他方式使用本網站的內容。如發現本站文章存在版權問題,煩請提供版權疑問、身份證明、版權證明、聯系方式等發郵件至wzy@netsun.com,我們將及時溝通與處理。
關于我們創新研究院大講堂服務介紹
? 生意寶(002095) 版權所有  浙公網安備 33010002000015號 工商執照 浙ICP證  網絡工商
韩国色情禁片视频床,玉女聊斋1998 免费观看,韩国禁片大全电影在线 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>