工業4.0時代下的數據科學家
作者 | Toni Manzano
譯者 | Sambodhi
編輯 | Natalie,Emily
AI 前線導讀:要問 21 世紀最性感的職業是什麼,數據科學家絕對能夠上榜。所謂數據科學,就是從數據中提取知識的研究。它集成了多種領域的不同元素,包括信號處理、數學、概率模型技術和理論、機器學習、計算機編程、統計學、數據工程、模式識別和學習、可視化、不確定性建模、數據倉庫,以及從數據中析取規律和產品的高性能計算。數據科學並不局限於大數據,但是數據量的擴大誠然使得數據科學的地位越發重要。在工業 4.0 的浪潮之下,數據科學家又應該是什麼樣的呢?讓我們看看 Toni Manzano 在 Data Science Central 發布的文章 Data Scientists 4.0,明確新時代的數據科學家需要做什麼。
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)
自從漢諾威工業博覽會(Hannover Fair)在 2011 年提出第四次工業革命以來,從那時起,圍繞著所謂的工業 4.0 出現了許多新事物。例如數字孿生(Digital Twins)、工業物聯網或信息物理系統之類作為獨立的元素出現,為許多製造領域的範式轉換(paradigm shift)提供了必要的要素。其中,最具開拓性的與預測分析和人工智慧相關,幾年前未能解決的實際問題得以迎刃而解。預見性維護、人工視覺和模式識別機制可以實時識別潛在故障,這都是新行業應用中實際用例中的幾例。
因此,為了利用 60 年代創建的演算法將信息轉化為知識,數據科學成為業界很有價值的工具。在理解企業活動的新方式中,數據科學家發揮著基礎性的作用。當數據工程師必須面對行業中的問題時,新的挑戰出現了:他們必須處理未知的過程、程序、操作、科學和特定的決疑(casuistry),這些都是他們正在尋找的答案。因此,數據科學家們就像偵探一樣,在每個項目中都在不同的犯罪場景里發展他們的技能。他們必須將一組新的多學科技能添加到自己的專業知識中,以便為每個問題的專業分析提供所需的附加價值。
每個行業都需要不同的機器學習和深度學習系統才能從可用信息中獲益。零售行業是完全以顧客為導向的,其背後的機會是買家的偏好和需求、及時交付和庫存最小化。自然語言處理和媒體分析作為工具被廣泛接受,為最終消費者提供有吸引力的建議。考慮到金融科技的需求,數據科學家必須根據各種醫療和健康風險指標,實時調整商業交易的欺詐檢測、匯總和異常檢測或保險策略的特定演算法。然而,工業 4.0 定義的製造活動更為複雜。例如,汽車行業與供應商和裝配鏈(人類和機器人)進行交互,降低了倉儲成本,而市場需求必須滿足自動駕駛支持、智能安全和舒適性要素的最新技術。
生物技術和製藥行業是廣義製造業中的一個特例。醫學和藥物製造在現有複雜性的基礎上增加了監管要求,這些要求在某種程度上阻礙了技術進步和創新範式轉換。原因是,該領域中,人類的安全必須始終放在第一位。當在工廠設計和實現過程中,在許多情況下,它們都要受到嚴格的質量控制,因此必須盡量減少可變性(variability)。在這個觀點下,很難驗證基於像隨機森林(Random Forest)等演算法提供結果的操作。儘管存在這樣的現實,但重要的是要注意一些機器學習演算法已經被歐洲藥典所接受,作為處理分析數據集的有效化學計量技術。
另一方面,管理機構和監管機構正在慎重觀察,並立法規定,明確必須管理通過人工智慧演算法獲得的數據、過程和結果。因此,新一代的數據科學家和技術專家得以誕生,為監管諮詢或立法顧問指明了方向,為協商一致的數據管理開闢了新的道路。當來自人工智慧演算法的策略應用於航空、汽車、醫學或製藥等,並可能會影響人們的健康時,必須對整個過程進行監控,以確保個人數據完整性。
智能產業引發了社會向製造業和商業領域的推動。人類和設備生產的大量數據迫使特定的技術突破出現,以管理和處理網路中可用的異構信息。圖像、位置信息、社交媒體數據、交通狀況、預測、股票趨勢或文件必須實行實時訪問,以及正在尋找主題的相關建議。這種持續不斷的知識流動隨時可消費,已經成為不可或缺的商品。工業 4.0 所提供的獨特特性,要求專家必須向習慣於知識消費的社會提供內容,還要注意一種新產品,它正被數據科學包裝為分散式產品的附加價值。數據科學家必須熟悉應用於數據生態系統上的演算法,這一點要求同時具備多學科和專業知識。他們肩負著艱巨的使命,就是如何滿足日益增長的無處不在的數據科學服務的需求。
AI前線
緊跟前沿的AI技術社群
想看更多這類文章, 請給我們點個贊吧!
※從熱門微博到自動駕駛,深度解析人工智慧四大案例
※剛剛,傅盛正式發布了第一款區塊鏈AI音箱
TAG:AI前線 |