摘要: 吳恩達近期在 Deeplearning.ai 的一場論壇,說明了自己對於機器學習(Machine Learning)和 MLOps 的最新看法。 在過去,機器學習社群在意的是建模、參數調整、架構選擇,來達到對性能的監控。現在產業運用 AI 的幅度大增,開始轉向了新的階段,一大面臨問題是,當模型投入了生產,許多無法預期的因素,會影響模型性能。
▲圖片標題(來源: Deeplearning.ai)
產業、學界對 MLOps 定義具分歧?吳恩達:這仍是一個新興學科
企業開始追求大幅擴展這些機器學習模型 — 試想, 當一間公司的信用卡用戶,從一百萬上升到十億人,傳統的檢查點還能全然適用嗎?這就是專家提倡 MLOps 的原因 — 匯集 DevOps 和機器學習的所有優點,確實,產業對於具備相關技能的人才也正急遽上升。
一些專家提出 MLOps 是目前可用的最佳解決方案,但由於這是非常新穎的領域,所以仍然存在歧義,通常沒有一套標準考參考。 為解決這些問題,吳恩達創辦的 Deeplearning.ai 最近主持了一個 MLOps 專家論壇,來切入討論機器學習生產的關鍵面向,以及 MLOps 出現在一間企業當中,究竟會是什麼樣子。
吳恩達承認,AI、深度學習等領域在過去十年中取得了巨大的進步,他也強調 MLOps 將幫助每個人完成機器學習項目的整個生命週期:一路從範圍界定、數據蒐集管理,訓練模型、改進數據、優化模型,再到部署監控、管理數據驅動模型維護的完整概念。
「我認為 MLOps 是一門令人興奮的新興學科,可以解決機器學習項目的整個生命週期,是極為前沿的議題」,吳恩達說。
MLOps 的第一步到底該怎麼跨出?吳恩達:高品質資料
任何涉及機器學習企業,都必須關心客戶對產品的需求 — 畢竟,目的終究是要商業化。
不過,談到對 MLOps 工具的看法時,吳恩達則表示,目前工具大多有明顯的限制,比方說,把數據餵入,不代表就能直接提高性能。在建立 MLOps 團隊時,吳恩達推薦了一套他認為可靠的原則:要求團隊進行長期、認真的審視, 以確保在整個生命週期中,始終保有品質好的數據 。高品質數據究竟多重要?
特別是針對後續模型表現不佳時,應做的資料改善,吳恩達建議,MLOps 團隊可利用不同工具和準則,來 確保連續性的高品質資料,光是做好這一點,就足以解決很多問題,甚至專案還能以兩倍以上的速度加快完成 ,「兩倍,甚至更快,只要你做好資料品質控管這件事。」 MLOps 是一個尚未完全成型的新興領域,吳恩達說,數據品質管理、MLOps 等重要關鍵字眼,大家不一定會在所謂職缺的工作描述中看到,但假設你想在機器學習領域更上一層樓,就千萬不要忽視。
許多公司都在找尋懂得構建、部署機器學習系統的人才,即使在面試過程中,也可能會被問有關 MLOps 觀念的問題。吳恩達總結,在現階段或是不久的未來,MLOps 將會是非常重要且加分的一項重要技能。
轉貼自: TechOrange
若喜歡本文,請關注我們的臉書 Please Like our Facebook Page: Big Data In Finance
留下你的回應
以訪客張貼回應