▲圖片標題(來源:遠見華人)
人工智慧(AI)應用正在各行各業迅速普及。從全球來看,多數企業都將運用人工智慧技術;根據「2021麥肯錫全球人工智慧調研報告」(2021 McKinsey Global Survey on AI),56%的受訪企業表示,至少在一項職能中應用了人工智慧,高於2020年的50%。
麥肯錫研究顯示,到2030年,人工智慧有望為經濟社會額外創造約13兆美元的價值。而根據另一項近期研究,到2030年,中國的人工智慧應用有望創造高達6000億美元的經濟價值。
儘管人工智慧取得了不俗的進展,也帶來了大量的價值創造機會,但作為享譽全球的人工智慧專家和知名投資人,李開復博士依然認為,我們剛剛觸及人工智慧全部潛力的冰山一角。
李開復絕對有資格給出這樣的洞見,他的風險投資公司創新工場資助了數百家成功企業,更培育出了10家人工智慧獨角獸公司。
▲我們仍處於人工智慧普及的早期階段,僅為情境配圖。(來源:遠見華人)
自監督學習(SSL)推動AI投資進入下個黃金時代
近期,李開復與麥肯錫人工智慧業務QuantumBlack中國區合夥人沈愷進行對話,探討了他對於人工智慧發展的預期。
李開復認為,自然語言處理(NLP)應用實現了類似於電腦視覺在過去5~10年所取得的突破,而自監督學習(SSL)將推動人工智慧投資進入第二個黃金時代。
李開復還就其他一些話題分享了見解,包括企業領導者怎樣在運營中充分應用人工智慧,如何轉型成為一家真正的AI驅動型企業,以及為何我們仍處於人工智慧普及的早期階段。
麥肯錫:您對人工智慧的定義是什麼?
李開復:我的定義是,這是一項模擬人類認知和智慧的研究。人工智慧最重要的分支學科是機器學習,而其中的深度學習是一種具有深遠全球影響的演算法。這兩個詞經常被混用,這並不正確。
人工智慧最常見的用例,是在使用海量資料的系統中利用深度學習,優化與商業意圖相一致的目標函數,以做出更好的決策、預測和分類。企業可以利用深度學習來預測未來的銷量和股價,或對物體及語音進行識別和分類。
麥肯錫:據您預測,人工智慧未來會取得怎樣的發展?
李開復:深度學習是一個承載其他技術的平臺。這些技術中包括在過去五六年內出現的兩個最顯著的進步:一是卷積神經網路(CNN),即利用通用深度學習演算法來執行電腦視覺任務:在執行具體任務時,可超越人類水準看見和識別物體,並理解場景;二是自監督學習(SSL),例如,可以訓練一套基於全球自然語言資料的系統來學習英語或漢語,然後針對某個領域進行快速微調。
以上兩個例子表明,深度學習不光能實現匹配、制定決策和優化簡單的目標函數,還可以具備視覺、聽覺和理解能力。隨著人工智慧在執行自動駕駛、健康醫療等領域的復雜任務方面取得進步,深度學習也會進一步增強。
未來5~10年,深度學習仍會是人工智慧最大的支撐平臺,而像卷積神經網路、自監督學習等絕妙的新主意,也會在此基礎上解決過去無法克服的難題。
另一方面,有人認為,深度學習在更多資料登錄、更少人工程式設計的情況下似乎效果更好,所以不適合模擬人類的能力,如推斷、類比或獲取常識。
這種想法認為,利用資料和深度學習的輸入輸出對人類認知進行建模不是一件容易的事情,所以有必要對其進行提升,甚至用全新演算法來取代它。
深度學習的技術還沒有真正成功
未來有這種可能,但我們尚未挖掘出深度學習技術的所有潛能。短期內,我對上述觀點持懷疑態度,其實許多聰明人都已嘗試過,但卻沒有真正成功,大約從40年前的專家系統就開始了。
此外,深度學習憑藉大量的資料和計算能力持續取得突破,做成了許多之前認為不可能的事情,所以應該還有很大的發展空間。
麥肯錫:您如何看待人工智慧在語言中的應用?您認為這種影響是否會比在電腦視覺領域所產生的影響更大?
李開復:確實會。儘管我們主要通過視覺,其次通過聽覺來吸取現實世界的資訊,但語言卻會對人工智慧的商業和科學發展產生更深刻的影響,因為語言是我們交流並獲取知識和思想的方式。
我們正處於與2012年相似的階段,當時Geoffrey Hinton等人展示了如何運用卷積神經網路實現電腦視覺。那時,ImageNet性能飆升,有望在三四年內與人類媲美。
創新工場最大的成功之一,就是意識到電腦視覺會超越人類並改變世界,於是投資了卷積神經網路和深度學習;我們預計,當這一天真正來臨時,應用程式要麼與人類合作共生,要麼在很多情況下徹底取代人類以節約成本。
後來,我們看到了應用如雨後春筍般出現,雖然也出現了深度偽造、人臉識別等爭議問題,但其他技術突破還是得到了人們的普遍認可,如自動駕駛、機器人感知、放射學和病理學識別、數位化、圖像、視頻、3D資料以及製造過程檢測應用等,不勝枚舉。
大約兩年前,OpenAI的GPT-3,即第三代生成預訓練轉換器,推出了一種新的語言學習範式。這種範式基於這樣一個事實:儘管資料越多,人工智慧的效果越好,但我們不可能對萬億級資料庫使用通用標籤標注。
如果只用名詞、動詞這樣的標籤來標記語言資料,顯然是不夠的。你可以標注構建航空預訂系統這樣的特定任務,但無法進行公認的、通用的標籤標注。
因此GPT-3徹底放棄了標籤,轉而訓練新的資料大腦,並基於可以根據過去預測未來的前提假設,將世界上所有的資料都喂給它,以最高的保真度作為目標函數。
這套系統自組織成一個理解並概括語言本質的網路,或許不同於人類的方式,但足以開發預訂、聊天室、語音辨識、機器翻譯、新搜尋引擎、問答、廣告定位等系統。
▲只有不到10%企業真正在使用人工智慧,僅為情境配圖。(來源:遠見華人)
隨著NLP大量湧現,AI投資將開啟第二個黃金時代
我們的觀點是,隨著自然語言處理(NLP)應用像電腦視覺應用一樣大量湧現,人工智慧投資的第二個黃金時代將會開啟。
我們已投資了四家自然語言處理公司,其中一家在中文自然語言處理領域處於領先地位,還開發了一套類似於GPT-3轉換器的模型,並將其壓縮到原先的千分之一,使之具備實用性。他們花了大約三週時間,僅用一名工程師和兩名實習生就開發了一套英語-阿拉伯語機器翻譯系統。整個團隊中沒有一個人會阿拉伯語。
這個例子充分說明,基於全球資料打造一個龐大的自監督學習訓練模型,然後針對具體應用和語言進行微調的方法似乎可行。與之相似,我們展示了基於大模型的快速定制化自然語言處理應用如何在定向廣告等領域發揮作用,這個技術現在非常強大,因為你可以針對不同個體推送不同廣告副本。
自然語言處理也被應用到語音辨識領域,未來五年,我們會看到自然語言公司的覆蓋面和影響力進一步提升,估值也可能會增加,超越5~8年前電腦視覺領域所取得的成就。
麥肯錫:如果以籃球比賽打比方,目前人工智慧的商業應用處於賽程的哪個階段?
李開復:顯然還在第一節。比分可能是7:8,我們用深度學習投中了一個三分球,用卷積神經網路和自監督學習投中了兩個二分球。整個比賽可能剛打了兩分鐘。我們還有很長的路要走——正如我在《AI Superpowers》一書裡提到的,我們才剛剛觸及冰山一角。
有多少企業在真正使用人工智慧?只有不到10%,就連這些企業也未充分挖掘應用的潛能,在落地實施方面還蘊藏很多機會。比如,麥肯錫研究顯示,到2030年,人工智慧有望額外創造約13兆美元的經濟價值。路漫漫其修遠兮,我們對未來抱有很大期待。
麥肯錫:打造AI驅動型企業意味著什麼?
李開復:第一,這意味著要以資料為驅動,因為沒有資料,就沒有人工智慧。企業需要投入資金,將能夠數位化的東西全部數位化,這樣才能為人工智慧提供養分。不要將資料和存儲作為成本中心,而將之視為最能創造價值的資產。
如果你只是把資料收集和存儲作為一筆預算,每年增長5%~10%,那永遠都無法成功,必須徹底轉變思維。然後要利用大資料體現商業智慧,一旦做到這一點,越來越多的決策就會基於資料來制定,而非經驗或直覺。
第二,要尋找易於實現自動化的領域,包括制定決策這種人類處理起來比機器更費時的事情——這通常是為了節約成本。還要不遺餘力地提升利潤、爭取客戶。
第三,將一切可以量化的商業指標與人工智慧關聯起來,從而優化並提出人類與人工智慧共生合作的解決方案。人工智慧完全可以代表我們執行資料豐富、程式相對固定的單一領域任務。
麥肯錫:如果您是一家傳統企業的首席執行官,想要推動AI驅動型企業轉型,您首先會用人工智慧解決什麼商業問題?
李開復:首先考慮公司對人工智慧的認知是否準確。有些高管可能會對人工智慧的效果持懷疑態度,也有些可能抱有不切實際的幻想,這都很正常。我會請一些專家來提供建議,找出一項在資料方面已經準備妥當、能夠與商業結果直接掛鉤的任務。
這樣一來,當人工智慧落地時,他們就會說:「哦,果然如此,確實有效。」之後,我會考慮其他機會,前提條件是我在這方面有很多資料,以及能與目標函數相關聯的商業指標,如削減成本、提高利潤,或是加強客戶行銷的精准性。如果公司沒有資料,我還要面對一個棘手問題——選出一個可以用合理成本收集資料的領域。
但我的首要目標是用生動的人工智慧實例啟迪我的高管和領導團隊,這樣做能激發大家源源不斷的創造力,想出更多的應用創意。第一個落地的項目很重要,如果失敗了,無論是因為無法證明其商業影響,還是因為資料太少或錯誤,抑或實施不當,無論出於什麼原因,領導團隊都會失去信心。
麥肯錫:您能舉例說明一家公司怎樣開始這個過程嗎?
李開復:一種方式是讓公司先不要考慮人工智慧,而是描述其商業驅動力和挑戰,然後讓專家運用人工智慧和其他技術來交付一套解決方案。
比如,某鋼鐵企業最大的問題是他們的液化鐵在輸送過程中冷卻速度過快。我們用物流管理、無人駕駛和安全感測器等方面的人工智慧系統解決了這個問題。當我們贏得這家公司的信任後,他們提出了更多問題,這些都迎刃而解,因為我們已經開啟數位化旅程,並且安裝了感測器來收集資料。
如果你因為沒有資料而難以決定從哪裡入手,那就必須瞭解收集資料的成本。初期收集資料很容易,但清洗資料所需的資源和時間往往超出企業高管的預期。一旦清洗好資料,人工智慧的時間成本和工作難度反而不像人們想像得那麼大。確定問題,獲取資料,並瞭解清洗資料的成本,之後就可以落地實施了。
麥肯錫:以這種方式切入確實很好,但最終要怎樣做才能真正成為一家AI驅動型企業?
李開復:需要對商業流程進行全面數位化,只要是人工智慧比人類表現更好的任務,就應該用人工智慧去輔助或替代。如果有高管只顧著因循守舊、各自為政,而不願擁抱人工智慧,那就要撤換高管,或轉變他們的觀念。
也就是說,首先要信任資料,要制定資料驅動的明智決策,並部署人工智慧。如果你做得不好,別人就會搶你的飯碗;人工智慧可以提高員工技能,因為它最擅長做常規、量化的事情,而員工則可以從事更高層次的創造性任務來提升競爭力。
應該將人工智慧用於管理的方方面面——不只是研發或技術,還可以幫助人力資源部門留住核心員工、初篩崗位簡歷,幫助行銷部門優化和定制EDM(電子郵寄宣傳),以增加客戶閱讀的概率。人工智慧也可以運用在銷售和IT運營管理中,公司的所有部門無一例外都應該利用人工智慧工具來提升業績。
麥肯錫:最後來一組快問快答,資料和演算法,哪個更重要?
李開復:數據。兩者都需要,但沒有資料,一切都是空談。如果已經有一套合理演算法,就要努力獲取更多資料,而不是調整演算法。
麥肯錫:行業知識和人工智慧知識,哪個更重要?
李開復:在某些行業,演算法很重要,因為資料相對簡單,如一家擁有使用者資料的互聯網公司。但在某些領域,行業知識異常復雜。不光要開發應用,還要知道如何選擇正確的銷售管道。醫療就是很明顯的例子。所以兩者都需要。
你首先要考慮進入哪個行業,以及是否真的需要行業知識。如果答案是肯定的,那就優先獲取行業知識。
麥肯錫:當一家公司出售人工智慧解決方案時,最重要的是規模化產品,還是更為迅速的定制?
李開復:定制更重要,因為我們還沒有能夠滿足大量不同需求的人工智慧平臺。定制不可或缺,沒有定制就沒有業務。我希望,五年後你再問我這個問題時,我會說規模化產品更重要,因為屆時人工智慧研究人員已經解決了定制問題。
麥肯錫:對想要用人工智慧推動業務轉型的企業來說,建立MLOps平臺(實現機器學習演算法自動化的一種手段)和推動文化變革,哪個最重要?
李開復:推動變革更加緊迫,我們看到許多公司都在這方面遇到困難。完成文化變革之後,就可以關注MLOps了。
轉貼自: gvlf.gvm.com
若喜歡本文,請關注我們的臉書 Please Like our Facebook Page: Big Data In Finance
留下你的回應
以訪客張貼回應