images/20221109_9.png

▲圖片標題(來源:bnext.com)

人工智慧(AI)研究實驗室OpenAI基於人工智慧演算的文字轉圖像技術「DALL·E」將推出API公測版,這表示開發者可直接將DALL·E串接至應用程式或產品中,讓DALL·E的人工智慧圖像生成技術有更多的應用及可能性。

文字轉圖像技術是什麼?怎麼做的?

DALL·E透過AI模型來理解自然語言輸入(例如「五邊形形狀的綠色皮革錢包」或「一隻悲傷水豚的等距視圖」),並生成相應的圖片。它既可以生成現實的圖像(例如「帶有藍色草莓圖像的彩色玻璃窗」),也能夠生成現實中不存在的物體(例如「具有豪豬紋理的立方體」)。

images/20221109_10.png

▲OpenAI 旗下AI繪圖軟體DALL·E,讓使用者只需輸入文字就能生成圖像。(來源:bnext.com)

DALL·E透過大量的演算法模型訓練,讓用戶使用自然語言提示創建和編輯圖像的轉換器語言模型,在正式釋出API之前,已經有時尚設計平台Cala和在裝飾瓷磚印出線上照片的Mixtiles等公司合作,針對特定的使用場景和產品需求進行測試。

OpenAI根據開發者使用的圖像數量及圖像尺寸收費,DALL·E 2的API使用價格為1024×1024 的圖片每張約0.6元台幣(0.02美元);512×512的圖片每張約0.58元台幣(0.018美元); 256×256的圖片則是每張約0.05元台幣(0.016美元)。

與微軟、Shutterstock合作,你想要的圖AI都能生給你

文字轉圖像的AI應用近來受到廣大用戶的喜愛,微軟日前也與OpenAI合作,將DALL·E整合至圖形設計應用程式Designer,以及內建Image Creator工具的瀏覽器 Bing 和 Microsoft Edge 之中, 當用戶在網路上搜尋不到想要的圖片時,就會透過整合DALL·E的Image Creator產生所需的圖像 。

此外,圖庫平台Shutterstock日前也宣布和OpenAI合作,讓使用者根據輸入的文字條件產生圖像。Shutterstock去年起就與OpenAI合作,授權OpenAI以平台上的圖片為素材,訓練DALL-E演算模型。不過,為了避免侵權的狀況發生,其他圖庫業者包括Getty目前仍是禁止出售以AI產生的圖片。

images/20221109_11.png

▲OpenAi可產出256×256、512×512、1024×1024 三種畫素。(來源:bnext.com)

文字轉圖像商機有多大?為何連Google也投入?

不僅是OpenAI積極投入DALL·E的開發,Google今年中也公布了基於人工智慧的文字轉圖像生成系統Imagen。Imagen基於大型Transformer語言模型所建立,透過使用文字轉圖像擴散模型(Diffusion Model),讓Imagen對文字能有更深的理解,進而產出更貼近用戶所需的圖像。

Google表示,在未能完全過濾網路上不當的色情、暴力、種族主義、社會刻板印象等內容之前,以及建立安全框架之前,不考慮將Imagen公開給大眾使用。

由於開發先進人工智慧系統所需的人員、運算、及最重要的資金等資源都很龐大,多數人工智慧新創公司在初期所獲的融資規模仍是入不敷出,因此目前針對AI新創公司的孵化器項目並不多,因此OpenAI無疑是希望透過這項投資計畫,在商用範圍和利潤越來越大的AI行業中,能透過扶植有潛力的AI新創公司以斬獲先機。

雖然今年以來美國科技公司多受到通膨及經濟不景氣的影響而撙節開銷、謹慎投資,但OpenAI卻在微軟與其他合作夥伴的支持下,與獲得OpenAI投資1億美元的新創團隊Converge合作,將選出尚在種子輪的10位新創公司創辦人,提供100萬美元的資金、獲得早期使用OpenAI模型、為其新創公司量身定制的AI程式等協助,同時享有與OpenAI員工一同工作、參加研討會等活動共計5周的時間。

同一時間,市場傳出Google計畫投資專注開發自然語言處理軟體的人工智慧新創公司Cohere 2億美元的資金。Cohere執行長艾登·戈梅茲(Aidan Gomez)之前是Google Brain的實習生,他發表的論文推動了Transformer AI 模型的廣泛應用。從OpenAI和Google近來砸大錢投資人工智慧新創公司的做法,可預期人工智慧將是大型科技公司之間軍備競賽的另一個領域。

這點從AI新創公司Stability AI和Jasper今年來相繼獲得創投基金的注資,而在一遍不景氣中躍升為估值達10億美元以上的新創獨角獸公司可證明。Stability.Ai與DALL·E同樣都是基於人工智慧技術開發的文字轉生成圖像的工具;而Jasper則是透過白話的編寫開放式命令來產生社群、部落格、行銷用的文案或文章內容,讓使用者可輸入直白的文字,設定文章主軸、內容資訊、目標讀者等訊息,就能產生行銷文章來分享,堪稱是網路小編和行銷人未來的大敵。

轉貼自: bnext.com

若喜歡本文,請關注我們的臉書 Please Like our Facebook Page: Big Data In Finance

 


留下你的回應

以訪客張貼回應

0
  • 找不到回應

YOU MAY BE INTERESTED