online gambling singapore online gambling singapore online slot malaysia online slot malaysia mega888 malaysia slot gacor live casino malaysia online betting malaysia mega888 mega888 mega888 mega888 mega888 mega888 mega888 mega888 mega888 地表最強編碼AI!Anthropic發布Claude 4模型:可自主運行7小時,懂玩寶可夢還幫你寫攻略

摘要: Anthropic重磅更新!發布旗下兩款Claud 4 系列模型,記憶功能大升級後,甚至能幫玩家玩寶可夢。

 


0000

 

重點一 :AI 公司 Anthropic 發布全新 Claude Opus 4 及 Sonnet 4 模型,Opus 4 專為長時間複雜自主任務設計,編碼能力獲重大提升。 重點二 :新模型引入記憶功能與「擴展思考與工具使用」能力,可處理更深層次邏輯任務,並能與外部工具交錯運作以提升效能。 重點三 :GitHub 宣布其 Copilot 新一代編碼代理將採用 Sonnet 4 模型,顯示 Anthropic 技術已獲業界高度肯定。 人工智慧新創公司 Anthropic 於本週四宣布推出其最新、功能最強大的 AI 模型系列:Claude Opus 4 與 Claude Sonnet 4。此次發布標誌著 Anthropic 在去年六月以來專注於中階 Sonnet 系列後,重返大型模型發布的行列。 其中,Opus 4 被譽為該公司迄今最強的編碼模型,專為能自主運行數小時的複雜、長期任務而設計,旨在滿足市場對代理型 AI 應用日益增長的需求。 Anthropic 的 Claude 關係主管 Alex Albert (亞歷克斯·艾伯特) 指出,Opus 4 的高智能特性將完美契合這股代理型應用的浪潮。

長效記憶與智能進化:幫打寶可夢同時寫攻略

 

Anthropic 的 Claude AI 模型系列包含 Haiku、Sonnet 和 Opus 三種不同「規模」的型號,旨在於價格、速度和能力之間取得平衡。Haiku 為最輕巧、成本最低但能力也最基礎的選項;Sonnet 則為兼顧成本與效能的中階選擇;Opus 系列向來是規模最大、運行速度較慢,但上下文理解深度與邏輯處理能力最強的頂級模型。 為克服長時間運作的限制,本次發布的 Claude Opus 4 及 Sonnet 4 模型皆內建記憶功能,允許其在長時間會話中利用外部文件儲存關鍵資訊,如同人類在長時間工作時做筆記一般。 此外,兩種 Claude 4 模型都引入了名為「擴展思考與工具使用」的全新測試版功能,允許模型在模擬推理與使用網頁搜索等外部工具之間交替運作,進一步提升其解決複雜問題的效率與準確性。 Albert 表示,Claude Opus 4 在記憶能力方面顯著優於先前所有模型。當開發者建構的應用程式賦予 Claude 存取本機檔案的權限時,Opus 4 便能建立並維護用以儲存關鍵資訊的「記憶檔案」(memory files),進一步提升長期代理任務的執行效能。 例如 Opus 4 能一邊進行《寶可夢》(Pokémon) 遊戲,一邊創建「導航指南」(Navigation Guide)。相較之下,早期 Claude 模型通常僅能維持一至兩小時的連貫性。日本科技服務集團 Rakuten (樂天) 亦驗證了 Claude 在一項要求嚴苛的開源重構任務中,能獨立運行七小時並維持穩定效能。

基準測試評分超群!獲GitHub納入編碼代理基礎模型

 

Anthropic 宣稱 Opus 4 在編碼任務的行業基準測試中處於領先地位,於 SWE-bench (SWE-bench) 達到72.5% 的評分,在 Terminal-bench (Terminal-bench) 則獲得43.2% 的成績,並稱其為「全球最佳編碼模型」。Sonnet 4 在 SWE-bench 獲得72.7% 的高分,同時保持比 Opus 4 更快的反應時間。因此,GitHub 選擇與 Anthropic 合作,而非其母公司 Microsoft 緊密合作的 OpenAI 模型,可以說間接證明了 Anthropic 技術的競爭力。儘管新模型在減少「獎勵駭客行為」(如未經授權操作或過度輸出)方面已降低約80%,但 Albert 承認, 人工代碼審查在任何產品代碼發布中仍至關重要 ,AI 的非確定性本質為開發者帶來了新的挑戰與機遇,強調開發者仍需要調整對可靠性的看法。 Claude Opus 4 的定價為每百萬輸入 tokens 收費15美元(約為新台幣450元),輸出則為75美元(約為新台幣2250元);Sonnet 4 的價格則維持在輸入3美元(約為新台幣90元)與輸出15美元(約為新台幣450元)。 兩款模型已可透過 Anthropic API、Amazon Bedrock 及 Google Cloud Vertex AI 存取。Sonnet 4 仍對免費使用者開放,Opus 4 則需付費訂閱。同時,經過數月預覽測試的 Claude Code 編碼環境也正式推出,並整合至 VS Code 與 JetBrains IDEs。

轉貼自: bnnext.com

 

若喜歡本文,請關注我們的臉書 Please Like our Facebook Page: Big Data In Finance

 


留下你的回應

以訪客張貼回應

0
  • 找不到回應

YOU MAY BE INTERESTED

Popular Tags