圖/Shutterstock
放大鏡短評
CMoney過去曾整理過開源模型的優勢【關鍵趨勢】開源私有大比拚,AI 聯盟 vs OpenAI vs Google誰是最後的AI王者,顯然現在Google(GOOG)也開始雙邊下注,證明開源市場的潛力。CMoney研究團隊認為投資者須注意GPU算力的增幅是否會降低模型訓練的成本與門檻,若模型的訓練門檻降低,將有可能使得開源模型取代私有模型。
新聞資訊
Google(GOOG)今日揭曉自家最新免費開源AI模型系列,此系列被命名為「Gemma」。 這對其需要支付才能使用的高性能Gemini模型而言,可謂是種致敬與策略性回應。Gemma將與Meta和像是Mistral、Hugging Face等資金充裕的AI新創公司展開直接競爭。
過去一年以來,專有AI模型的提供者與推廣開源模型的一方,兩者間逐漸形成立場相對的陣營。開源模型規模雖較小、功能不全面,然而效能差距已經快速縮小。同時,開源模型不但尺寸精簡,其高客製化的特性,也深受到程式設計師和工程師的喜愛,尤其針對那些欲打造AI應用程式,以及期望嚴密控制高漲之AI建置成本的公司而言更是如此。
直到今日Google仍是私有模型陣營的支持者,與競爭對手如OpenAI和Microsoft(MSFT)相同。 但今日該公司的公告也承認開源模式在某種程度上正漸漸取勝,至少部分如此,畢竟開源AI最大的支持者就包含了臉書的母公司Meta(META)。而Google此舉顯示其態度轉向,選擇對兩方下注,以求全贏局面。 亞馬遜(AMZN)的雲端運算部門AWS亦跨足兩大陣營,起初他們與Hugging Face等開源主力合作,隨後卻也選擇與提供專有AI模型的新創Anthropic締結夥伴關係。
Google負責開發Gemma新系列模型的深度學習部門(DeepMind)產品管理總監Tris Warkentin表示,公司如此回應是因為軟體工程師們透露他們在建置AI應用程式時,常常使用到兩類模型。工程師們偏好只在真正需要額外功能時,才有賴於高價的專有模型。例如,當需要分析圖像中發生的事情並且對應生成文字描述時,此類進階模型便顯得格外優異。
同時,以這種方法打造應用程式也對企業有利,因為無論專有或開源模型,兩者和使用中的資料都能直接在同一雲端運算平台運行。在多個雲端與模型間傳輸數據不但增加了難度,也可能引入時間延遲與系統錯誤等風險。 Warkentin說明,Google期望藉由同時提供專有和開源模型,能夠吸引更多客戶完全透過Google雲端平台建構他們的AI程式。
雖然Google宣稱Gemma是基於部分與自家Gemini模型相同的技術原則所建立,但Gemini模型設計用以進行音頻、影像、文字等多種格式的輸入輸出,Gemma卻僅限於純文字作業。此外,Gemini具備多語言處理能力,Gemma則預計先以英語版本推出。
當涉及到所釋出的AI模型安全性時,Google一直試圖將自己定位成較OpenAI和其他競爭者更具責任感的形象。然而,比起專有模型,開源的形式卻潛在更多危險。極為困難去完全阻止使用者出於邪惡目的而誤用該模型,例如撰寫惡意程式或種族仇恨之虛假資訊。此外,也很容易就能將開源模型調整成模仿具版權之內容,或是鼓動自殘等行為。開發者最初設在模型周圍用以防弊的限制,往往能輕易被有技術力的程式人員所破解。
提供一個與自家專有Gemini模型有些共同點的開源模型,可能間接替技術純熟的攻擊者開闢了新的途徑,得以繞過Gemini原有的安全機制。卡內基梅隆大學的研究人員於去年揭露,若他們能取得開源語言模型的神經網路設定,便可以建立一套自動化的軟體,用以設計能夠突破多數模型安全防護的字句提示(Prompt)。而如果這些模型彼此還有相似之處,更可能大幅簡化這個攻破程序,而這正是Google說明Gemma與Gemini的共通點。
Google表示Gemma的設計已導入現有開源技術中最強的防護機制,包括仔細篩檢用於訓練Gemma的資料庫,確保任何個人資訊都被徹底過濾,如此模型稍後才不會造成隱私洩漏。此外,還進行了包含大規模「紅隊演習」(Red-teaming)的廣泛安全測試與評估,在此演習中扮演攻擊者角色的人將設法突破模型的防線。Warkentin表示因為他們知道使用者有更多操作空間得以破解開源模型的防護,所以Gemma的安全測試甚至比內部的Gemini模型更為縝密。
Google同時說明Gemma會與一系列使用規範、模型部署指引,以及一項防範模型產生有問題輸出的新式安全篩檢技術一同發布。
Google副總裁兼關係開發部門總經理兼負責人Jeanine Banks則回應,公司預設了廣泛使用條款,用以禁止程式設計師將Gemma用於任何不軌企圖。這也是為什麼公司偏好使用「開放模型」(Open Model)來對Gemma定性,並與傳統「開源」軟體(Open-Source)做區別,因為後者往往使用完全無限制之使用條款。與 Meta的做法不同,Meta在其 Llama 2開源模型的使用條款上設限,阻止其他大型科技公司成為使用方,對此Google則表示Gemma沒有此類的商業設限。
Gemma模型共有兩種規模,一種是包含20億個可調整參數的神經網路,稱之為「參數」,另一種則是包含70億個參數的神經網路。兩種都比Google最小的專有模型Gemini Nano更大 — 後者專為能在智慧型手機或其他邊緣運算裝置中運行,內建約18億個參數。但Gemma顯然還是比Gemini的 Pro 和 Ultra 系列模型小很多,Pro可能具有數百億個參數之譜,而 Ultra 則很可能擁有1兆以上。
延伸閱讀:
【美股盤勢分析】輝達再度擊敗預期,盤後反彈超過9%!(2024.02.22)
【美股研究報告】亞馬遜Amazon真的好強,財報及展望勢不可擋,股價大漲是理所當然?
【美股研究報告】Meta 23Q4 廣告營收加速升溫,盤後股價飛漲15%可望續創新高!
【美股研究報告】AI邊緣化大勢所趨!高通 FY2024可重返成長軌道!
版權聲明
本文章之版權屬撰文者與 CMoney 全曜財經,未經許可嚴禁轉載,否則不排除訢諸法律途徑。
免責宣言
本網站所提供資訊僅供參考,並無任何推介買賣之意,投資人應自行承擔交易風險。