- +1
Meta發(fā)布開源人工智能模型Llama 3.1
早在今年4月,Meta就透露說,它正在開發(fā)人工智能行業(yè)的第一款產品:一個性能與OpenAI等公司最好的私有模型相媲美的開源模型。
今天,該大模型已經問世。Meta發(fā)布 Llama 3.1,這是有史以來最大的開源人工智能模型。Meta聲稱,Llama 3.1在幾個基準測試上的表現優(yōu)于gpt-4o和Anthropic的Claude 3.5 Sonnet。

Llama 3.1還在更多國家和語言中提供基于 Llama 的 Meta 人工智能助手,同時增加了一項功能,可以根據某人的特定形象生成圖像。首席執(zhí)行官馬克·扎克伯格預測,Meta AI 將在今年年底超過 ChatGPT成為使用最廣泛的人工智能助手。
Llama 3.1 比幾個月前推出的較小的 Llama 3 模型要復雜得多。最大版本擁有 4050 億個參數,并使用了超過 16000 個英偉達極其昂貴的 H100 GPU 進行訓練。Meta 沒有透露開發(fā) Llama 3.1 的成本,但僅根據英偉達芯片的成本計算,保守估計也有數億美元。
那么,考慮到成本,為什么 Meta 繼續(xù)以只需擁有數億用戶的公司批準的許可證免費提供 Llama 呢?在 Meta 公司博客上發(fā)表的一封信中,扎克伯格認為,開源人工智能模型將超越——并且已經比——專有模型改進得更快,類似于 Linux 如何成為為當今大多數手機、服務器和小工具提供動力的開源操作系統(tǒng)。
行業(yè)的一個轉折點,大多數開發(fā)者開始主要使用開源
馬克·扎克伯格將 Meta 在開源人工智能方面的投資與早期的開放計算項目進行了比較,他說,在建立自身能力時,讓像惠普這樣的外部公司幫助改進和標準化 Meta 的數據中心設計,為公司節(jié)省了數十億美元。展望未來,他預計人工智能也會出現同樣的動態(tài),寫道:“我相信 Llama 3.1 的發(fā)布將是行業(yè)的一個轉折點,大多數開發(fā)者開始主要使用開源。”
為了幫助 Llama 3.1 走向世界,Meta 正在與包括微軟、亞馬遜、谷歌、英偉達和 Databricks 在內的二十多家公司合作,幫助開發(fā)者部署自己的版本。Meta 聲稱,Llama 3.1的生產成本大約是OpenAI gpt - 4o的一半。Meta正在發(fā)布模型權重,以便公司可以在自定義數據上對其進行訓練,并根據自己的喜好進行調整。


不出所料,Meta并沒有透露太多用于訓練Llama 3.1的數據。據人工智能行業(yè)公司的工作人員表示,Meta不披露這些信息是因為這是商業(yè)機密,而批評人士則表示,這是一種策略,旨在拖延不可避免的版權訴訟沖擊。
Meta透露,它使用了合成數據,即由模型而非人類生成的數據,讓擁有 4050 億參數的 Llama 3.1 版本改進了較小的 700 億和 80 億版本。Meta 生成式人工智能副總裁Ahmad Al-Dahle預測,Llama 3.1 作為用于培訓隨后部署的較小模型的老師將受到開發(fā)者的歡迎,以更具成本效益的方式。
當詢問 Meta 是否同意行業(yè)中關于模型的優(yōu)質訓練數據即將耗盡這一日益增長的共識時,Ahmad Al-Dahle表示即將達到上限,盡管可能比一些人認為的要晚。他說:“我們絕對認為我們還有幾次(訓練)運行,但很難說。”
這是 Meta 首次對 Llama 3.1 的紅隊測試(或對抗性測試)包括尋找潛在的網絡安全和生化用例。更嚴格測試該模型的另一個原因是 Meta 所描述的新興智能行為。
例如,Ahmad Al-Dahle,Llama 3.1 能夠與搜索引擎 API 集成,“根據復雜的查詢從互聯網檢索信息,并連續(xù)調用多個工具以完成您的任務”。他給出的另一個例子是要求模型繪制過去五年美國售出房屋的數量。它可以為您檢索(網絡)搜索并生成 Python 代碼并執(zhí)行它。
Meta自己對Llama的實現是它的人工智能助手,它被定位為像ChatGPT一樣的通用聊天機器人,可以在 Instagram、Facebook 和 WhatsApp 的幾乎每個部分找到。從本周開始,Llama 3.1 將首先通過美國的 WhatsApp 和 Meta AI 網站訪問,隨后幾周內將在 Instagram 和 Facebook 上推出。它正在更新以支持新語言,包括法語、德語、印地語、意大利語和西班牙語。
雖然 Llama 3.1 最先進的 4050 億參數模型在 Meta AI 中可免費使用,但在給定的一周內超過未指定數量的提示后,助手將切換到規(guī)模較小的 700 億模型。這表明 4050 億模型對于 Meta 來說全面運行成本過高。發(fā)言人Jon Carvill表示,公司將在評估早期使用情況后提供有關提示閾值的更多信息。

Meta AI 中的新Imagine Me功能通過您手機的攝像頭掃描您的面部,然后讓您將自己的形象插入其生成的圖像中。通過這種方式捕捉您的形象,而不是通過您個人資料中的照片,Meta 有望避免創(chuàng)建深度偽造機器。該公司看到了人們對創(chuàng)建更多種類的人工智能媒體并分享到其動態(tài)的需求,即使這意味著模糊真實與不真實之間的界限。
Meta AI 也將在未來幾周內登陸 Quest 頭戴設備,取代其語音命令界面。就像它在 Meta Ray-Ban 眼鏡中的實現一樣,當您處于頭戴設備的直通模式(通過顯示屏顯示現實世界)時,您將能夠在 Quest 上使用 Meta AI 來識別和了解您正在查看的內容。
除了馬克·扎克伯格預測 Meta AI 將在今年年底成為使用最廣泛的聊天機器人(ChatGPT擁有超過1億用戶)之外,Meta 尚未分享其助手的任何使用數據?!拔艺J為整個行業(yè)在實現產品與市場匹配的道路上仍處于早期階段,”Ahmad Al-Dahle說。盡管人工智能已經感覺有些過度炒作,但很明顯,Meta 和其他參與者認為這場競賽才剛剛開始。
本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




