Meta發(fā)布開源人工智能模型Llama 3.1

2024-07-24 12:57

來源：澎湃新聞·澎湃號·湃客

早在今年4月，Meta就透露說，它正在開發(fā)人工智能行業(yè)的第一款產品:一個性能與OpenAI等公司最好的私有模型相媲美的開源模型。

今天，該大模型已經問世。Meta發(fā)布 Llama 3.1，這是有史以來最大的開源人工智能模型。Meta聲稱，Llama 3.1在幾個基準測試上的表現優(yōu)于gpt-4o和Anthropic的Claude 3.5 Sonnet。

Llama 3.1還在更多國家和語言中提供基于 Llama 的 Meta 人工智能助手，同時增加了一項功能，可以根據某人的特定形象生成圖像。首席執(zhí)行官馬克·扎克伯格預測，Meta AI 將在今年年底超過 ChatGPT成為使用最廣泛的人工智能助手。

Llama 3.1 比幾個月前推出的較小的 Llama 3 模型要復雜得多。最大版本擁有 4050 億個參數，并使用了超過 16000 個英偉達極其昂貴的 H100 GPU 進行訓練。Meta 沒有透露開發(fā) Llama 3.1 的成本，但僅根據英偉達芯片的成本計算，保守估計也有數億美元。

那么，考慮到成本，為什么 Meta 繼續(xù)以只需擁有數億用戶的公司批準的許可證免費提供 Llama 呢？在 Meta 公司博客上發(fā)表的一封信中，扎克伯格認為，開源人工智能模型將超越——并且已經比——專有模型改進得更快，類似于 Linux 如何成為為當今大多數手機、服務器和小工具提供動力的開源操作系統(tǒng)。

行業(yè)的一個轉折點，大多數開發(fā)者開始主要使用開源

馬克·扎克伯格將 Meta 在開源人工智能方面的投資與早期的開放計算項目進行了比較，他說，在建立自身能力時，讓像惠普這樣的外部公司幫助改進和標準化 Meta 的數據中心設計，為公司節(jié)省了數十億美元。展望未來，他預計人工智能也會出現同樣的動態(tài)，寫道：“我相信 Llama 3.1 的發(fā)布將是行業(yè)的一個轉折點，大多數開發(fā)者開始主要使用開源。”

為了幫助 Llama 3.1 走向世界，Meta 正在與包括微軟、亞馬遜、谷歌、英偉達和 Databricks 在內的二十多家公司合作，幫助開發(fā)者部署自己的版本。Meta 聲稱，Llama 3.1的生產成本大約是OpenAI gpt - 4o的一半。Meta正在發(fā)布模型權重，以便公司可以在自定義數據上對其進行訓練，并根據自己的喜好進行調整。

不出所料，Meta并沒有透露太多用于訓練Llama 3.1的數據。據人工智能行業(yè)公司的工作人員表示，Meta不披露這些信息是因為這是商業(yè)機密，而批評人士則表示，這是一種策略，旨在拖延不可避免的版權訴訟沖擊。

Meta透露，它使用了合成數據，即由模型而非人類生成的數據，讓擁有 4050 億參數的 Llama 3.1 版本改進了較小的 700 億和 80 億版本。Meta 生成式人工智能副總裁Ahmad Al-Dahle預測，Llama 3.1 作為用于培訓隨后部署的較小模型的老師將受到開發(fā)者的歡迎，以更具成本效益的方式。

當詢問 Meta 是否同意行業(yè)中關于模型的優(yōu)質訓練數據即將耗盡這一日益增長的共識時，Ahmad Al-Dahle表示即將達到上限，盡管可能比一些人認為的要晚。他說：“我們絕對認為我們還有幾次（訓練）運行，但很難說。”

這是 Meta 首次對 Llama 3.1 的紅隊測試（或對抗性測試）包括尋找潛在的網絡安全和生化用例。更嚴格測試該模型的另一個原因是 Meta 所描述的新興智能行為。

例如，Ahmad Al-Dahle，Llama 3.1 能夠與搜索引擎 API 集成，“根據復雜的查詢從互聯網檢索信息，并連續(xù)調用多個工具以完成您的任務”。他給出的另一個例子是要求模型繪制過去五年美國售出房屋的數量。它可以為您檢索（網絡）搜索并生成 Python 代碼并執(zhí)行它。

Meta自己對Llama的實現是它的人工智能助手，它被定位為像ChatGPT一樣的通用聊天機器人，可以在 Instagram、Facebook 和 WhatsApp 的幾乎每個部分找到。從本周開始，Llama 3.1 將首先通過美國的 WhatsApp 和 Meta AI 網站訪問，隨后幾周內將在 Instagram 和 Facebook 上推出。它正在更新以支持新語言，包括法語、德語、印地語、意大利語和西班牙語。

雖然 Llama 3.1 最先進的 4050 億參數模型在 Meta AI 中可免費使用，但在給定的一周內超過未指定數量的提示后，助手將切換到規(guī)模較小的 700 億模型。這表明 4050 億模型對于 Meta 來說全面運行成本過高。發(fā)言人Jon Carvill表示，公司將在評估早期使用情況后提供有關提示閾值的更多信息。

Meta AI 中的新Imagine Me功能通過您手機的攝像頭掃描您的面部，然后讓您將自己的形象插入其生成的圖像中。通過這種方式捕捉您的形象，而不是通過您個人資料中的照片，Meta 有望避免創(chuàng)建深度偽造機器。該公司看到了人們對創(chuàng)建更多種類的人工智能媒體并分享到其動態(tài)的需求，即使這意味著模糊真實與不真實之間的界限。

Meta AI 也將在未來幾周內登陸 Quest 頭戴設備，取代其語音命令界面。就像它在 Meta Ray-Ban 眼鏡中的實現一樣，當您處于頭戴設備的直通模式（通過顯示屏顯示現實世界）時，您將能夠在 Quest 上使用 Meta AI 來識別和了解您正在查看的內容。

除了馬克·扎克伯格預測 Meta AI 將在今年年底成為使用最廣泛的聊天機器人（ChatGPT擁有超過1億用戶）之外，Meta 尚未分享其助手的任何使用數據?！拔艺J為整個行業(yè)在實現產品與市場匹配的道路上仍處于早期階段，”Ahmad Al-Dahle說。盡管人工智能已經感覺有些過度炒作，但很明顯，Meta 和其他參與者認為這場競賽才剛剛開始。

特別聲明

本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布，僅代表該作者或機構觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#人工智能模型