欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

元宇宙聊天室|大模型“涌現(xiàn)”下的商業(yè)機(jī)遇:“百模大戰(zhàn)”誰(shuí)能勝出

澎湃新聞?dòng)浾?宦艷紅 實(shí)習(xí)生 陳曉銳
2023-07-12 07:43
來(lái)源:澎湃新聞
? 未來(lái)2% >
字號(hào)

生成式AI技術(shù)正在改變?nèi)斯ぶ悄苄袠I(yè),時(shí)隔僅半年,國(guó)內(nèi)大模型發(fā)展已完成從技術(shù)到產(chǎn)品、再到商業(yè)的階段跨越,并深入垂直行業(yè)領(lǐng)域。7月6日世界人工智能大會(huì)期間,澎湃科技邀請(qǐng)北森人才管理研究院副院長(zhǎng)王丹君、中金公司研究部副總經(jīng)理于鐘海、中關(guān)村科金技術(shù)副總裁張杰做客元宇宙聊天室,共同探討大模型“涌現(xiàn)”下的商業(yè)創(chuàng)新機(jī)遇。本場(chǎng)對(duì)話由澎湃科技記者邵文主持,在一個(gè)小時(shí)的對(duì)話中,嘉賓們討論了多個(gè)相關(guān)問(wèn)題,包括:

通用大模型和垂直領(lǐng)域大模型在未來(lái)的商業(yè)場(chǎng)景中如何找到自身的價(jià)值?

企業(yè)如何抓住大模型的商業(yè)機(jī)遇?抓住機(jī)遇的關(guān)鍵點(diǎn)是什么?

……

大模型的前世與未來(lái)

澎湃科技:眼下國(guó)內(nèi)市場(chǎng)已經(jīng)形成了“百模大戰(zhàn)”的局面,各位覺(jué)得國(guó)內(nèi)大模型為何發(fā)展如此之快?對(duì)各位所在領(lǐng)域都有什么樣的影響?

王丹君(北森人才管理研究院副院長(zhǎng)):從技術(shù)的角度來(lái)講,大模型的發(fā)展并不是最近這一兩年的事情。很多年前在學(xué)術(shù)領(lǐng)域,大家已經(jīng)開(kāi)始做研究。只是這幾年伴隨數(shù)據(jù)量的增加,技術(shù)水平的提高,尤其是在OpenAI發(fā)布了ChatGPT以后,引發(fā)了廣泛的關(guān)注。

對(duì)于各個(gè)領(lǐng)域來(lái)講,大家思考的都是怎么把這樣一個(gè)新技術(shù),運(yùn)用到自己的領(lǐng)域,如何去改善自己的商業(yè)模式。

比如說(shuō),我們北森人才管理研究院屬于人力資源行業(yè),服務(wù)的客戶都是企業(yè)的HR(人力資源)群體。我們覺(jué)得大模型在人力資源領(lǐng)域的應(yīng)用,未來(lái)可能產(chǎn)生一些顛覆性的價(jià)值,譬如它確實(shí)能夠更好地提高大家的工作效率;它會(huì)在一定程度上幫助我們的伙伴,不管是HR還是員工更好地掌握工作技能;它能夠更好地指引員工的發(fā)展;同時(shí),也能幫助企業(yè)回答很多人力資源管理上的問(wèn)題,包括我們?cè)谡衅竼T工時(shí)經(jīng)常問(wèn)的:誰(shuí)更適合、誰(shuí)可能帶來(lái)更好的績(jī)效、薪酬應(yīng)該如何確定等。我覺(jué)得大模型的發(fā)展與應(yīng)用會(huì)在非常短的時(shí)間改造人力資源行業(yè)。

于鐘海(中金公司研究部副總經(jīng)理)王院長(zhǎng)講到了非常重要的一點(diǎn),就是大模型技術(shù)并不是今天才發(fā)生的。2017年,谷歌寫(xiě)了一篇很有名的論文,叫Attention Is All You Need(注意力就是你所需要的一切),提出了transformer架構(gòu)。

其實(shí)中國(guó)人工智能產(chǎn)業(yè)的踐行者很早就發(fā)現(xiàn)了大模型技術(shù)的潛力。我們?cè)?021年也撰寫(xiě)了相關(guān)的研究報(bào)告,當(dāng)時(shí)已被人工智能大模型的發(fā)展所震撼?,F(xiàn)在ChatGPT這個(gè)具體的產(chǎn)品讓老百姓都知道了大模型,不管你懂不懂技術(shù),只要玩一下,就能感受到它的魅力,所以大模型火了。

大模型能夠這么快的被千行百業(yè)應(yīng)用起來(lái)也依賴于技術(shù)平權(quán),這是我們提出的一個(gè)很重要的概念。得益于開(kāi)源社區(qū)的發(fā)展,知識(shí)的自然傳播,使得很多企業(yè)都快速做出了自己的大模型。

另外我想補(bǔ)充的是,這次我們看到整個(gè)科技圈乃至全社會(huì)形成了一股合力,即“所有的人都認(rèn)為這事非常重要”,這是以往很少見(jiàn)到的。

張杰(中關(guān)村科金技術(shù)副總裁):我覺(jué)得大模型元年可以追溯到2020年GPT3推出的時(shí)候。為什么過(guò)去這半年發(fā)展如此之快?我認(rèn)為是三方面的原因:

第一方面是有一些企業(yè)、高校之前就有很多積累,比如百度、華為、清華大學(xué)等,他們之前就有預(yù)訓(xùn)練語(yǔ)言模型或者大模型,最近半年對(duì)他們來(lái)說(shuō)就是版本的更新迭代;

第二方面是各個(gè)企業(yè)包括一些投資機(jī)構(gòu)加大了投資力度;

第三方面是依賴于開(kāi)源,開(kāi)源社區(qū)帶動(dòng)了企業(yè)推出各種各樣的領(lǐng)域大模型。

關(guān)于大模型對(duì)所在領(lǐng)域的影響,對(duì)客戶和我們來(lái)說(shuō)是雙向利好。中關(guān)村科金作為一家領(lǐng)先的對(duì)話式AI技術(shù)解決方案提供商,大模型降低了我們定制化開(kāi)發(fā)各種場(chǎng)景模型的成本,這對(duì)我們來(lái)說(shuō)是利好消息。對(duì)我們客戶而言,智能化項(xiàng)目成本降低,使得很多中小企業(yè)也開(kāi)始考慮立項(xiàng),整個(gè)市場(chǎng)規(guī)模變大了。

澎湃科技:最近騰訊云、OpenAI都先后提出定制化模型軟件的大模型商店,有點(diǎn)類似于app store的這種形式,各位如何理解這個(gè)趨勢(shì)?

王丹君:不管是投資者,還是這個(gè)領(lǐng)域的實(shí)踐者,相信大家都期望看到這個(gè)趨勢(shì),因?yàn)樗偈垢嗳藚⑴c到這個(gè)領(lǐng)域的共創(chuàng)上來(lái)。我們認(rèn)為,對(duì)于基礎(chǔ)服務(wù)廠商來(lái)講,未來(lái)一段時(shí)間肯定會(huì)趨向商店模式,這樣更容易貼近客戶。大模型商店的模式也使得接受服務(wù)的用戶能更好地利用大模型去創(chuàng)造一些新的應(yīng)用場(chǎng)景和服務(wù)價(jià)值。

于鐘海:這其實(shí)是資本市場(chǎng)非常關(guān)注的一個(gè)問(wèn)題。我會(huì)認(rèn)為大模型的發(fā)展將來(lái)更像中國(guó)的公有云和私有云。

公有云其實(shí)當(dāng)時(shí)叫IaaS(Infrastructure-as-a-Service,基礎(chǔ)設(shè)施即服務(wù)),到了大模型這,我們叫MaaS(Model as a Service模型即服務(wù))。海外有一個(gè)很知名的企業(yè)叫Hugging Face(抱抱臉),它就是把很多模型放在網(wǎng)上,你只要調(diào)用他的API(Application Program Interface,應(yīng)用程序接口)就能使用不同的AI模型。

但也有很多企業(yè),由于安全合規(guī)、細(xì)分場(chǎng)景落地等要求,需要部署自己的大模型,并用自己的知識(shí)給它增強(qiáng)做自己的Fine Tune(微調(diào)),這可能會(huì)像中國(guó)的私有云市場(chǎng)一樣。

廣義上來(lái)說(shuō),大模型其實(shí)是不適合大家直接去使用的,包括ChatGPT,它其實(shí)也是在大模型的基礎(chǔ)上包裝成一個(gè)產(chǎn)品,讓每個(gè)老百姓都能體驗(yàn)。所以基于大模型去做應(yīng)用,實(shí)際上是一個(gè)非常廣闊的市場(chǎng),它能衍生出很多商業(yè)模式,比如說(shuō)數(shù)字員工,再比如剛剛主持人提到的這個(gè)app store的概念。

其實(shí)ChatGPT也被很多人認(rèn)為是一個(gè)流量入口,據(jù)我所知有一些大模型手機(jī)廠商也可能會(huì)下場(chǎng)去做搜索,那這件事情就截然不同了,它的可及市場(chǎng)就會(huì)從企業(yè)的IT支出變成營(yíng)銷支出。中國(guó)企業(yè)可能在IT上的支出平均為收入的1%-3%,但可能會(huì)花30%的收入在營(yíng)銷上。因此當(dāng)你有了流量后,商業(yè)模式可以發(fā)生非常大的變化,這是非常有意思的地方。

張杰:我覺(jué)得OpenAI和騰訊云是有不同側(cè)重的。OpenAI的側(cè)重點(diǎn)可能仍在于基礎(chǔ)大模型,它通過(guò)一些生態(tài)合作伙伴,幫它在一些碎片化的場(chǎng)景里邊補(bǔ)足基礎(chǔ)大模型的準(zhǔn)確度或者專業(yè)度上的不足。而騰訊云并沒(méi)有過(guò)分強(qiáng)調(diào)自己的基礎(chǔ)大模型,而是強(qiáng)調(diào)要做垂類行業(yè)的大模型。

他們不同的側(cè)重點(diǎn)顯示出一個(gè)共同問(wèn)題,即基礎(chǔ)大模型在一些專業(yè)性很高的具體行業(yè)或場(chǎng)景里是不能直接拿來(lái)用的,它還需要一個(gè)適配層。我覺(jué)得這里可能會(huì)有一個(gè)新的商業(yè)模式,就是未來(lái)越來(lái)越多的知識(shí)是可以資產(chǎn)化的。原來(lái)大家用AI的時(shí)候,技術(shù)范式是不一樣的。所以大家能夠共用的資產(chǎn)就是一些原始的數(shù)據(jù),拿到原始數(shù)據(jù)以后,用不同的技術(shù)手段去加工,在這個(gè)過(guò)程中數(shù)據(jù)的中間形態(tài)是沒(méi)辦法交易的。

但是大模型把很多AI的任務(wù)基本上都統(tǒng)一到一起了,整個(gè)研究范式和處理流程趨同,這使得很多中間環(huán)節(jié)的產(chǎn)物可以交易,比如標(biāo)注后的數(shù)據(jù)、做指令對(duì)齊的數(shù)據(jù)、提示詞、以及提示詞組所組成的提示鏈等,甚至是具體場(chǎng)景下訓(xùn)練出來(lái)的機(jī)器人或者助手等,都可以去做一些交易,被資產(chǎn)化,這可能是未來(lái)新的商業(yè)模式。

通用大模型VS垂直領(lǐng)域大模型

澎湃科技:剛剛其實(shí)三位都提到領(lǐng)域大模型和通用大模型這兩種不同的商業(yè)路徑,能不能具體談一談這兩個(gè)不同的商業(yè)模式下的機(jī)遇和挑戰(zhàn)。

王丹君:將來(lái)圍繞大模型的商業(yè)一定會(huì)變成一個(gè)商業(yè)生態(tài),商業(yè)生態(tài)里面核心的特征就是會(huì)分層。首先會(huì)有一些廠商來(lái)提供基礎(chǔ)的服務(wù),因?yàn)榇竽P托枰獢?shù)據(jù)的基礎(chǔ),需要算力。大模型作為底層引擎服務(wù),雖然本身能力很強(qiáng),但是它并不了解特定領(lǐng)域的知識(shí)和服務(wù)模式以及客戶需求。

隨之而來(lái)的是垂直領(lǐng)域的大模型。這些垂直領(lǐng)域的大模型,有一些是領(lǐng)域廠商自有大模型,有一些是基于基礎(chǔ)大模型訓(xùn)練出來(lái)的。通俗地講,就是讓這些模型變成一個(gè)專家。比如說(shuō)金融領(lǐng)域可能有專門(mén)去幫助投資者去做商業(yè)決策的一些服務(wù),像人力資源領(lǐng)域,可能有專門(mén)幫企業(yè)去做人才決策的服務(wù)。

這其中可能還有很多細(xì)分的領(lǐng)域。這些細(xì)分領(lǐng)域可能同樣也需要行業(yè)積累,需要訓(xùn)練,需要了解到底通過(guò)什么樣的方式去解決客戶的問(wèn)題,甚至涉足到交互界面的用戶體驗(yàn)層次。這些累積起來(lái)其實(shí)都是前面我們談到的app store背后的一些能力。

于鐘海:在我們來(lái)看,其實(shí)這兩類市場(chǎng)還真的挺不一樣的。

首先說(shuō)通用大模型,構(gòu)建一個(gè)好的數(shù)據(jù)飛輪也很重要。

舉個(gè)例子,今天我教你打乒乓球,我說(shuō)你應(yīng)該這么打。然后我發(fā)一個(gè)球,你沒(méi)有接住,你就知道這么打不對(duì)。那再換一個(gè)方式,這次你接住了,你就記住了對(duì)的方法。那我不斷給你發(fā)球,你不斷去接,一點(diǎn)點(diǎn)地調(diào)試你的肌肉記憶,找到最好的方法。其實(shí)模型的訓(xùn)練也是這樣一個(gè)過(guò)程。你每次跟ChatGPT交流的時(shí)候,它底下會(huì)有一個(gè)點(diǎn)贊或者點(diǎn)踩?;蛘哂械臅r(shí)候你什么也沒(méi)說(shuō),只是非常失望重新生成了一個(gè)?;蛘弑热缑看斡肕idjourney畫(huà)畫(huà)的時(shí)候,它都會(huì)出現(xiàn)四個(gè)圖像,然后你默認(rèn)選了第三個(gè),把它放大了,下載了,它就知道這張好像是更好的,以后會(huì)往這個(gè)方向稍微再偏一點(diǎn),模型一點(diǎn)點(diǎn)就學(xué)會(huì)了。沒(méi)有數(shù)據(jù)反饋的話,模型就停留在這里無(wú)法進(jìn)步。所以這就是我們強(qiáng)調(diào)的數(shù)據(jù)飛輪,強(qiáng)調(diào)場(chǎng)景的卡位。作為一個(gè)通用大模型,其實(shí)最重要的是有人用,這也是中國(guó)的一個(gè)優(yōu)勢(shì)。中國(guó)的老百姓喜歡擁抱科技,對(duì)大模型的接受度也更好。我們有很多人去提供反饋。

對(duì)于領(lǐng)域大模型,我認(rèn)為更重要的是know-how(從事某行業(yè)或者做某項(xiàng)工作,所需要的技術(shù)訣竅和專業(yè)知識(shí))。

領(lǐng)域大模型關(guān)鍵是要迎合客戶的需求,理解客戶在某一個(gè)深度領(lǐng)域里面的know-how。像中關(guān)村科金這樣的企業(yè),他們的優(yōu)勢(shì)就在這里,他們?cè)诰唧w的領(lǐng)域場(chǎng)景里面理解客戶的know-how,理解客戶的痛點(diǎn)。

張杰:感謝于總的認(rèn)可。我理解通用大模型和領(lǐng)域大模型是一個(gè)上下游的關(guān)系,不是一個(gè)競(jìng)爭(zhēng)的關(guān)系。通用大模型講究大而全,領(lǐng)域大模型是一個(gè)小而美的生意。

通用大模型的特點(diǎn)是“三高”,即投資高,回報(bào)高,但是不確定性也很高。因?yàn)橛?xùn)練一個(gè)基礎(chǔ)的大模型,在算法、數(shù)據(jù)、人才方面要求都很高。比如算力,起碼要有萬(wàn)卡天級(jí)別的算力。

為什么不確定性很高呢?因?yàn)槿雵膹S商基本都是互聯(lián)網(wǎng)的大廠或者是科技大佬,要使訓(xùn)練出來(lái)的大模型具備通用能力和涌現(xiàn)能力,對(duì)技術(shù)要求非常高,如果想要在市場(chǎng)上立足,最起碼要能夠跑贏開(kāi)源大模型,才有存活下來(lái)的可能。未來(lái)市場(chǎng)上,我覺(jué)得基礎(chǔ)大模型會(huì)多家并存,但是可能也不會(huì)太多。

領(lǐng)域大模型可能就是一個(gè)小而美的賽道。訓(xùn)練一個(gè)領(lǐng)域大模型對(duì)算力要求并不是很高,據(jù)我們的實(shí)驗(yàn),只需要單周就能夠做到領(lǐng)域大模型的迭代。兩張卡就可以實(shí)時(shí)做一些推理。然后在數(shù)據(jù)方面還是要建立起一些自己的門(mén)檻,也就是剛才于總講的數(shù)據(jù)飛輪效應(yīng),這就要八仙過(guò)海,各顯其能了。

最重要的一個(gè)競(jìng)爭(zhēng)點(diǎn)就是人才。領(lǐng)域大模型把整個(gè)產(chǎn)業(yè)的技術(shù)鏈壓扁了,你的人才既要懂算法,還要懂得怎么把算法很好地工程化,還要懂場(chǎng)景、懂業(yè)務(wù),甚至還要懂產(chǎn)品的設(shè)計(jì)。需要激發(fā)人才的復(fù)合能力,然后激發(fā)人才的主動(dòng)性、創(chuàng)造性,非??简?yàn)組織能力。

大模型在哪個(gè)領(lǐng)域最有用武之地?

澎湃科技:三位最看好的垂直領(lǐng)域應(yīng)用方向是什么?

于鐘海:我們看了很多方向,現(xiàn)在最看好的方向是AI Answer,這我們自己造的一個(gè)詞,它指的是一類產(chǎn)品。比如今天你考我一個(gè)事情,你問(wèn)我說(shuō)嬰兒車買哪個(gè)品牌更好。我相信各位應(yīng)該也都有類似的情況,找三個(gè)朋友問(wèn)一問(wèn),看五篇小紅書(shū),然后再去網(wǎng)上搜十個(gè)帖子。最后看完以后,總結(jié)出來(lái)三個(gè)型號(hào),然后再看看價(jià)格,做出決定。

其實(shí)很多事情你問(wèn)人工智能也是這樣,大模型是有一定的記憶的,它知道這些東西之間相關(guān),但它會(huì)產(chǎn)生幻覺(jué),就像人一樣,也會(huì)搞混,記不住到底誰(shuí)長(zhǎng)成什么樣子。所以企業(yè)里經(jīng)常做的事情就是基于內(nèi)部的知識(shí)庫(kù)做一定的查詢,然后基于這些東西做一個(gè)總結(jié)。另外還有基于一個(gè)文檔,比如基于好幾百頁(yè)的一篇保險(xiǎn)條款做一個(gè)問(wèn)答、總結(jié)或者對(duì)比?;蛘呋谒阉鹘o一個(gè)答案。這類產(chǎn)品我們都統(tǒng)稱為AI Answer。另外我們也比較關(guān)注比如辦公、AI學(xué)習(xí)機(jī)等機(jī)會(huì)。

張杰:我覺(jué)得可以先分行業(yè)看,再分場(chǎng)景看。領(lǐng)域大模型理想的行業(yè)是知識(shí)密度高、流程邏輯性強(qiáng)、安全隱私性敏感的行業(yè),比如說(shuō)像金融、醫(yī)療、法律、政務(wù)這些行業(yè)可能是未來(lái)領(lǐng)域大模型落地比較理想的行業(yè)。

場(chǎng)景可能最開(kāi)始的時(shí)候是先面向內(nèi)部員工賦能的。比如做一些知識(shí)問(wèn)答,然后是培訓(xùn)、陪練。內(nèi)部員工賦能之后,再看怎么去to c(對(duì)客戶)做一些服務(wù),或者是賦能銷售人員、客服人員,做成營(yíng)銷客服助手??傊畱?yīng)用的時(shí)候可以先考慮從容錯(cuò)性比較高的場(chǎng)景入手。

王丹君:我們也認(rèn)為現(xiàn)在大家的應(yīng)用經(jīng)驗(yàn)里,大模型幫我們解決最多問(wèn)題的還是在知識(shí)密集型行業(yè)。像北森或者中關(guān)村科金所在的To B領(lǐng)域,確實(shí)會(huì)有一些企業(yè)從中更容易受益。比如說(shuō)在企業(yè)的人力資源管理里面,大家希望能夠讓大模型去解決一些對(duì)人來(lái)說(shuō)很枯燥、很無(wú)聊的事情,如回答員工的各種共同關(guān)注的問(wèn)題。北森和中關(guān)村科金也在探討這方面的合作,希望將來(lái)通過(guò)大模型這種底層設(shè)施建立一些數(shù)字員工,回答這些似乎不是特別需要人類的經(jīng)驗(yàn)和知識(shí)性的問(wèn)題。

另外我們發(fā)現(xiàn)還有一些高價(jià)值的領(lǐng)域,比如企業(yè)的領(lǐng)導(dǎo)力教練。一家企業(yè)有多個(gè)層級(jí)的管理者,每個(gè)管理者每天都會(huì)遇到各種各樣的挑戰(zhàn),但是他沒(méi)有那么多機(jī)會(huì)去請(qǐng)教別人,我們認(rèn)為在這個(gè)場(chǎng)景下AIGC可以提供非常好的幫助,并且能夠很好滿足個(gè)人對(duì)于私密性的一些要求。

澎湃科技:最近微軟宣布與OpenAI合作打通應(yīng)用生態(tài),中關(guān)村科金作為國(guó)內(nèi)的大模型應(yīng)用廠商代表,目前產(chǎn)品落地應(yīng)用進(jìn)展如何?未來(lái)是否每家企業(yè)都會(huì)擁有自己的專屬模型?

張杰:我覺(jué)得并不是每個(gè)企業(yè)都需要自己的專屬模型,因?yàn)榇竽P图夹g(shù)我覺(jué)得可以由淺至深分成三層:

第一層,如果行業(yè)或者企業(yè),沒(méi)有那么多的知識(shí)或文檔,或者企業(yè)本身的特殊性不強(qiáng),就沒(méi)必要用一個(gè)專屬的模型,直接用通用大模型就可以。在通用大模型之上,針對(duì)具體的場(chǎng)景需求,去調(diào)prompt(提示語(yǔ))就可以了。在這期間企業(yè)需要的是一個(gè)用戶體驗(yàn)良好的、低門(mén)檻的提示詞管理工具??赡苄枰恍I(yè)務(wù)專家在特定場(chǎng)景底下積累一些好用的提示詞;復(fù)雜一點(diǎn)的需要把一些提示詞變成一個(gè)小的提示集合,然后不同的集合之間再串成鏈條,鏈條之間有先后的邏輯關(guān)系,有一個(gè)提示鏈的管理工具就夠了。

第二層就復(fù)雜一點(diǎn)。有些企業(yè)碎片性知識(shí)比較多,這時(shí)候提示詞或者提示鏈可能不夠,就需要在通用大模型之上,再外掛一個(gè)知識(shí)庫(kù),用于管理低頻長(zhǎng)尾的知識(shí)。通用大模型面對(duì)具體問(wèn)題的時(shí)候去知識(shí)庫(kù)里面找答案。這是通用大模型+知識(shí)庫(kù)+提示工程的技術(shù)路線。

第三層,對(duì)于領(lǐng)域常識(shí)總量大的企業(yè),需要構(gòu)建企業(yè)專屬的領(lǐng)域大模型,將領(lǐng)域里的通識(shí)輸入到大模型的腦子里,既保持通用的常識(shí)和推理,又具備領(lǐng)域內(nèi)的專業(yè)知識(shí)和技能,讓大模型由文科生變成領(lǐng)域?qū)<?。這是一種領(lǐng)域大模型+領(lǐng)域知識(shí)庫(kù)+提示工程的路線。

中關(guān)村科金針對(duì)上述三種情況都有一些應(yīng)用落地實(shí)踐,我們前段時(shí)間一直在嘗試解決三個(gè)技術(shù)難點(diǎn),解決后形成了兩套助手類的應(yīng)用。這三個(gè)技術(shù)難點(diǎn)是什么呢?

第一個(gè)就是解決大模型經(jīng)常出現(xiàn)幻覺(jué)的問(wèn)題,即一本正經(jīng)地胡說(shuō)八道。這就需要有一個(gè)領(lǐng)域的知識(shí)庫(kù),讓大模型知道,被問(wèn)到什么問(wèn)題時(shí),要去知識(shí)庫(kù)里找相關(guān)的知識(shí)。構(gòu)建知識(shí)庫(kù)的時(shí)候,往往需要處理富文本格式的文檔,需要讓大模型先理解文檔布局,再理解里邊的內(nèi)容。

第二個(gè)就是訓(xùn)練領(lǐng)域大模型的時(shí)候,要防止訓(xùn)練過(guò)程中的遺忘問(wèn)題。否則你往它腦子里輸送新知識(shí)的時(shí)候,它會(huì)忘記老的知識(shí)。這里會(huì)用到高效微調(diào)的技術(shù)手段,讓它既具備原來(lái)的通識(shí),又能夠?qū)W到領(lǐng)域內(nèi)的常識(shí)。

第三個(gè)就是怎么能讓用戶更方便且低成本地使用它。無(wú)論是領(lǐng)域大模型、還是領(lǐng)域知識(shí)庫(kù)、還是提示詞,都不是一蹴而就的,都需要持續(xù)反饋迭代,這就要讓客戶自己具備維護(hù)能力,工具層面要做好產(chǎn)品設(shè)計(jì)和工程化封裝。

澎湃科技:想問(wèn)問(wèn)于總從投資的角度看,相對(duì)于移動(dòng)互聯(lián)網(wǎng)和硬科技時(shí)代的投資邏輯,在這一輪大模型熱潮中,對(duì)于選擇項(xiàng)目的核心關(guān)注點(diǎn),包括投資的決策點(diǎn)是什么?

于鐘海:這個(gè)也是資本一直在探尋的問(wèn)題。過(guò)去大半年,大模型的行情也經(jīng)歷了很多輪的演變。剛開(kāi)始,很多人把它當(dāng)作一個(gè)主題投資,那時(shí)炒的是跟AI相關(guān)的公司,很受大家重視的是真正有大模型底層能力的公司。后來(lái)出現(xiàn)“百模大戰(zhàn)”,大家覺(jué)得大模型好像有點(diǎn)太卷了,發(fā)現(xiàn)算力好像是掘金場(chǎng)買鏟的受益者,所以算力相關(guān)的企業(yè)估值又漲了很多。到今年五六月份的時(shí)候,我們提出了“AI應(yīng)用迎來(lái)了爆發(fā)的寒武紀(jì)”。很多企業(yè)都拿出了自己的產(chǎn)品,AI的應(yīng)用又開(kāi)始漲。

其實(shí)大模型的投資節(jié)奏也是漸變的,從一開(kāi)始只要是AI公司就可以漲,到后面要拿出應(yīng)用,再到大家開(kāi)始探索這個(gè)應(yīng)用有沒(méi)有客戶為它買單,有沒(méi)有真正的訂單。我覺(jué)得可能再過(guò)一年左右的時(shí)間,大家就會(huì)去思考這個(gè)應(yīng)用到底有沒(méi)有壁壘,商業(yè)是不是長(zhǎng)期可持續(xù)的。我們其實(shí)最看好的是應(yīng)用層面,我們很重視真正能在大模型和企業(yè)應(yīng)用之間實(shí)現(xiàn)連接的企業(yè),他們能真正創(chuàng)造價(jià)值。

澎湃科技:下一個(gè)問(wèn)題是問(wèn)王院長(zhǎng),從人才的角度,現(xiàn)在大模型正在構(gòu)建一種人機(jī)協(xié)同的新型生產(chǎn)關(guān)系。那么這對(duì)企業(yè)的人才管理會(huì)產(chǎn)生什么樣的影響?

王丹君:這是一個(gè)特別好的問(wèn)題。因?yàn)槲覀兛吹皆谏鐣?huì)層面,可能大家非常熱衷于討論“我的工作將來(lái)會(huì)不會(huì)被大模型取代?”對(duì)于這個(gè)問(wèn)題,我建議可以從兩方面來(lái)看:

一方面大家討論比較多的是大模型能力越來(lái)越強(qiáng),垂直領(lǐng)域的應(yīng)用也越來(lái)越深入,將來(lái)可能會(huì)替代很多一般性員工的工作。這幾年即使沒(méi)有大模型發(fā)展的背景下,大家都非常關(guān)注降本增效,就涉及企業(yè)里人力成本占比。如果能夠通過(guò)一些新技術(shù)去降低人力成本,對(duì)企業(yè)很有價(jià)值,這是它可持續(xù)發(fā)展的一個(gè)很重要原因。

另一方面,大模型的出現(xiàn),以及未來(lái)更多的垂直領(lǐng)域的工具出現(xiàn),對(duì)于員工來(lái)講,是能力的加持。從積極層面來(lái)看,如果員工能夠更好地利用人機(jī)協(xié)作,可以給公司創(chuàng)造更多的價(jià)值。

我們預(yù)測(cè)未來(lái)的組織形態(tài)會(huì)有一些變化?,F(xiàn)在絕大部分的公司是職能型架構(gòu),不同的職能去服務(wù)同樣的客戶,職能之間有很多協(xié)作、溝通的問(wèn)題,對(duì)公司來(lái)講是極大的消耗。但是未來(lái)當(dāng)員工個(gè)體或者群體,具備了在工具幫助下全方位的能力,這個(gè)組織的單元?jiǎng)荼貢?huì)更小,它能更敏捷、更靈活、更快速響應(yīng)。

澎湃科技:我想問(wèn)三位在百模大戰(zhàn)的時(shí)代背景下,企業(yè)最需要具備什么樣的能力?

張杰:對(duì)于基礎(chǔ)大模型廠商而言,他們最需要的就是具備特別強(qiáng)的、獨(dú)到的技術(shù)能力,要跑贏開(kāi)源大模型,然后在多模態(tài)或者復(fù)雜推理上有一些技術(shù)的獨(dú)特性。對(duì)于領(lǐng)域大模型廠商,最需要的就是復(fù)合型人才,而且組織能力非常重要。因?yàn)橐l(fā)揮人才的主動(dòng)性、創(chuàng)造性,把一些前沿的商機(jī)對(duì)接給他,讓他知道客戶需要什么。此外,還要有一些工程性的能力和算法性的能力。

于鐘海:我認(rèn)為數(shù)據(jù)蠻重要的,特別是對(duì)想用大模型的企業(yè)來(lái)講,數(shù)據(jù)真的很重要。其實(shí)數(shù)據(jù)很快就會(huì)成為我們的一個(gè)壁壘,就像中關(guān)村科金這樣的提供大模型應(yīng)用的企業(yè),他們很大的優(yōu)勢(shì)就在于數(shù)據(jù)。

王丹君:其實(shí)對(duì)于絕大部分的企業(yè)來(lái)講,將來(lái)比較大的可能性都是大模型的消費(fèi)者,而不是大模型的創(chuàng)造者,積極擁抱大模型可能會(huì)極大加速其數(shù)字化管理的進(jìn)程。組織和個(gè)體可能都需要去擁抱變化,各個(gè)層級(jí)的領(lǐng)導(dǎo)者需要增強(qiáng)擁抱這種新機(jī)會(huì)的意識(shí),員工需要保持持續(xù)、自驅(qū)的學(xué)習(xí)能力。

澎湃科技:在這個(gè)過(guò)程中,垂直領(lǐng)域企業(yè)擁有了行業(yè)know-how的優(yōu)勢(shì)。他們是不是更容易突破大模型數(shù)據(jù)的卡點(diǎn)?

張杰:我覺(jué)得行業(yè)know-how要具體來(lái)看,可能有幾種形態(tài)要特別關(guān)注。

行業(yè)know-how最顯而易見(jiàn)的一種形態(tài)就是存在文檔里邊的一些數(shù)據(jù),這些都是符號(hào)性的表達(dá)。怎么從文檔里邊挖掘出來(lái)prompt(提示詞)或者提示鏈,這是當(dāng)前階段就需要去處理的一類問(wèn)題。很多企業(yè)里面有大量的文檔,而且這些文檔里面很多是PPT或PDF的格式。既需要讀懂它的格式,又要讀懂里面的內(nèi)容。

除了這類行業(yè)的know-how以外,還有就是隱藏在行業(yè)專家或者場(chǎng)景專家腦子里的知識(shí),需要給他一個(gè)工具,總結(jié)成prompt詞,prompt模板是密度更高的行業(yè)know-how。

還有一類比較隱性的行業(yè)know-how就是藏在系統(tǒng)日志里的集體智慧。這些日志經(jīng)過(guò)挖掘,能夠把比較零散的知識(shí)變成結(jié)構(gòu)化的鏈條的知識(shí)。然后再?gòu)那f(wàn)萬(wàn)的鏈條里邊,歸納總結(jié)變成一個(gè)特定場(chǎng)景底下的最佳實(shí)踐。比如銷售人員每天會(huì)打很多電話,每天能夠積攢下來(lái)對(duì)話的日志有幾百萬(wàn)通,按照成單、流單或者掛電話等不同結(jié)果做一些裁剪,就能夠沉淀出來(lái)營(yíng)銷新產(chǎn)品話術(shù)的最佳實(shí)踐。

這三類問(wèn)題,其實(shí)都是特別好的行業(yè)know-how。這里邊也有一些技術(shù)挑戰(zhàn),比如怎么從文檔里、日志里挖掘出提示詞,挖掘出提示鏈條。doc2prompt和log2prompt是值得投入研究的重點(diǎn)。

于鐘海:其實(shí)張杰總有一句話我印象很深,他說(shuō)把太陽(yáng)系八大行星幾千幾百萬(wàn)年的運(yùn)轉(zhuǎn)軌道都記錄下來(lái),都不如抽象出來(lái)一條萬(wàn)有引力定律更能解釋事情的本質(zhì)。

我覺(jué)得這就是know-how。垂直領(lǐng)域的公司在相關(guān)的領(lǐng)域里有很多經(jīng)驗(yàn),我舉一個(gè)例子,大家在人工智能火了之后都說(shuō)有一個(gè)新的年薪百萬(wàn)的職業(yè)叫prompt engineer,

就是去寫(xiě)prompt的工程師。那為什么他們這么值錢呢?我自己也使用人工智能繪畫(huà)的工具。有一次我想要畫(huà)一個(gè)穿西裝的人,我試了很多關(guān)鍵詞都不好使。后來(lái)我輸入 “領(lǐng)帶”,這個(gè)人馬上就穿上了西裝,你會(huì)發(fā)現(xiàn)這才是那個(gè)magic word。

大模型有一點(diǎn)像概率游戲,它其實(shí)是有很多先驗(yàn)的概率。在剛剛那個(gè)場(chǎng)景里,領(lǐng)帶就是西裝對(duì)應(yīng)的那個(gè)非常重要的詞。而prompt engineer知道哪些關(guān)鍵詞能擾動(dòng)這個(gè)模型,他知道我們到底想寫(xiě)出什么樣的東西來(lái),這個(gè)就是他的價(jià)值。那如果我們把這件事情放在做應(yīng)用的場(chǎng)景里面,它其實(shí)就是垂直領(lǐng)域公司的價(jià)值。既懂人工智能,他又懂行業(yè)的know-how。

王丹君:目前看起來(lái)除了基礎(chǔ)大模型公司,垂直領(lǐng)域公司是第二批市場(chǎng)上大家會(huì)很關(guān)注的企業(yè)。我覺(jué)得在接下來(lái)的一段時(shí)間,對(duì)他們也是非常有挑戰(zhàn)的。垂直領(lǐng)域公司的經(jīng)驗(yàn)不一定能夠直接轉(zhuǎn)化成新技術(shù)加持下的新創(chuàng)造力。需要先要花更多的時(shí)間去學(xué)習(xí),去理解大模型運(yùn)作的底層邏輯是什么,去學(xué)習(xí)它如何能夠幫助我,甚至是去幫助我挖掘我們的知識(shí),或者幫助我們給客戶提供服務(wù)。我認(rèn)為未來(lái)一段時(shí)間,他們首先面臨的是這個(gè)挑戰(zhàn)。在這些基礎(chǔ)上,基于這些模式找到給客戶創(chuàng)造價(jià)值的新的機(jī)會(huì)點(diǎn)。

澎湃科技:最近有一些新的動(dòng)向,例如ChatGPT訪問(wèn)人數(shù)的增速在放緩。它其實(shí)沒(méi)有成為一個(gè)超級(jí)入口這樣的存在。有觀點(diǎn)認(rèn)為ChatGPT不能代表GPT的未來(lái),只是OpenAI和微軟拿出來(lái)向市場(chǎng)展示的一個(gè)產(chǎn)品。三位怎么看這個(gè)觀點(diǎn)?

于鐘海:這個(gè)觀點(diǎn)確實(shí)蠻有趣的。我個(gè)人相對(duì)樂(lè)觀一點(diǎn),因?yàn)槲沂且粋€(gè)經(jīng)常使用大模型產(chǎn)品的人。而且我想補(bǔ)充一點(diǎn),現(xiàn)在的ChatGPT不是它的最終形態(tài)。我認(rèn)為谷歌下一代安卓系統(tǒng)里的google assistant(谷歌助手)會(huì)由自己的大模型來(lái)支持,因?yàn)檫@也是一個(gè)非常重要的流量入口。

王丹君:對(duì)很多行業(yè)人士來(lái)講,大家都很樂(lè)觀。它作為一個(gè)新的產(chǎn)品,發(fā)展到這個(gè)階段,自然會(huì)有一些分化。對(duì)于終端用戶來(lái)講,會(huì)對(duì)這樣的工具感興趣,愿意去嘗試,并持續(xù)使用。哪怕使用的頻次在降低,關(guān)注度在降低,但是用戶的行為是很難改變的。

張杰:我覺(jué)得ChatGPT增速放緩是早晚要發(fā)生的一件事,畢竟流量是有天花板的。早晚有一天流量要見(jiàn)頂或者大眾對(duì)閑聊的應(yīng)用場(chǎng)景會(huì)熱情減退,閑聊畢竟不是高頻剛需,但是它給大家?guī)?lái)一個(gè)特別好的啟發(fā)。

一方面,圍繞著Chat會(huì)有很多種應(yīng)用,例如通過(guò)聊天生成圖片、視頻、報(bào)表、PPT等,如ChatDoc、ChatPdf、ChatBI。另外一個(gè)場(chǎng)景,就是剛才所說(shuō)的領(lǐng)域大模型,比如金融GPT、法律GPT、醫(yī)療GPT,這些將來(lái)可能都會(huì)是一些新的商業(yè)入口。

 
    責(zé)任編輯:鄭潔
    校對(duì):施鋆
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司