- +1
對話破億AI文旅大片創(chuàng)作者海辛&阿文:AI是我的實習(xí)生,也是我的老師
【編者按】
海辛和阿文,是央視春晚首個AI動畫《枕著光的她》背后的創(chuàng)作者,也是AI圈里有名的搭檔。
他們用AI把貓貓變成了城市文旅名片。《故宮貓貓上班記》《文明小貓游浦東》《盧浮宮小貓》等城市文旅片,因為獨樹一幟的風(fēng)格、萌趣可愛的畫面,創(chuàng)下了全網(wǎng)累計破億的播放量。此外,他們參與的作品還獲得過北影節(jié)AIGC單元的最佳影片。
我們好奇在他們的創(chuàng)作中,AI扮演了什么樣的角色。
對齊Talk是澎湃新聞對齊Lab欄目首檔聚焦人工智能領(lǐng)域創(chuàng)作者、從業(yè)者和行業(yè)生態(tài)的對話節(jié)目。我們想找到AI浪潮中的頭號玩家和弄潮兒,分享他們在AI最前線的發(fā)現(xiàn)和感悟,一起探尋AI對自我的重塑和賦能,展望人工智能的發(fā)展和未來。
【以下是澎湃對齊Lab專訪內(nèi)容】
AI可以成為導(dǎo)演的“后悔藥”
對齊Lab:你們創(chuàng)作AI短片的工作流是什么樣的?
阿文:創(chuàng)作《故宮貓貓上班記》《文明小貓游浦東》的時候,就是用最好的圖像模型和視頻模型來文生圖、文生視頻或者圖生視頻。
我們把大量的時間花在了抽卡上?!豆蕦m貓貓上班記》中有一個鏡頭,我花了差不多2000塊錢都沒有抽出來,當(dāng)時就崩潰了。其實很簡單,就一只貓?zhí)蠘?。但我需要它在一個特定的機位、特定的構(gòu)圖,比如說讓它跳到樹干上的某個位置,后面這個鏡頭就沒要。作為一個從傳統(tǒng)行業(yè)過來的設(shè)計師和創(chuàng)作者,我接受不了花一整天的時間去做一個鏡頭,最后什么成果都沒有。
海辛:我們會邊創(chuàng)作做邊推翻之前的想法,其實廢稿會比正片多很多。這種把前期、后期、制作整合在一起的模式,我還挺喜歡的,能不斷地進行調(diào)整。
這也是每個導(dǎo)演都最想要的一種創(chuàng)作模式,很少有人能前期百分百知道什么是自己想要的。其實很多導(dǎo)演會想換一些想法,但鑒于巨大的成本以及制作是一個不可逆推的環(huán)境,他可能沒有辦法隨意改動。
對齊Lab:跟傳統(tǒng)流程在周期和成本上的差別是什么?
海辛:AI短片和傳統(tǒng)短片的區(qū)別,不同影片類型上會有一些差別。以《故宮貓貓上班記》為例,首先傳統(tǒng)流程里很少能找到這么配合的貓咪演員,因此大概率得全部用特效制作。比較普通的工作室,特效的報價大概在一秒1500元到3000元。
由于(用特效做)寫實的貓咪是非常難的,要花費大量的成本才能讓貓咪的毛發(fā)渲染符合人的審美,AI能大幅削減這方面的成本。但對于一些真人影片或者是產(chǎn)品拍攝,可能成本的降幅就不會有那么大。

海辛和阿文在創(chuàng)作《故宮貓貓上班記》時用AI生成的橘貓。圖片來源:通往AGI之路。
對齊Lab:貓貓會成為你們的一個IP或者堅持的主線嗎?
阿文:我們沒有刻意去強調(diào)這個,主要是我們就喜歡貓。
AI可以是老師也可以是實習(xí)生
對齊Lab:AI作為你們創(chuàng)作中的“第三人”,扮演了什么樣的角色?
阿文:我覺得AI的角色定位是流動的。現(xiàn)實中很難找到一個人既是你的老師又是你的實習(xí)生。AI可以在工作流的各個環(huán)節(jié)里扮演不一樣的角色。
海辛:AI可以讓我更聚焦創(chuàng)作和內(nèi)容本身。以前拍一個鏡頭,我會把想要的畫面分解成很多具體的步驟,會考慮演員、走位、場面調(diào)度、燈光等各種細節(jié),AI幫我做了很多這方面瑣碎的工作。
對齊Lab:不同的AI工具會不會有不同的人設(shè)?
海辛:會,特別是早期的時候。早期不同AI模型的能力側(cè)重方向不同,有的可能更擅長穩(wěn)定角色,有的可能在物理運動方面更符合現(xiàn)實。但現(xiàn)在這些模型的gap在變小,會越來越像一個通用的模型。
我會覺得Sora和Veo是兩個非常截然不同的路徑。Veo能很好地執(zhí)行你提供的制作需求,Sora因為有切鏡頭的能力,所以更多是幫助你進行創(chuàng)意策劃。
對齊Lab:AI創(chuàng)作者的核心能動性體現(xiàn)在哪里?
海辛:我覺得是非工具化的那一部分,因為工具的部分遲早會被AI追上來。能做出什么樣的東西取決于你的經(jīng)歷、你愛的東西、你在意的議題,這些東西會決定你的創(chuàng)作上限。
阿文:創(chuàng)作者的品味非常重要。過去看過什么?受過什么樣的影響?這些都會體現(xiàn)在作品里。如果想要保持自己的品味,或者讓自己品味越來越好的話,必須大量攝入優(yōu)質(zhì)的養(yǎng)分。

2025年11月28日舉行的中國報業(yè)傳媒行業(yè)人工智能應(yīng)用大會上,海辛代表團隊分享和AI一起跨界的多種可能。圖片來源:澎湃新聞。
對齊Lab:你們有一個階段說過自己的定位是AI藝術(shù)的科學(xué)家,現(xiàn)在還這么想嗎?
海辛:我覺得這是一個非常好的時代,你可以去定義未來AI會怎么發(fā)展。我們會訓(xùn)練一些小模型,探索AI可以產(chǎn)出哪些與過往作品不同的東西。
我們自己探索的一個方向叫“潛空間計劃”。我們發(fā)現(xiàn),過去一個圖像到一個圖像之間的變化是像素之間的。在 AI 大模型里面,兩張截然不同的圖像之間是語義、文化概念加上像素的變化。

海辛將黑貓、黑桃、月相圖和羅盤結(jié)合到一起做了一個動畫,她認為這種AI動畫就像詩歌一樣,是意象之間的跳轉(zhuǎn)。視頻來源:海辛的微信視頻號
阿文:ComfyUI里當(dāng)時有一項比較有名的技術(shù)叫AnimateDiff,它能讓兩張圖像非常絲滑地過渡。我們就會好奇,任意兩張圖像之間是否存在一個最短的距離。
對齊Lab:有點像六度社交理論。
阿文:對的,當(dāng)時海辛就選了香蕉和圣經(jīng)兩個非常不相關(guān)的概念。我們測試下來發(fā)現(xiàn),香蕉變成圣經(jīng)自然過渡要80幀。
海辛:因為樣本很小,這個實驗可能不代表任何東西。但這個猜想本身我們特別喜歡,而且很浪漫。萬物之間的任何概念,它可能都存在一個最短的距離。
多用AI工具,多看人類作品
對齊Lab:以電影節(jié)評委的角色來看,一部作品把AI用在哪些方面是更能打動你的?
海辛:我自己會特別喜歡在前一分鐘能夠給我很多信息量的作品。我更會被好的內(nèi)容打動,而不是好的工具形式。
阿文:我不看AI短片(笑),我只制作。我經(jīng)常會說多用AI工具,多看人類作品。
現(xiàn)在有一些不好的現(xiàn)象,大量的AI短片要么重復(fù),要么過度地透支某種審美和風(fēng)格。很多所謂的AI創(chuàng)作者,他只盯著頭部的幾個AI創(chuàng)作者去模仿、抄襲。明明AI是放大創(chuàng)意的工具,但很多人卻用來偷懶,這是我非常不喜歡看 AI 短片的一個原因。
另外一個原因是學(xué)習(xí)的需求。以導(dǎo)演的視角再去看以前看過的電影時,往往會發(fā)現(xiàn)很多我可以學(xué)習(xí)的地方。補看過去的一些經(jīng)典作品時候,我會感嘆原來我們曾經(jīng)吃得有這么的好。
對齊Lab:作為頭部創(chuàng)作者,你們也會面臨一些抄襲的問題,你們是怎么看待版權(quán)方面的問題的?

有公司直接把海辛和阿文的作品放在了自己公司的作品集里。圖片來源:微博
海辛:我們會要求自己的商業(yè)作品符合商業(yè)版權(quán)的規(guī)范。這一方面是甲方的要求,另一方面也是對自己的保護。反過來說,我們沒有好的保護自己作品不被侵權(quán)的方式。
阿文:我們商量下來的對策是每次都做得難抄一點,每次在技術(shù)上翻一翻或者想象力上翻一翻。
對齊Lab:一些娛樂公司或者影視公司開始向 AI 工具發(fā)起版權(quán)挑戰(zhàn),這方面你們怎么想?
海辛:他們有權(quán)這么做。AI公司也會有一些對策,比如用戶生成帶有IP的圖像或者視頻,AI公司會把提示詞禁掉。我覺得整個行業(yè)會越來越規(guī)范。
阿文:我覺得只是表面上更規(guī)范了。OpenAI就是很好的例子,訓(xùn)練模型的時候沒有征得你的同意,就先把你的作品練進去。等你有意見了,我再把關(guān)鍵詞禁掉,但模型已經(jīng)獲得了所有的能力了。
中國團隊對AI開源社區(qū)的貢獻很大
對齊Lab:怎么理解“AI 讓創(chuàng)作能力可以復(fù)用,創(chuàng)作者能夠把能力變成產(chǎn)品”?
海辛:我們曾經(jīng)在ComfyUI(一種節(jié)點式的AI視覺創(chuàng)作工具)里搭過一個很復(fù)雜的工作流,這個工作流能夠把一張照片和文案變成一張精美的海報。我們把工作流導(dǎo)出后發(fā)給別人,這樣就能復(fù)現(xiàn)我們的創(chuàng)作過程。

海辛和阿文用ComfyUI創(chuàng)作了把一張圖片變成穆夏風(fēng)格海報的工作流,并開源在了civitai上。圖片來源:civitai
對齊Lab:你們主要還是開源的方式去分享?
海辛:我們自己的工作流是開源的,也會有一些合作。去年春晚的時候,我們作為顧問,參與了阿里團隊春晚云參演證的生成器項目,用ComfyUI的流程做了一套AI濾鏡放在了淘寶上。任何人上傳自己的照片,就可以生成一張在春晚工作的云參演證。

春晚云參演證效果圖。圖片來源:數(shù)英網(wǎng)
對齊Lab:這算定制AI作品外的另一種商業(yè)模式?
海辛:ComfyUI 有段時間特別火,幾乎成了 AI 應(yīng)用的行業(yè)范式之一了:通過定制 comfyUI 工作流,來完成垂類具體的需求。但現(xiàn)在由于大模型足夠聰明,很多工作流都被大模型內(nèi)化了。你直接告訴大模型,大模型就可以幫你做出來。
阿文:GPT-4o剛出來的時候算是對我們過去工作流的一次打擊,但我們并不覺得之前的工作就浪費了。有幸能參與到那個非常短暫的時代,成為開源社區(qū)的一部分,我們也很榮幸。
當(dāng)媒體還在宣揚國外模型的時候,AI開源社區(qū)中超過一半的開源模型、插件和技術(shù)方案都來自中國團隊。他們之間好像沒有大廠之分,都是非常優(yōu)秀的個體,輪番登上歷史舞臺。
AI讓我有了完整的作品,拋開AI我更像工具人
對齊Lab:AI補全了你們什么?拋開AI,你們又看到了自己什么?
海辛:AI補全了我的學(xué)習(xí)途徑。很多知識在過去是很難獲得的,現(xiàn)在AI就是最好的老師。拋開 AI 我是什么?這也是我最近會思考一個問題。我覺得職業(yè)上的訓(xùn)練正在把人工具化,但人其實很難卷過AI,AI可能就是更好的工具。反過來我會去思考,作為一個人類我的情感是什么?我想傳遞的內(nèi)容和價值是什么?
阿文:AI補全了我技能上缺失的版圖,這對我來說非常重要。以前我過于沉迷技術(shù),以至于我看起來很厲害,但能拿出來完整作品其實很少。雖然我整天活躍在社交媒體上,但我做出來的要么是demo,要么是半成品。
有了AI之后,我第一次意識到自己能做出完整的作品。我能做出大家喜歡的東西,不僅僅是個工具人。AI甚至改變了我的職業(yè)方向。
拋開AI的話,我能想象到職業(yè)生涯里會少非常多完整的作品。有了AI,我的作品集可能會變得很不一樣。
對齊Lab:未來5年內(nèi),AI的哪些變化是值得關(guān)注的?
阿文:實時生成技術(shù)。目前谷歌發(fā)布了一個Demo,但還處于玩具的狀態(tài)。這項技術(shù)如果真的落地,會改變我們對于內(nèi)容方式呈現(xiàn)。比如游戲、電影,很值得期待。

2025年8月,谷歌DeepMind發(fā)布新一代Genie3世界模型。Genie3實現(xiàn)了用戶交互的實時響應(yīng),支持使用提示詞生成世界事件,并能維持?jǐn)?shù)分鐘的一致性。圖片來源:谷歌
海辛:我覺得是硬件。我希望大模型能放進任何一個硬件(玩偶、手辦等)里面,這樣AI與人的交互就不單單僅限于屏幕。像這樣可以脫離屏幕本身的交互會很讓人期待,它不會局限在一個2D的環(huán)境里,未來可能整個房子都可以和我互動。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




