欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

不止能做鐘馗手辦!全網(wǎng)最強(qiáng)圖像生成AI實(shí)測(cè):這是終極版PS?

2025-09-01 11:35
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

最近兩周,“手辦化”突然就火了。

事情是這樣的,大約在兩周之前,大模型競(jìng)技場(chǎng)LMArena上架了一個(gè)只聞其名,不見(jiàn)其身的神秘模型——“nano banana”,按照官方說(shuō)法,這是一個(gè)頂尖的圖像生成與編輯模型,能實(shí)現(xiàn)前所未有的創(chuàng)作控制力。

結(jié)果呢?整個(gè)互聯(lián)網(wǎng)的AIGC玩家,都在用它變身“手辦大師”。

不開(kāi)玩笑,小雷是真被這玩意給刷屏了,這兩天一打開(kāi)群聊,就能看到無(wú)法無(wú)天的群友們?cè)谀眠@玩意瘋狂整活,有把自己頭像做成限量版GK模型的,有把自家貓狗“手辦化”的,甚至還有給剛發(fā)布的《黑神話(huà):鐘馗》弄雕像和游戲盒的,推特上的國(guó)外網(wǎng)友玩得更是樂(lè)此不疲,看得我都有點(diǎn)心癢癢的。

幸好,這次我們不用眼巴巴地羨慕了。

(圖源:LMArena)

隨著Google的正式發(fā)布,如今Gemini 2.5 Flash Image已經(jīng)通過(guò)Gemini API和Google AI Studio向公眾開(kāi)放預(yù)覽,用戶(hù)只需訪問(wèn)官網(wǎng),就能直接體驗(yàn)到下一代圖像模型的威力。

最重要的是,這玩意在AI Studio里進(jìn)行測(cè)試是完全免費(fèi)的,對(duì)于我們這種熱愛(ài)嘗鮮的玩家來(lái)說(shuō),簡(jiǎn)直是把探索未來(lái)的門(mén)檻給直接鏟平了。

話(huà)不說(shuō)多,我們這邊直接開(kāi)整!

Gemini 2.5 Flash Image讓人人成手辦大師

想體驗(yàn)這個(gè)功能的話(huà),其實(shí)還蠻簡(jiǎn)單的就是了。

打開(kāi)Google AI Studio網(wǎng)頁(yè)版,在Generate media選項(xiàng)卡下就能找到Gemini 2.5 Flash Image。界面非常直觀,一個(gè)提示詞輸入框,一個(gè)上傳圖片的區(qū)域,這就是通往新世界的大門(mén)。

要做的事情很簡(jiǎn)單,上傳一張圖片,然后用自然語(yǔ)言告訴它我們想要生成的內(nèi)容就像。

(圖源:Gemini)

話(huà)不多說(shuō),先來(lái)看圖。

首先,我們準(zhǔn)備一張自己想要進(jìn)行“手辦化”的圖片,可以是動(dòng)漫,也可以是真人,甚至不必是全身照,比如這張來(lái)自漫畫(huà)《捉摸不透的刑警織子?!防锏挠邪⒐瓤椬拥膯稳藞D就很不錯(cuò)。

接下來(lái),輸入提示詞:

Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.

最終成品如下:

(圖源:雷科技自制)

不得不說(shuō),Gemini對(duì)“手辦質(zhì)感”的理解已經(jīng)超出了我的預(yù)期。

這張圖的生成效果達(dá)到了以假亂真的水準(zhǔn),無(wú)論是手辦本身的材質(zhì)(蕾絲、皮革、肌膚)、包裝盒上的文字和品牌Logo,還是背景電腦屏幕上復(fù)雜的建模界面都很不錯(cuò),只有高度模糊的背景能看出些端倪。

再來(lái)些熱門(mén)的,比如說(shuō)《黑神話(huà):鐘馗》:

(圖源:雷科技自制)

接著試一下大家都關(guān)心的名人,比如說(shuō)馬斯克:

(圖源:雷科技自制)

從結(jié)果來(lái)看,轉(zhuǎn)換效果可以說(shuō)是幾無(wú)失手,非常成熟。

如果你想玩點(diǎn)更高級(jí)的,我們把這張生成的圖片,扔進(jìn)同樣是豆包視頻生成中,用提示詞“畫(huà)面外的人從兩邊伸出亞洲人的雙手,拿起手辦把玩并展示桌上手辦的視頻”,生成一段把玩手辦的視頻。

(圖源:雷科技自制)

如果用提示詞“360度緩慢旋轉(zhuǎn)這個(gè)手辦,轉(zhuǎn)臺(tái)拍攝”,就能生成一段平滑的環(huán)繞展示視頻。

(圖源:雷科技自制)

最后還可以用Meshy或者騰訊混元3D,將手辦3D建?;?/strong>我們就能得到一個(gè)可以自由旋轉(zhuǎn)、縮放的3D模型。

(圖源:雷科技自制)

雖說(shuō)后兩步借助了其他工具,但由Gemini 2.5 Flash Image產(chǎn)出的高質(zhì)量初始素材,是整個(gè)工作流成功的基石。這種打破次元壁的做法,讓每個(gè)人都能低成本地實(shí)現(xiàn)從一個(gè)想法到3D產(chǎn)品的完整流程,在過(guò)去是很難想象的。

修圖能力更強(qiáng)了,其實(shí)是終極版PS?

不過(guò),人人都在玩手辦化,是不是有點(diǎn)大材小用了?

我們不妨轉(zhuǎn)換一下思路,把它當(dāng)成終極版的PS來(lái)用?

舉個(gè)例子吧,比如說(shuō)那些珍貴的、但因年代久遠(yuǎn)而模糊破損的老照片,它能不能修復(fù)呢?

我上傳了一張黑白老照片,照片上有劃痕和噪點(diǎn),清晰度也很低。

(圖源:X)

接下來(lái),輸入提示詞:

Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.

(圖源:Gemini)

答案是,“完全可以,而且效果驚人”。

可以看到,Gemini 2.5 Flash Image不僅清除了物理?yè)p傷,還通過(guò)算法補(bǔ)全了缺失的細(xì)節(jié),面部的紋理和眼神光都得到了合乎邏輯的重現(xiàn)。上色的效果也偏近自然,沒(méi)有出現(xiàn)早期AI上色那種“塑料感”,充滿(mǎn)了溫暖的時(shí)代氣息。

再試試設(shè)計(jì)行業(yè)里源遠(yuǎn)流長(zhǎng)的梗,“把白天改成黑夜”這種要求,它能不能實(shí)現(xiàn)呢?

(圖源:雷科技)

提示詞:

Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.

(圖源:Gemini)

只能說(shuō),Gemini 2.5 Flash Image在語(yǔ)義理解和光影重構(gòu)這塊,已經(jīng)達(dá)到了很出彩的水平。它不僅僅是簡(jiǎn)單地調(diào)暗畫(huà)面,而是真正理解了“夜晚”、“燈光”、“下雨”這些概念,并合乎物理邏輯地對(duì)整個(gè)畫(huà)面進(jìn)行了重新渲染。

最后,我也試了一下它的風(fēng)格切換能力。

這次就拿《Panty&Stocking》里的畫(huà)面做例子:

(圖源:X)

提示詞:

Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.

(圖源:Gemini)

很有意思,它不僅做到了“三次元化”,還微妙地捕捉到了王家衛(wèi)電影那種獨(dú)特的色彩、光影和氛圍感。

這種跨越媒介和導(dǎo)演風(fēng)格的無(wú)縫切換,為藝術(shù)創(chuàng)作提供了更多可能。

不算完美,卻堪稱(chēng)圖片AIGC新標(biāo)桿

不可否認(rèn),Gemini 2.5 Flash Image的發(fā)布,標(biāo)志著AI在圖像生成領(lǐng)域?qū)崿F(xiàn)了重大突破。

就像我展示的那樣,曾經(jīng)需要專(zhuān)業(yè)人士花費(fèi)數(shù)小時(shí)在PS里用蒙版、圖層、筆刷精雕細(xì)琢的工作,如今只需一句自然語(yǔ)言就能瞬間完成,甚至修圖效果比我這種半吊子還要好上不少,屬實(shí)有點(diǎn)慚愧。

目前該模型在預(yù)覽階段,并非完美無(wú)瑕。

在處理極其復(fù)雜的、包含大量人物的場(chǎng)景時(shí),Gemini偶爾還是會(huì)出現(xiàn)輕微的邏輯錯(cuò)誤或細(xì)節(jié)失真。對(duì)于一些過(guò)于抽象或違反物理常識(shí)的指令,它的理解能力也還有提升空間。

不管怎么說(shuō),Gemini 2.5 Flash Image算是為AI圖片生成應(yīng)用樹(shù)立了一個(gè)新的標(biāo)桿。

可以預(yù)見(jiàn)的是,隨著技術(shù)的不斷成熟和成本的降低,未來(lái)手機(jī)、電腦的相冊(cè)和編輯器都可能會(huì)原生集成這項(xiàng)功能,就像AI消除、AI擴(kuò)圖那樣走進(jìn)尋常百姓家。無(wú)論是專(zhuān)業(yè)設(shè)計(jì)師還是普通用戶(hù),每個(gè)人都有機(jī)會(huì)輕松上手,將自己腦海中的創(chuàng)意和對(duì)美的理解,更直觀、更高效地展現(xiàn)出來(lái)。

修圖有手就行?或許真的不是夢(mèng)。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶(hù)端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司