
字節(jié)跳動推出革命性AI人像生成技術(shù)InfuseNet 突破傳統(tǒng)生成質(zhì)量瓶頸
在人工智能圖像生成領(lǐng)域取得重大突破,字節(jié)跳動近日宣布研發(fā)成功全新的AI人像生成技術(shù)InfuseNet。該技術(shù)通過創(chuàng)新性的特征處理方式,有效解決了當(dāng)前AI生成人像中普遍存在的五官不一致、快速跟進(jìn)效果差等技術(shù)難題。

技術(shù)架構(gòu)創(chuàng)新
區(qū)別于PuLID-FLUX等直接修改AI模型注意力機(jī)制的傳統(tǒng)解決方案,InfuseNet采用了突破性的并行信息層處理架構(gòu)。該技術(shù)將面部特征作為獨立信息流進(jìn)行處理,在保持核心AI模型完整性的同時,顯著提升了肖像生成質(zhì)量。
兩階段訓(xùn)練優(yōu)化
InfuseNet采用精心設(shè)計的兩階段訓(xùn)練流程:
第一階段基于真實肖像照片進(jìn)行模型訓(xùn)練
第二階段轉(zhuǎn)向由系統(tǒng)專用優(yōu)化模塊生成的合成圖像
這種漸進(jìn)式的訓(xùn)練方法確保了模型在學(xué)習(xí)真實人臉特征的同時,也能適應(yīng)多樣化的生成需求。
卓越的生成效果
據(jù)字節(jié)跳動技術(shù)團(tuán)隊介紹,InfuseNet在人像生成質(zhì)量上實現(xiàn)了多項突破:
生成圖像與原始人物的相似度顯著提升
對文本提示的遵循更加精準(zhǔn)
有效避免了人臉直接復(fù)制和質(zhì)量下降等常見問題

在 16 名參與者的用戶測試中,InfiniteYou 顯示出比現(xiàn)有解決方案明顯的優(yōu)勢。在評估面部相似度、文本提示準(zhǔn)確性、圖像質(zhì)量和美觀度時,72.8% 的人更喜歡 InfiniteYou 的結(jié)果,而 PuLID-FLUX 的比例僅為 27.2%。
InfiniteYou 可與 ControlNet 和 LoRA 等熱門 AI 工具配合使用。該系統(tǒng)僅需四個處理步驟即可生成圖像,并允許用戶修改其中的人物和物體。雖然字節(jié)跳動承認(rèn)這些改進(jìn),但同時也指出,面部相似度和圖像質(zhì)量仍有提升空間。
技術(shù)開放與行業(yè)合作
目前,字節(jié)跳動已在GitHub平臺開源InfiniteYou項目代碼,并通過Hugging Face提供模型權(quán)重下載。雖然實驗性演示尚未正式啟動,但技術(shù)社區(qū)已可提前接觸這一創(chuàng)新成果。
作為內(nèi)容真實性倡議組織成員,字節(jié)跳動正與多家相機(jī)制造商和媒體服務(wù)商合作,推進(jìn)C2PA元數(shù)據(jù)標(biāo)準(zhǔn)的應(yīng)用,以實現(xiàn)AI生成內(nèi)容的有效識別。不過,關(guān)于InfuseNet是否會集成這些身份驗證功能,公司方面暫未透露具體細(xì)節(jié)。
此次技術(shù)發(fā)布是字節(jié)跳動在AI領(lǐng)域持續(xù)創(chuàng)新的最新成果。
精選文章:
藝術(shù)真的能治愈嗎?創(chuàng)造力對心理健康的力量