
經(jīng)過數(shù)月的猜測,Midjourney終于推出了其首款視頻模型。公司稱這一舉措是實(shí)現(xiàn)AI系統(tǒng)實(shí)時模擬完整3D世界的重要早期里程碑。
全新的"圖像轉(zhuǎn)視頻"功能允許用戶將任何Midjourney生成的靜態(tài)圖像轉(zhuǎn)化為動畫短片。用戶只需在網(wǎng)頁界面點(diǎn)擊新增的"動畫"按鈕,即可選擇自動模式(由系統(tǒng)決定動畫效果)或手動模式(通過文字描述自定義動畫效果)。

該功能提供兩種主要模式:"低動態(tài)"模式適合固定鏡頭和緩慢移動的場景,而"高動態(tài)"模式會大幅增強(qiáng)鏡頭和主體的運(yùn)動幅度——不過Midjourney表示,這可能導(dǎo)致畫面精確度下降。
每段視頻可進(jìn)行最多四次延長,每次延長約4秒。用戶還能在每次延長時修改原始圖像的提示詞。
非Midjourney生成的圖像也可通過拖拽至提示框并設(shè)為"起始幀"來實(shí)現(xiàn)動畫效果,用戶只需用文字描述期望的運(yùn)動軌跡即可。

目前官方尚未公布分辨率、幀率或比特率的具體參數(shù),也未內(nèi)置畫質(zhì)提升功能。實(shí)測下載的視頻為480p MP4格式,幀率為24fps。
視頻生成成本約為圖像的八倍
該視頻功能目前僅限網(wǎng)頁端使用。生成視頻的消耗約為靜態(tài)圖像的八倍,每次可生成四段5秒的短片。實(shí)際換算相當(dāng)于每秒視頻消耗約1張圖像的生成額度。Midjourney聲稱其成本比競品低約25倍。
針對"Pro"及以上等級用戶,公司正在測試"視頻放松模式",允許用戶在不消耗快速生成額度的情況下制作視頻,可能進(jìn)一步降低單次生成成本。官方表示未來幾周將根據(jù)需求量和服務(wù)器負(fù)載調(diào)整定價策略。
技術(shù)演進(jìn)與行業(yè)競爭
Midjourney將此次視頻模型的發(fā)布視為關(guān)鍵過渡步驟。其長期目標(biāo)是將視頻模型、3D元素與實(shí)時處理技術(shù)整合為統(tǒng)一平臺。創(chuàng)始人David Holz始終致力于開發(fā)能實(shí)時模擬世界的系統(tǒng)。視頻模型開發(fā)過程中積累的經(jīng)驗也將反哺現(xiàn)有的圖像工具。
在AI視頻領(lǐng)域,谷歌Veo 3模型目前被普遍視為行業(yè)標(biāo)桿。該模型可直接通過文字提示生成視頻,無需初始圖像,還能添加語音和音效,在當(dāng)前AI視頻領(lǐng)域獨(dú)樹一幟。
法律糾紛持續(xù)發(fā)酵
與此同時,迪士尼與環(huán)球影業(yè)已聯(lián)合起訴Midjourney,指控其AI圖像生成器未經(jīng)授權(quán)創(chuàng)建了達(dá)斯·維德、小黃人等注冊商標(biāo)角色的圖像。這份提交至加州聯(lián)邦法院的訴狀指出,Midjourney在多次警告后仍持續(xù)復(fù)制受版權(quán)保護(hù)的內(nèi)容。
兩家制片公司要求賠償損失、陪審團(tuán)審判,并申請禁令阻止未來對受保護(hù)角色的使用。類似版權(quán)糾紛可追溯至2023年。截至目前,Midjourney尚未公開回應(yīng),其新視頻模型的訓(xùn)練數(shù)據(jù)來源亦不明確。
精選文章:
奢華可持續(xù)水上住宅:多塞特湖上的現(xiàn)代斯堪的納維亞設(shè)計
耐熱設(shè)計:城市領(lǐng)導(dǎo)者如何利用建筑材料抵御高溫危機(jī)