可靈AI推出“多圖參(cān)考”功能(néng) 進一步攻克(kè)AI視頻一致性難(nán)題

2025-02-06

來源:互聯網

近日(rì),快手可靈AI正式麵向全球推出“多圖參考”模式(shì),該功(gōng)能(néng)能夠理解和整合多個圖片中的不同主體,根據用戶(hù)的文字描述,創造性地生(shēng)成融(róng)合視頻,進(jìn)一步攻克了AI視頻生成(chéng)中的一致性難題。

目前,全(quán)球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用(yòng)戶隻(zhī)需選擇圖生視(shì)頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場(chǎng)景,並通過“提示詞”描述它們之間(jiān)的變化(huà)或互動(dòng),可靈AI即可結(jié)合所有參考內容並遵從指令生成視頻。

用戶可以上傳一張(zhāng)或多張同一主體(人物(wù)、動物、影視角色或物品等)的圖片,模型會以這些圖片為(wéi)參考,生成統(tǒng)一風格的視頻,幫助用(yòng)戶在製(zhì)作AI視(shì)頻時保證多鏡頭中的主體一致。例如,用戶(hù)上傳貓、夾克、太陽鏡三張圖片,並輸入提示詞“一隻身穿夾克、戴著(zhe)太陽鏡的(de)擬人化貓(māo)在舞台上轉身並對著鏡頭擺姿勢,”隨後進行生(shēng)成,就可以得到符合指令的視頻。

此外,用戶還(hái)可以通過參考圖來指定場景、服裝和動作等(děng),讓人物在特定環(huán)境中完成(chéng)特定“演(yǎn)出”,大幅(fú)提升創作的(de)可控(kòng)性。例如,精东影业天美传媒网站分別上(shàng)傳一個老爺爺、一杯咖啡、咖啡館場(chǎng)景三張參考圖片,並輸入相應提示詞“一個卡(kǎ)通風格的老爺爺在咖啡館裏,端起(qǐ)咖啡杯”來進行生成,便可(kě)得到老爺爺坐在咖啡館裏喝咖啡的視(shì)頻 。

同(tóng)時,“多圖參考”還可以支持不同角色(sè)之間的互動。用戶可(kě)以(yǐ)上傳多個人物、動物或者影視角色等圖(tú)片,並用文字(zì)描述他們(men)之間的互動。例如,精东影业天美传媒网站分別上(shàng)傳小男孩、柯基犬(quǎn)兩張參考圖,並(bìng)輸(shū)入提示詞“一個可愛的小男孩在撫摸一隻柯基犬”,即(jí)可生成下圖所(suǒ)示的視頻。

此前(qián),可靈AI已在全球上線“人臉模型”功(gōng)能,支持用戶通過上(shàng)傳多段(duàn)視頻來訓練、定製人臉模型,並(bìng)參照該人臉模型繼續(xù)生成視頻內容。作為業內首個(gè)視頻模型定製功能,“人臉模型”創新性(xìng)地滿足了用戶創作多個包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進一步解決了視頻生成中的一致性(xìng)難題,幫助用戶充分發揮創造力(lì),自由組合各種(zhǒng)圖片元素,打造獨特的創意場景(jǐng),探索更多(duō)可能。



更多新聞
國內AI眼鏡賽道火熱,多家上市公司布局上下(xià)遊產業(yè)鏈

國內AI眼鏡賽道火熱,多家上市公(gōng)司布局上下遊產業鏈

林氏木業斬(zhǎn)獲(huò)AI創(chuàng)變大獎:AIGC技(jì)術(shù)重塑家居營銷新格局

林氏木業斬獲AI創變大獎:AIGC技術重塑家居營銷新格局

強腦(nǎo)科(kē)技×喜臨門 | 開創AI床墊人機交互新範式,探索千行百業融合(hé)新未來

強腦科技×喜臨門 | 開創AI床墊人機交互(hù)新範(fàn)式(shì),探(tàn)索(suǒ)千行百業融合新未來

网站地图 精东影业天美传媒网站_97国产精东麻豆人妻电影_精东影业传媒在线观看_国产麻豆精品精东影业AV网站