來源:互聯網
近日(rì),快手可靈AI正式麵向全球推出“多圖參考”模式(shì),該功(gōng)能(néng)能夠理解和整合多個圖片中的不同主體,根據用戶(hù)的文字描述,創造性地生(shēng)成融(róng)合視頻,進(jìn)一步攻克了AI視頻生成(chéng)中的一致性難題。
目前,全(quán)球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用(yòng)戶隻(zhī)需選擇圖生視(shì)頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場(chǎng)景,並通過“提示詞”描述它們之間(jiān)的變化(huà)或互動(dòng),可靈AI即可結(jié)合所有參考內容並遵從指令生成視頻。
用戶可以上傳一張(zhāng)或多張同一主體(人物(wù)、動物、影視角色或物品等)的圖片,模型會以這些圖片為(wéi)參考,生成統(tǒng)一風格的視頻,幫助用(yòng)戶在製(zhì)作AI視(shì)頻時保證多鏡頭中的主體一致。例如,用戶(hù)上傳貓、夾克、太陽鏡三張圖片,並輸入提示詞“一隻身穿夾克、戴著(zhe)太陽鏡的(de)擬人化貓(māo)在舞台上轉身並對著鏡頭擺姿勢,”隨後進行生(shēng)成,就可以得到符合指令的視頻。
此外,用戶還(hái)可以通過參考圖來指定場景、服裝和動作等(děng),讓人物在特定環(huán)境中完成(chéng)特定“演(yǎn)出”,大幅(fú)提升創作的(de)可控(kòng)性。例如,精东影业天美传媒网站分別上(shàng)傳一個老爺爺、一杯咖啡、咖啡館場(chǎng)景三張參考圖片,並輸入相應提示詞“一個卡(kǎ)通風格的老爺爺在咖啡館裏,端起(qǐ)咖啡杯”來進行生成,便可(kě)得到老爺爺坐在咖啡館裏喝咖啡的視(shì)頻 。
同(tóng)時,“多圖參考”還可以支持不同角色(sè)之間的互動。用戶可(kě)以(yǐ)上傳多個人物、動物或者影視角色等圖(tú)片,並用文字(zì)描述他們(men)之間的互動。例如,精东影业天美传媒网站分別上(shàng)傳小男孩、柯基犬(quǎn)兩張參考圖,並(bìng)輸(shū)入提示詞“一個可愛的小男孩在撫摸一隻柯基犬”,即(jí)可生成下圖所(suǒ)示的視頻。





