Skip to content Skip to sidebar Skip to footer

AI界又變天!快手可靈2.0炸裂更新,影片、圖片創作一鍵封神,自媒體人準備好迎接「智能外掛」了嗎?

AI界又變天!快手可靈2.0炸裂更新,影片、圖片創作一鍵封神,自媒體人準備好迎接「智能外掛」了嗎?

各位自媒體大神、內容創作者們,準備好迎接AI創作工具的又一波「核能級進化」了嗎?快手旗下的可靈AI在2025年4月15日正式發佈了其2.0版本的系列模型,包括可靈2.0影片生成模型和可圖2.0圖像生成模型。 這次更新不僅僅是數字上的變化,更是性能上的一次大飛躍,旨在讓AI更「聽話」,讓大家的創意表達更精準、更高效!

可靈AI 2.0 性能大躍進,自媒體創作迎來新「外掛」

各位內容創作者,人工智慧創作工具的發展已邁入新階段!可靈AI 2.0版本將於2025年4月15日正式發布,這不僅體現在功能的擴充,更展現了AI在創意理解、品質提升、創作自由度三大領域的重大突破:

  • AI理解力躍升,從「任務處理」到「創意共鳴」:
    • 新模型(可靈2.0影片/可圖2.0圖像)大幅增強了對複雜語義和多模態資訊(MVL理念)的理解能力,AI不再只是被動接受指令,更能捕捉和詮釋你內心深處的複雜創意和微妙情感。
  • 生成品質全面進化,逼近專業級「影視工業」水準:
    • 從影片的動作連貫性、畫面美學,到圖像的電影級質感、細節真實度,均達到業界領先水準,讓普通創作者也能輕鬆產出具有專業水準的視覺內容。
  • 創作自由度極大釋放,從「固定模板」到「隨心掌控」:
    • 全新的多模態編輯功能(影片/圖像)賦予用戶前所未有的後期掌控力,支持對AI生成內容進行精細化調整、元素增刪替換,真正實現「我的作品我做主」。

Ref: 可靈 2.0 官方更新公告

一、 影片生成更「靈」:可靈2.0(大師版)三大突破

全新的可靈2.0(大師版)影片生成模型,相較於之前的1.6版本,在以下三大方面實現了「肉眼可見」的進步:

  • 語義響應大幅提升:AI更能理解你的「心之所向」了!無論是複雜的動作、細膩的表情,還是專業的運鏡指令,可靈2.0都能更準確地捕捉和呈現。 這意味著你可以更大膽地描述那些時序更複雜、更具電影感的鏡頭,AI助你輕鬆創作出大片級的畫面。

可靈1.6模型

可靈2.0(大師版本)

  • 動態質量大幅提升:影片中的角色和主體動起來更自然、更流暢了!新模型能更好地處理大幅度的動作和更快的速度,即使是複雜的動作細節也能細膩呈現,讓畫面更具活力和真實感。 想像一下,恐龍衝向鏡頭的震撼,或是滑板少年流暢的運動軌跡,都能被AI更逼真地還原。

可靈1.6模型

可靈2.0(大師版本)

  • 畫面美感大幅提升:顏值即正義,AI也懂!可靈2.0生成的角色更加真實,動作和表情堪比專業演員。 文生影片能夠響應影視級別的畫面描述,大片質感,纖毫畢現。而在圖生影片方面,新模型能更好地保持原圖的畫風,延續並放大原有的美感。 

可靈1.6模型

可靈2.0(大師版本)

官方數據顯示,在圖生影片領域,可靈2.0對比Google的Veo2勝負比為182%,對比Runway的Gen-4勝負比達178%,在語義響應、畫面質量、動態質量等維度上顯著超越對手。 此前,可靈1.6 Pro版本就曾在全球AI基準測試機構Artificial Analysis的圖生影片賽道登頂。而最新的消息是,可靈2.0模型在同一榜單上以更高的分數再次奪魁,連續三月穩居榜首。

二、 圖像生成更「精」:可圖2.0多維度顯著增強

圖片作為影片創作的重要素材(目前圖生影片約佔可靈AI影片創作量的85%),其質量直接影響最終的影片效果。全新發佈的可圖2.0圖像模型,在以下方面也取得了顯著進步:

  • 指令遵循能力大幅提升:AI更能準確理解你的複雜指令了! 可圖2.0對於包含多種元素、複雜描述、顏色位置等指令的響應有了大幅度提升,畫面細節的真實感更強,生成結果的可用率也更高。

Prompt:

一張超寫實的照片,一條河流從客廳牆上的油畫中漂浮而出,延伸至沙發與木地板之上。這幅畫描繪了一條靜謐的山間河流,一艘小船在水面上輕輕搖晃,緩緩駛入客廳。河岸的邊界延伸至木地板,將藝術世界與現實空間融為一體。客廳裝飾著高雅的家具與溫馨的氛圍,宛如一幕電影場景或攝影作品。

  • 電影級質感提升:想要電影大片的氛圍和層次感?可圖2.0安排!新模型生成的畫面在構圖上更具高級感,光影色彩的運用也為畫面帶來了獨特的美學調性。 

Prompt:

擺滿白色桌子的宴會廳,賓客們圍坐其中,正享用一頓精緻的美食。

  • 多風格響應擴展:可圖2.0支持超過60種藝術風格的轉繪,涵蓋特殊材質、數字藝術和各種繪畫技法。 無論你想要梵高風、賽博朋克風,還是一鍵get時下爆款效果,都能輕鬆實現。

Prompt:

工筆畫風格的林黛玉,身穿唐代服飾,坐在咖啡館的一隅,手中拿著一部智慧型手機,側身迎著逆光,神情優雅而恬靜。

在團隊內部的多項評測中,可圖2.0相較於Midjourney V7、FLUX1.1 Pro等業界領先的圖像模型,均保持明顯優勢。

三、 交互與編輯更「自由」:MVL理念與多模態編輯功能

為了讓人們更精準地表達心中所想,解決單純文字描述在表達影像資訊時的不足,可靈AI正式發佈了全新的AI影片生成交互理念——Multi-modal Visual Language (MVL) 多模態視覺語言。MVL允許用戶結合圖像參考、影片片段等多模態資訊,傳達包含身份、外觀、風格、場景、動作、表情、運鏡在內的多維度複雜創意。

基於MVL理念,可靈2.0(大師版)全面升級了影片及圖像創作的可控生成與編輯能力。 

  • 多模態影片編輯:這是一項國內AI平台中領先的精細化影片編輯能力。 你可以在一段已生成的影片基礎上,通過輸入文字或圖片指令,對影片內容實現元素的增加、刪減、替換和修改。比如給人物換裝、添加道具,甚至改變場景元素,都成為可能。 
    • 替換元素:可在多個關鍵幀上,指定影片中連續的內容區域,並使用參考圖中的主體對其進行替換,例如替換背景、人物服裝等。

原片

生成結果

    • 新增元素:可輸入 1 至 2 張參考圖,或利用文字描述的方式,為影片主體內容新增元素,例如讓太空船降落在城市上空。

原片

生成結果

    • 刪除元素:可在多個關鍵幀上,指定影片中連續的內容區域,將其中的主體或背景內容刪除,例如移除誤入鏡的路人。

原片

生成結果

  • 圖像可控編輯:可圖2.0上線了實用的圖像編輯功能,包括局部重繪和更自由的多尺寸擴圖。 你可以對任意圖片的指定區域進行修改,或者靈活調整圖片尺寸和構圖,AI生成的内容能與原圖高度自然融合。
    • 局部重繪:可指定需重繪的區域,並提供目標內容的提示詞描述,即可對圖片進行內容新增、元素修改等操作。生成內容與原圖融合自然,真實感達業界頂尖水準,適用於修補圖片素材、調整細節、創作案例等,提升整體創作效率與品質。

原圖

Prompt:戴上很酷的墨鏡

生成結果

    • 擴圖:支持圖片尺寸與內容的自由擴展,能夠拖拽調整原圖位置、改變圖片大小、擴展畫面內容與視野。生成內容具有高度想像力,與原圖融合度高,為創作提供豐富素材來源。創作過程中也支援尺寸「調節」工具,一鍵生成多尺寸圖片,創作更加靈活。

原圖

Prompt:城市街道

生成結果

  • 圖片風格轉繪:上傳一張圖片,再輸入想要的風格描述,就能一鍵轉變圖像的藝術風格,同時還能精準保留原圖的語義內容。

Prompt:轉換成復古美少女風格

在團隊內部的多項評測中,可圖2.0相較於Midjourney V7、FLUX1.1 Pro等業界領先的圖像模型,均保持明顯優勢。

總結:性能起飛,創作更自由!

總而言之,快手可靈AI 2.0的更新,是其在模型基礎能力、生成效果和用戶體驗上的一次全面進化。無論是影片的動態、語義理解、畫面美感,還是圖片的指令遵循、電影質感、風格多樣性,都有了顯著的性能提升。再加上全新的MVL交互理念和強大的多模態編輯功能,無疑為廣大自媒體人和內容創作者提供了更強大、更自由、更高效的創作工具。 

正如快手高級副總裁蓋坤所言,可靈希望「讓每個人都能用AI講出好故事」。隨著AI技術的飛速發展,像可靈AI 2.0這樣不斷突破性能極限的工具,正在將AI輔助創作推向一個全新的高度,讓我們的創意真正做到「所思即所得」。各位創作者們,準備好駕馭這股AI新浪潮,讓自己的作品更上一層樓了嗎?