4月16日,騰訊正式發(fā)布并開源混元3D世界模型2.0( HY-World 2.0)。HY-World 2.0是一個(gè)多模態(tài)世界模型,能夠理解文字、圖片、視頻等不同類型輸入,自動(dòng)生成、重建和模擬 3D 世界,同時(shí)支持多格式3D資產(chǎn)(Mesh/3DGS/點(diǎn)云等)導(dǎo)出,可以與現(xiàn)有的游戲工作流無縫對(duì)接,用于快速生成游戲地圖和關(guān)卡原型。

混元世界模型 2.0讓 AI 從“對(duì)話”“畫圖”“捏物體”,進(jìn)化到了“造世界”——包含人、物、景的完整世界。不同于谷歌的Genie 3和混元世界模型1.5僅能生成視頻文件,世界模型2.0的實(shí)用性更進(jìn)一步:它可以直接生成可二次編輯的3D資產(chǎn)文件,這些生成的3D資產(chǎn)可以直接導(dǎo)入到游戲制作或者具身仿真引擎,實(shí)現(xiàn)真正可玩、可用。目前,世界模型2.0已經(jīng)上線至騰訊混元3D創(chuàng)作引擎官網(wǎng)。
混元世界模型2.0支持文、圖、視頻多種輸入。輸入一段文字或一張圖片,模型即可精準(zhǔn)解析復(fù)雜語義,一鍵生成風(fēng)格多樣的可漫游世界。相比較混元世界模型1.0,2.0的模型架構(gòu)全面升級(jí),畫面精細(xì)度和真實(shí)感大幅提升。用戶還可以自定義風(fēng)格,按需生成真實(shí)風(fēng)、漫畫風(fēng)、游戲風(fēng)的3D空間。生成完成后,用戶可以將資產(chǎn)導(dǎo)入到Unity、UE 等引擎、進(jìn)行二次編輯,顯著降低了游戲地圖的創(chuàng)作門檻。
模型還支持角色模式,用戶可以操作角色在街道、建筑、場景中自由探索,不限時(shí)間,具有物理碰撞,就像在游戲里一樣。
同時(shí),世界模型2.0支持復(fù)刻真實(shí)3D場景,用戶輸入一段真實(shí)空間的視頻或者多視角圖片,模型就能構(gòu)建出高精度的數(shù)字孿生空間;谏(jí)后的 WorldMirror 2.0 架構(gòu),模型支持任意尺寸圖像與視頻輸入,一次性預(yù)測密集點(diǎn)云、多視角深度圖、表面法線及相機(jī)參數(shù) ,一次生成永久可復(fù)用。未來,室內(nèi)裝修預(yù)覽、城市規(guī)劃、文化遺產(chǎn)保護(hù)等場景,都可以基于這一能力實(shí)現(xiàn)快速構(gòu)建和還原。

混元世界模型2.0以3D為主軸,通過統(tǒng)一空間理解、生成、重建的架構(gòu),實(shí)現(xiàn)了SOTA級(jí)的生成效果。與其他世界模型相比,混元世界模型2.0在場景完整度(物體側(cè)面和背面)以及對(duì)輸入圖片的遵循程度表現(xiàn)更優(yōu);煸傻3DGS與Mesh的混合表征,也讓用戶能夠開啟角色模式進(jìn)行有真實(shí)物體碰撞的交互。
混元世界模型(HY-World 系列)自發(fā)布以來就在持續(xù)進(jìn)化:從首個(gè)開源的3D世界模型 HY-World 1.0 ,到可實(shí)時(shí)在線交互的 HY-World 1.5 ,再到一鍵生成3D空間資產(chǎn)的 HY-World 2.0,騰訊混元的3D世界模型正在一步步將“AI 造世界”從概念變?yōu)楝F(xiàn)實(shí)。
2025年下半年以來,騰訊引入多位高級(jí)人才、加快研發(fā)架構(gòu)升級(jí)、持續(xù)加大混元大模型研發(fā)效率,并取得了顯著成果。2025年12月,混元發(fā)布大語言模型2.0版本,推理能力與效率居國內(nèi)頂尖行列;智能水平更高的新模型 HY3 也在內(nèi)部業(yè)務(wù)測試中,在元寶App測試中獲得明顯正向收益。此次混元世界模型2.0發(fā)布,是混元在多模態(tài)領(lǐng)域的又一突破。
(注:此文屬于央廣網(wǎng)登載的商業(yè)信息,文章內(nèi)容不代表本網(wǎng)觀點(diǎn),僅供參考。)
長按二維碼關(guān)注精彩內(nèi)容





