
帖子
引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。
相關快訊
Perplexity開源推理底座pplx-garden,繞過英偉達網路稅實現多卡極速通信
英偉達發佈Gamma-World,多智慧體世界模型支援四人協作與即時24 FPS
AI 與頭部科技股延續強勢走向,Gate 拓展全球資產交易覆蓋能力
SpaceX自研C語言AI訓練框架接近完工,將用於訓練Grok v5
外國投資者連續第八周買入日本股票
美股交易造富鏈上巨鯨:某位址430萬本金涉足美股,兩個月翻超280%
「光子股神」:英偉達入股助力諾基亞轉型AI基礎設施,近一個月內部人士積極增持
年化營收猛增至6億美元,AI推理服務商Baseten擬以110億美元估值融資10億美元
「英偉達挑戰者」Cerebras上線兩周回落35.8%,鏈上CBRS最大空頭盈達126萬美元
高通與位元組跳動達成數百萬顆AI晶元採購協定