腾讯发布混元世界模型1.1版本,秒级创造 3D 世界;清华大学等机构联合开源FlashVSR,支持视频一键变高清

【重要资讯】
腾讯发布混元世界模型1.1版本:秒级创造 3D 世界
10月22日,腾讯混元官宣,混元世界模型1.1版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造3D世界。作为一个统一(any-to-any)的前馈式(feedforward)3D重建大模型,混元世界模型1.1解决了1.0版本仅支持文本或单图输入的局限,首次同时支持多模态先验注入和多任务统一输出的端到端3D重建。此外,混元世界模型1.1还支持额外的相机、深度等多模态先验输入,并基于统一架构实现点云、深度、相机、表面法线和新视角合成等多种3D几何预测。
【行业动态】
清华大学等机构联合开源FlashVSR:支持视频一键变高清
近日,清华大学等机构的研究者联合开源了一款实时流式视频超分辨率处理的模型:FlashVSR。FlashVSR 的核心功能是让视频超分辨率处理变得既快又好,它解决了传统扩散模型在视频超分中存在的速度慢、高延迟、计算复杂度高三大瓶颈问题。与以往需要数分钟甚至数小时处理视频的技术不同,FlashVSR在单张A100 GPU上就能对768×1408分辨率的视频实现接近实时的17 FPS处理速度,比当前最快的单步扩散模型还要快11.8倍。
小度AI眼镜11月正式发布
小度AI眼镜将于11月在百度世界2025大会上正式推出,并计划于今年年内上市销售,该产品曾被定义为“全球首款搭载中文大模型的原生AI眼镜”,其功能包括第一视角拍摄、实时问答、卡路里识别、物品识别、视听翻译及智能备忘等。
【国际动态】
Netflix将全面拥抱生成式AI
Netflix在最新财报中表示将"全力投入"生成式AI技术,认为AI能够有效提升创作效率。CEO萨兰多斯强调AI不会取代创意,而是为创作者提供更好的工具。Netflix 在阿根廷剧集《The Eternaut》中首次使用生成式AI制作特效场景,后续作品中也运用AI技术优化角色形象及设计服装和布景。
更多推荐

所有评论(0)