字节跳动联合UCLA开发长视频生成新方法;阿里巴巴成立机器人AI团队
·
【重要资讯】
字节跳动联合UCLA开发长视频生成新方法
字节跳动与UCLA(加州大学洛杉矶分校)联合推出Self-Forcing++ 方法,成功实现了最长可生成4分15秒的高质量AI视频,相比以往的5到10秒视频生成时间提升近50倍。该方法无需更改模型架构,通过优化训练过程及采用自回归生成策略,有效抑制了视频后期质量下降的情况。实验结果显示,Self-Forcing++ 在视觉稳定性、动态程度及文本对齐等多个维度均表现优异,超越了多个现有技术。
【行业动态】
阿里巴巴成立机器人AI团队
近日,据网络消息称,阿里巴巴已成立“机器人和具身AI小组”,隶属于通义千问。另外,通义千问技术负责人林俊旸表示,多模态模型正被转化为能够执行长时序推理任务的基础智能体,这些应用“理应从虚拟世界迈向现实世界!”。
【国际动态】
xAI团队推出新视频生成模型Imagine v0.9
马斯克旗下xAI公司推出新的视频生成模型Imagine v0.9,该模型在视频生成速度和功能上有所提升,在画质、动态效果、音频生成等方面相较于v0.1版本实现全面升级。同时,其生成视频时间缩短至20秒(Sora2视频生成时间大约是1至2分钟),支持语音优先界面,用户通过语音可创建视频。
ChatGPT将支持在对话界面调用多个第三方应用
OpenAI在DevDay(开发者大会)上宣布,ChatGPT将支持直接在对话界面中调用多个第三方应用,如 Spotify(音乐流媒体)、Canva(设计平台)、Zillow(房地产平台)、Booking.com(全球在线旅游平台)。用户可以通过简短的指令,例如“帮我在Canva上设计一个宠物品牌海报”,ChatGPT即可自动生成设计。ChatGPT 还可与Zillow结合,生成互动房源地图,用户可以在对话框中直接选择、询问或比较房价。
更多推荐
所有评论(0)