自助广告-日活跃5000+IP查看详情

秀人网写真集

低价火爆100G流量卡

智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

AI行业资讯6小时前发布本文共计747个字，预计阅读时长3分钟。墨白

6.3K 0 0

在近日落幕的智谱多模态开源周上，智谱团队宣布开源四项针对视频生成领域的核心技术。这些成果不仅展现了智谱在多模态模型方面的最新突破，也为视频生成技术的进一步发展提供了重要支持。

在过去一周内，智谱GLM团队陆续发布了包括GLM-4.6V视觉理解模型、AutoGLM设备控制模型、GLM-ASR语音识别模型及GLM-TTS语音合成模型在内的多模态模型系列。这些技术旨在提升大模型在理解世界知识、记忆能力与复杂推理等方面的能力，使其更贴近人类的认知水平。

在开源周的最后阶段，团队集中发布了四项聚焦于视频生成关键挑战的新技术：SCAIL、RealVideo、Kaleido与SSVAE。它们分别针对精细化可控生成、复杂时空结构建模以及大规模训练成本控制等核心问题。

SCAIL技术专注于影视级角色动画生成，可实现复杂姿态的精准控制，确保生成角色在运动过程中的结构完整性。RealVideo则是一套实时流式视频生成系统，显著降低了生成延迟，仅需2至3秒即可输出视频，使得与AI角色的互动更为流畅自然。

Kaleido技术着力于多主体视频生成，能够保持多个主体之间的一致性，有效避免常见的特征混淆现象。SSVAE则通过训练过程的优化，提升了视频生成模型的训练效率，在同等输出质量下可将收敛速度提高三倍。

智谱团队表示，希望通过开源这些技术，激发视频生成技术社区的创新活力，为开发者提供更多可落地的工程方案与研究基础。同时，智谱也期待与全球开发者共同探索人工智能的演进路径，进一步推动通用人工智能（AGI）的实现。

核心亮点：

🌟 SCAIL：实现影视级角色动画生成，支持复杂姿态精准控制。

⚡ RealVideo：实时视频生成系统，生成延迟低至2–3秒。

🎨 Kaleido：多主体视频生成框架，确保主体间一致性，避免特征混淆。

AI行业资讯

文章版权归作者所有，未经允许请勿转载。

王兴：美团已开发内部大模型 LongCat，美团AI能否破局！

AI行业资讯

9个月前

3.1K0

Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

AI行业资讯

3个月前

8.8K0

DeepSeek连发两款重磅新模型，正式版V3.2与Speciale同步上线

AI行业资讯

1周前

1.6K0

中金公司：中国互联网公司在AI应用方向竞争力较强

AI行业资讯 # AI # 中金公司

10个月前

2.5K0

智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

迪士尼指责谷歌严重侵犯版权，发出停止侵权通知

迪士尼与 OpenAI 达成协议，授权使用热门角色创作视频与图像

相关文章

王兴：美团已开发内部大模型 LongCat，美团AI能否破局！

Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

DeepSeek连发两款重磅新模型，正式版V3.2与Speciale同步上线

中金公司：中国互联网公司在AI应用方向竞争力较强

热门文章

创意行业70% 的从业者因使用 AI 感到社会压力，担忧失业

腾讯自研大模型混元2.0发布：多方面能力提升

OpenAI 财务泄露：巨额开销压制盈利前景

半数英国成年人担忧 AI 对就业的影响，工会呼吁更大参与

字节跳动的豆包大模型：日均调用超30万亿tokens，增长势头惊人！

vLLM-Omni 发布：可以处理文本、图像、音频和视频

​智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

​迪士尼指责谷歌严重侵犯版权，发出停止侵权通知

​迪士尼与 OpenAI 达成协议，授权使用热门角色创作视频与图像

相关文章

热门文章

网址

智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

迪士尼指责谷歌严重侵犯版权，发出停止侵权通知

迪士尼与 OpenAI 达成协议，授权使用热门角色创作视频与图像