近日,谷歌DeepMind首席执行官德米斯·哈萨比斯在Axios AI+峰会上分享了其关于人工智能未来发展的前瞻观点。他表示,2026年有望成为多模态人工智能、互动式视频空间以及高可靠性AI代理技术迈向成熟的关键阶段。
哈萨比斯指出,DeepMind旗下最新模型Gemini已在多模态理解领域取得突破性进展。目前该模型不仅能对内容进行表层描述,更能实现深层语义解析。例如,在分析电影《搏击俱乐部》时,模型可将角色摘下戒指的动作解释为“对日常生活的哲学性舍弃”,这种深层理解能力使得生成信息图表等复杂内容成为可能,这在以往技术条件下难以实现。
在AI代理发展方面,哈萨比斯预测,在接下来的一年内,AI将逐步具备“接近自主”处理复杂任务的能力,这与他在2024年5月提出的发展路线基本吻合。DeepMind正在开发的跨设备通用助手,旨在帮助用户更高效地管理日常事务。为实现这一愿景,团队正积极研发名为“Genie 3”的“世界模型”,该模型能够生成可供探索的互动视频空间,为用户提供沉浸式虚拟体验。
核心展望要点:
- 多模态AI将实现从“识别”到“理解”的跨越,能够解析并生成更高阶的复杂内容
- AI代理将在一年内获得更强的自主任务处理能力,向真正的智能助手迈进
- 沉浸式互动视频空间技术将成为人机交互的新前沿,创造可探索的虚拟世界
© 版权声明
文章版权归作者所有,未经允许请勿转载。