在近日举行的第二届CCF中国数据大会上,蚂蚁数科正式宣布开源其数据智能体技术“Agentar SQL”。该项技术旨在让用户能够通过日常语言进行复杂的商业数据查询与分析,为企业数字化转型提供更便捷的支持。
此次开源的首个核心模块是实时“文本转SQL”框架,致力于帮助开发者快速构建数据查询应用,显著提升自然语言与数据库的交互效率。蚂蚁数科表示,后续还将陆续开放包括数据库理解、行业知识挖掘、多轮实时交互在内的多项技术,以全面增强数据智能处理能力。
在某头部城市商业银行的试点应用中,Agentar SQL多个工具实现了超过92%的查询准确率,较传统方案提升超过三倍。值得关注的是,在自然语言转SQL领域的国际权威评测基准BIRD-SQL中,蚂蚁数科智能体技术名列前茅,超越了谷歌等国际领先企业,展现了较强的技术竞争力。

BIRD-SQL评测以其高复杂性著称,覆盖金融、电力、医疗等37个真实行业场景,数据规模庞大、任务难度高,被视为全球最具挑战性的NL2SQL测试之一。据行业机构预测,到2025年全球商业智能市场规模有望达到474.8亿美元,中国市场也将保持较快增长,预计2028年规模可达17.9亿美元,年复合增长率约12.7%。
蚂蚁数科技术负责人章鹏在大会上指出,NL2SQL在实际落地中需应对自然语言的模糊性、行业知识融合、复杂数据库结构理解及SQL准确生成等多重挑战,仅依靠基础模型难以满足产业需求。
章鹏强调,要真正实现可商用的NL2SQL与数据智能体技术,必须构建涵盖数据库深度理解、人机高效交互、系统自我演进等能力的完整体系。蚂蚁数科计划未来逐步开源更全面的技术模块,进一步推动智能数据分析的普及应用。
目前,Agentar-Scale-SQL的相关开源内容已在arXiv、GitHub等平台发布,受到开发者社区的广泛关注。







