近日,美团旗下LongCat团队正式发布并开源了其图像生成模型LongCat-Image。该模型参数量为6B,在性能与使用门槛之间取得了良好平衡,旨在应对当前市场对高效图像生成工具日益增长的需求。随着文生图、图生图等技术在多行业加速落地,LongCat-Image的推出为开发者和企业提供了一个介于开源灵活性与商业可靠性之间的新选择。
在技术表现方面,LongCat-Image在多项图像生成与编辑任务中展现出优秀效果。尤其在图像编辑任务上,该模型在多个公开评测基准中达到开源领域的领先水平,体现出良好的指令理解能力与视觉内容一致性。研发团队通过系统化的训练策略与数据优化,使模型能够在多样化指令输入下保持稳定的输出质量。
针对中文生成场景,LongCat-Image进行了专门优化。模型采用分阶段课程学习策略,显著提升了汉字字符的覆盖完整度与渲染质量,能够准确生成结构复杂的汉字,适用于海报设计、广告创意等对文字准确性要求较高的应用场景。

1765172693 6390078562978978104071479
在模型评估方面,团队引入主观质量评分机制,从真实感与视觉合理性等维度对生成效果进行综合判断,确保模型在实际应用中具备良好的可用性。这一设计使得LongCat-Image在与其他主流开源及闭源模型的对比中展现出竞争力。
LongCat团队强调,此次开源旨在推动建立开放、协作的AI开发生态,鼓励开发者通过Hugging Face与GitHub平台获取模型并参与社区共建。同步升级的LongCat APP新增图生图功能,用户可上传自定义素材并快速生成新图像,同时提供24款预制模板,帮助非专业用户轻松实现高质量视觉创作。
地址: https://longcat.ai/
© 版权声明
文章版权归作者所有,未经允许请勿转载。