墨白

帅气的我简直无法用语言描述!
DiffusionGPT

DiffusionGPT

DiffusionGPT 是一个基于大语言模型驱动的文本到图像生成系统。该系统旨在通过整合多种顶尖的开源图像生成模型,为用户提供一个统一且智能的生成入口。其核心思想是利用大语言模型的理解和分发能力,将用户的文本描述自动路由到最合适的图像生成模型,从而获得更高质量、更符合预期的图片。
1.6K0
OLMo from Ai2

OLMo from Ai2

OLMo是由艾伦人工智能研究所(Ai2)开发的开源语言模型。Ai2由保罗·艾伦创立,阿里·法哈迪领导,致力于开展高影响力的人工智能研究与工程。OLMo项目旨在通过提供完全开放的语言模型框架,包括模型权重、训练代码、数据集和评估工具,推动人工智能领域的透明度和可重复性研究。
15.8K0
IP-Adapter

IP-Adapter

IP-Adapter是一个专注于图像生成与编辑领域的AI模型适配器。其核心功能是通过引入图像提示,实现对预训练文生图扩散模型(如Stable Diffusion)的精准控制。该技术允许用户将参考图像的风格、主体或视觉特征迁移到新生成的图像中,有效弥补了纯文本提示在细节控制上的不足。
12.7K0
Follow Your Pose

Follow Your Pose

Follow Your Pose 是一个基于人工智能的姿态引导图像生成开源项目。它通过先进的扩散模型技术,允许用户根据输入的参考姿态和文本描述,生成符合特定姿势要求的人物图像。该项目由研究团队开发,旨在为图像生成领域提供更精准、可控的姿态复现能力。
45.3K0
Lepton Search

Lepton Search

Lepton Search是由Lepton AI推出的一个开源项目,旨在帮助开发者和企业快速构建自己的对话式搜索引擎。其核心价值在于极简的代码实现,宣称在少于500行代码内即可完成一个功能完整的搜索引擎搭建。该平台充分利用了现代人工智能技术,特别是大语言模型在自然语言理解和信息检索方面的能力。
3.2K0
MiniMax

MiniMax

MiniMax 模型体系涵盖文本、语音、视频、图像与音乐五大方向。旗舰模型性能领先,助力开发者高效构建智能应用。
14.3K0
Vary-toy

Vary-toy

Vary-toy是一个专注于提升大型视觉语言模型能力的开源项目。其核心目标是通过扩展模型的视觉词汇,解决现有模型在文档理解、视觉定位等复杂任务中遇到的瓶颈。该项目旨在构建一个更强大、更通用的视觉语言基础模型。
4.8K0
Void

Void

Void 是一款开源的代码编辑器,定位为 Cursor 编辑器的替代品。该产品强调完全的数据隐私保护,确保用户的代码和数据不会离开本地环境。作为一个功能完备的开发工具,Void 致力于为开发者提供一个既强大又安全的编程环境。
12.7K0
ActAnywhere

ActAnywhere

ActAnywhere是一个专注于视频背景生成的先进人工智能平台。其核心创新在于主体感知技术,能够根据视频前景中的主体人物,智能地生成与之合理互动、物理关系正确的动态背景。该技术由学术研究驱动,旨在解决视频制作中背景替换的复杂挑战,实现高度逼真和情境协调的视频合成效果。
4.8K0
Draw an Audio

Draw an Audio

Draw an Audio 是一款基于 Jekyll 静态网站生成器构建的学术主题。该主题设计简洁、专业,旨在为学者、研究人员及学生提供一个优雅的个人学术成果展示平台。其设计灵感源于 *folio 项目,确保了代码的规范性与可扩展性。
9.5K0
Demofusion

Demofusion

Demofusion是一个专注于AI图像生成与演示的在线工具平台,由开发者Ruoyi创建并维护。该网站作为其个人主页的一部分,旨在为用户提供便捷、高效的AI图像生成体验。其核心价值在于通过先进的算法模型,帮助用户快速将文本描述转化为高质量的视觉内容。
1.6K0
千问

千问

千问是阿里通义千问大模型打造的AI对话助手,通义千问支持问答、写作、代码、翻译、录音、PPT创作、文档处理、音视频速读。
9.5K0