AI开源项目

共 21 篇网址

Follow Your Pose

Follow Your Pose 是一个基于人工智能的姿态引导图像生成开源项目。它通过先进的扩散模型技术，允许用户根据输入的参考姿态和文本描述，生成符合特定姿势要求的人物图像。该项目由研究团队开发，旨在为图像生成领域提供更精准、可控的姿态复现能力。

45.3K0

AI开发平台 AI开源项目 # KEYWORDS SHOULD BE PLACED HERE

PhotoMaker V2

核心功能包括文本到图像生成和身份特征保持。用户可以通过输入文本提示词并结合一张或多张人物参考图，快速生成该人物在不同场景、着装和艺术风格下的图像。此外，该工具支持风格定制与属性编辑，允许用户轻松调整人物的发型、妆容、服饰乃至整体画风。其生成过程高效快速，能够在短时间内产出大量高质量结果。

15.8K0

AI开发平台 AI开源项目 # PhotoMaker V2

OLMo from Ai2

OLMo是由艾伦人工智能研究所（Ai2）开发的开源语言模型。Ai2由保罗·艾伦创立，阿里·法哈迪领导，致力于开展高影响力的人工智能研究与工程。OLMo项目旨在通过提供完全开放的语言模型框架，包括模型权重、训练代码、数据集和评估工具，推动人工智能领域的透明度和可重复性研究。

15.8K0

AI开发平台 AI开源项目 # OLMo from Ai2

MiniMax

MiniMax 模型体系涵盖文本、语音、视频、图像与音乐五大方向。旗舰模型性能领先，助力开发者高效构建智能应用。

14.3K0

AI开发平台 AI开源项目 # minimax

ReplaceAnything

核心功能是图像中任何对象的替换，具体包括：主体替换（如更换人物、动物或物品）、背景替换（一键更改图像场景）以及局部元素修改。该工具依托于强大的深度学习模型，能够实现高精度分割与自然融合，确保替换后的区域在光影、纹理和透视关系上与原始图像无缝衔接，达到专业级的视觉效果。

14.2K0

AI开发平台 AI开源项目 # ReplaceAnything

IP-Adapter

IP-Adapter是一个专注于图像生成与编辑领域的AI模型适配器。其核心功能是通过引入图像提示，实现对预训练文生图扩散模型（如Stable Diffusion）的精准控制。该技术允许用户将参考图像的风格、主体或视觉特征迁移到新生成的图像中，有效弥补了纯文本提示在细节控制上的不足。

12.7K0

AI开发平台 AI开源项目 # IP-Adapter

Void

Void 是一款开源的代码编辑器，定位为 Cursor 编辑器的替代品。该产品强调完全的数据隐私保护，确保用户的代码和数据不会离开本地环境。作为一个功能完备的开发工具，Void 致力于为开发者提供一个既强大又安全的编程环境。

12.7K0

AI开发平台 AI开源项目 # Void

Screenshot to Code

Screenshot to Code 是一个基于人工智能技术的在线工具，其主要功能是将用户上传的网站截图自动转换为前端代码。该工具旨在简化网页开发流程，帮助开发者、设计师和产品经理快速实现从视觉稿到代码的转换，显著提升工作效率。

11.1K0

AI开发平台 AI开源项目 # Screenshot to Code

Draw an Audio

Draw an Audio 是一款基于 Jekyll 静态网站生成器构建的学术主题。该主题设计简洁、专业，旨在为学者、研究人员及学生提供一个优雅的个人学术成果展示平台。其设计灵感源于 *folio 项目，确保了代码的规范性与可扩展性。

9.5K0

AI开发平台 AI开源项目 # Draw an Audio

千问

千问是阿里通义千问大模型打造的AI对话助手，通义千问支持问答、写作、代码、翻译、录音、PPT创作、文档处理、音视频速读。

9.5K0

AI开发平台 AI开源项目 # Qwen # 千问 # 千问官网

Real-ESRGAN

Real-ESRGAN是一个开源的图像超分辨率与修复模型，托管在Replicate平台上。该平台致力于让开发者能够通过简单的云API，便捷地运行各类开源机器学习模型。Real-ESRGAN模型本身旨在从低质量图像中恢复出高质量细节，特别擅长处理真实世界中的复杂退化问题。

6.3K0

AI开发平台 AI开源项目

Outfit Anyone

核心功能包括虚拟试衣、多风格服装适配以及高真实度渲染。平台支持用户上传自定义人物图像，并为其“穿上”各类虚拟服装，实现无缝贴合。同时，系统提供丰富的服装库，涵盖日常、职业、运动等多种风格。AI技术确保服装能根据用户体型自动调整，保持自然褶皱和光影效果，生成高质量的试穿图片。

6.3K0

AI开发平台 AI开源项目 # Outfit Anyone

MetaGPT

MetaGPT是由深度求索（Deepwisdom）公司开发的一款多智能体AI协作框架，旨在将软件开发生命周期自动化。其核心创新在于将单一需求指令作为输入，通过模拟一个规范化、标准化的公司团队工作流程，自动输出包括用户故事、竞品分析、需求文档、数据结构设计、API接口乃至项目文件在内的全套软件开发物料。

6.3K0

AI开发平台 AI开源项目 # agents # AI Agent # deepwisdom

ActAnywhere

ActAnywhere是一个专注于视频背景生成的先进人工智能平台。其核心创新在于主体感知技术，能够根据视频前景中的主体人物，智能地生成与之合理互动、物理关系正确的动态背景。该技术由学术研究驱动，旨在解决视频制作中背景替换的复杂挑战，实现高度逼真和情境协调的视频合成效果。

4.8K0

AI开发平台 AI开源项目 # ActAnywhere

Animate Anyone

核心功能包括姿态驱动的图像动画生成，用户可通过指定姿势序列精准控制角色动作。该工具具备高保真细节保持能力，能有效维持角色外观的一致性。其时序连贯性生成技术确保了动作过渡自然流畅，同时支持多样化角色适配，适用于卡通、写实等多种风格。

4.8K0

AI开发平台 AI开源项目 # Animate Anyone

Vary-toy

Vary-toy是一个专注于提升大型视觉语言模型能力的开源项目。其核心目标是通过扩展模型的视觉词汇，解决现有模型在文档理解、视觉定位等复杂任务中遇到的瓶颈。该项目旨在构建一个更强大、更通用的视觉语言基础模型。

4.8K0

AI开发平台 AI开源项目 # Vary-toy

Lepton Search

Lepton Search是由Lepton AI推出的一个开源项目，旨在帮助开发者和企业快速构建自己的对话式搜索引擎。其核心价值在于极简的代码实现，宣称在少于500行代码内即可完成一个功能完整的搜索引擎搭建。该平台充分利用了现代人工智能技术，特别是大语言模型在自然语言理解和信息检索方面的能力。

3.2K0

AI开发平台 AI开源项目 # Lepton Search

书生·物华2.0（3DTopia 2.0）

核心功能是文本到视频和图像到视频的生成。平台支持用户输入简短的文本提示词，即可自动生成一段符合描述的视频。同时，它也允许用户上传参考图像，并基于此生成风格一致或内容延续的视频片段。其多阶段处理技术，可能包括潜在扩散模型与去噪过程的结合，有效提升了视频的帧率、分辨率和整体动态效果，显著减少了画面闪烁和扭曲。

1.6K0

AI开发平台 AI开源项目 # 书生·物华2.0（3DTopia 2.0）

Demofusion

Demofusion是一个专注于AI图像生成与演示的在线工具平台，由开发者Ruoyi创建并维护。该网站作为其个人主页的一部分，旨在为用户提供便捷、高效的AI图像生成体验。其核心价值在于通过先进的算法模型，帮助用户快速将文本描述转化为高质量的视觉内容。

1.6K0

AI开发平台 AI开源项目 # Demofusion

DiffusionGPT

DiffusionGPT 是一个基于大语言模型驱动的文本到图像生成系统。该系统旨在通过整合多种顶尖的开源图像生成模型，为用户提供一个统一且智能的生成入口。其核心思想是利用大语言模型的理解和分发能力，将用户的文本描述自动路由到最合适的图像生成模型，从而获得更高质量、更符合预期的图片。

1.6K0

AI开发平台 AI开源项目 # DiffusionGPT

ddcolor

ddcolor是一个运行开源机器学习模型的云API平台。用户无需深厚的技术背景或昂贵的本地硬件，即可通过简单的API调用访问和运行各类先进的AI模型。本页面展示的“ddcolor”模型，是一个专门用于图像黑白照片上色的开源项目，由开发者piddnad托管在该平台上。

200

AI开发平台 AI开源项目 # ddcolor # Replicate