Follow Your Pose Follow Your Pose 是一个基于人工智能的姿态引导图像生成开源项目。它通过先进的扩散模型技术,允许用户根据输入的参考姿态和文本描述,生成符合特定姿势要求的人物图像。该项目由研究团队开发,旨在为图像生成领域提供更精准、可控的姿态复现能力。 45.3K0 AI开发平台AI开源项目# KEYWORDS SHOULD BE PLACED HERE
PhotoMaker V2 核心功能包括文本到图像生成和身份特征保持。用户可以通过输入文本提示词并结合一张或多张人物参考图,快速生成该人物在不同场景、着装和艺术风格下的图像。此外,该工具支持风格定制与属性编辑,允许用户轻松调整人物的发型、妆容、服饰乃至整体画风。其生成过程高效快速,能够在短时间内产出大量高质量结果。 15.8K0 AI开发平台AI开源项目# PhotoMaker V2
OLMo from Ai2 OLMo是由艾伦人工智能研究所(Ai2)开发的开源语言模型。Ai2由保罗·艾伦创立,阿里·法哈迪领导,致力于开展高影响力的人工智能研究与工程。OLMo项目旨在通过提供完全开放的语言模型框架,包括模型权重、训练代码、数据集和评估工具,推动人工智能领域的透明度和可重复性研究。 15.8K0 AI开发平台AI开源项目# OLMo from Ai2
ReplaceAnything 核心功能是图像中任何对象的替换,具体包括:主体替换(如更换人物、动物或物品)、背景替换(一键更改图像场景)以及局部元素修改。该工具依托于强大的深度学习模型,能够实现高精度分割与自然融合,确保替换后的区域在光影、纹理和透视关系上与原始图像无缝衔接,达到专业级的视觉效果。 14.2K0 AI开发平台AI开源项目# ReplaceAnything
IP-Adapter IP-Adapter是一个专注于图像生成与编辑领域的AI模型适配器。其核心功能是通过引入图像提示,实现对预训练文生图扩散模型(如Stable Diffusion)的精准控制。该技术允许用户将参考图像的风格、主体或视觉特征迁移到新生成的图像中,有效弥补了纯文本提示在细节控制上的不足。 12.7K0 AI开发平台AI开源项目# IP-Adapter
Void Void 是一款开源的代码编辑器,定位为 Cursor 编辑器的替代品。该产品强调完全的数据隐私保护,确保用户的代码和数据不会离开本地环境。作为一个功能完备的开发工具,Void 致力于为开发者提供一个既强大又安全的编程环境。 12.7K0 AI开发平台AI开源项目# Void
Screenshot to Code Screenshot to Code 是一个基于人工智能技术的在线工具,其主要功能是将用户上传的网站截图自动转换为前端代码。该工具旨在简化网页开发流程,帮助开发者、设计师和产品经理快速实现从视觉稿到代码的转换,显著提升工作效率。 11.1K0 AI开发平台AI开源项目# Screenshot to Code
Draw an Audio Draw an Audio 是一款基于 Jekyll 静态网站生成器构建的学术主题。该主题设计简洁、专业,旨在为学者、研究人员及学生提供一个优雅的个人学术成果展示平台。其设计灵感源于 *folio 项目,确保了代码的规范性与可扩展性。 9.5K0 AI开发平台AI开源项目# Draw an Audio
Real-ESRGAN Real-ESRGAN是一个开源的图像超分辨率与修复模型,托管在Replicate平台上。该平台致力于让开发者能够通过简单的云API,便捷地运行各类开源机器学习模型。Real-ESRGAN模型本身旨在从低质量图像中恢复出高质量细节,特别擅长处理真实世界中的复杂退化问题。 6.3K0 AI开发平台AI开源项目
Outfit Anyone 核心功能包括虚拟试衣、多风格服装适配以及高真实度渲染。 平台支持用户上传自定义人物图像,并为其“穿上”各类虚拟服装,实现无缝贴合。同时,系统提供丰富的服装库,涵盖日常、职业、运动等多种风格。AI技术确保服装能根据用户体型自动调整,保持自然褶皱和光影效果,生成高质量的试穿图片。 6.3K0 AI开发平台AI开源项目# Outfit Anyone
MetaGPT MetaGPT是由深度求索(Deepwisdom)公司开发的一款多智能体AI协作框架,旨在将软件开发生命周期自动化。其核心创新在于将单一需求指令作为输入,通过模拟一个规范化、标准化的公司团队工作流程,自动输出包括用户故事、竞品分析、需求文档、数据结构设计、API接口乃至项目文件在内的全套软件开发物料。 6.3K0 AI开发平台AI开源项目# agents# AI Agent# deepwisdom
ActAnywhere ActAnywhere是一个专注于视频背景生成的先进人工智能平台。其核心创新在于主体感知技术,能够根据视频前景中的主体人物,智能地生成与之合理互动、物理关系正确的动态背景。该技术由学术研究驱动,旨在解决视频制作中背景替换的复杂挑战,实现高度逼真和情境协调的视频合成效果。 4.8K0 AI开发平台AI开源项目# ActAnywhere
Animate Anyone 核心功能包括姿态驱动的图像动画生成,用户可通过指定姿势序列精准控制角色动作。该工具具备高保真细节保持能力,能有效维持角色外观的一致性。其时序连贯性生成技术确保了动作过渡自然流畅,同时支持多样化角色适配,适用于卡通、写实等多种风格。 4.8K0 AI开发平台AI开源项目# Animate Anyone
Vary-toy Vary-toy是一个专注于提升大型视觉语言模型能力的开源项目。其核心目标是通过扩展模型的视觉词汇,解决现有模型在文档理解、视觉定位等复杂任务中遇到的瓶颈。该项目旨在构建一个更强大、更通用的视觉语言基础模型。 4.8K0 AI开发平台AI开源项目# Vary-toy
Lepton Search Lepton Search是由Lepton AI推出的一个开源项目,旨在帮助开发者和企业快速构建自己的对话式搜索引擎。其核心价值在于极简的代码实现,宣称在少于500行代码内即可完成一个功能完整的搜索引擎搭建。该平台充分利用了现代人工智能技术,特别是大语言模型在自然语言理解和信息检索方面的能力。 3.2K0 AI开发平台AI开源项目# Lepton Search
书生·物华2.0(3DTopia 2.0) 核心功能是文本到视频和图像到视频的生成。平台支持用户输入简短的文本提示词,即可自动生成一段符合描述的视频。同时,它也允许用户上传参考图像,并基于此生成风格一致或内容延续的视频片段。其多阶段处理技术,可能包括潜在扩散模型与去噪过程的结合,有效提升了视频的帧率、分辨率和整体动态效果,显著减少了画面闪烁和扭曲。 1.6K0 AI开发平台AI开源项目# 书生·物华2.0(3DTopia 2.0)
Demofusion Demofusion是一个专注于AI图像生成与演示的在线工具平台,由开发者Ruoyi创建并维护。该网站作为其个人主页的一部分,旨在为用户提供便捷、高效的AI图像生成体验。其核心价值在于通过先进的算法模型,帮助用户快速将文本描述转化为高质量的视觉内容。 1.6K0 AI开发平台AI开源项目# Demofusion
DiffusionGPT DiffusionGPT 是一个基于大语言模型驱动的文本到图像生成系统。该系统旨在通过整合多种顶尖的开源图像生成模型,为用户提供一个统一且智能的生成入口。其核心思想是利用大语言模型的理解和分发能力,将用户的文本描述自动路由到最合适的图像生成模型,从而获得更高质量、更符合预期的图片。 1.6K0 AI开发平台AI开源项目# DiffusionGPT
ddcolor ddcolor是一个运行开源机器学习模型的云API平台。用户无需深厚的技术背景或昂贵的本地硬件,即可通过简单的API调用访问和运行各类先进的AI模型。本页面展示的“ddcolor”模型,是一个专门用于图像黑白照片上色的开源项目,由开发者piddnad托管在该平台上。 200 AI开发平台AI开源项目# ddcolor# Replicate