Advertisement

Stable Diffusion WebUI Forge

曾是最流行的 SD WebUI 增强版,比原版内存效率提升 60%

图像视频⭐ 8.5kGPL-3.0

Chatterbox (Resemble AI)

盲测击败 ElevenLabs——MIT 开源,情感表达最强的 TTS 模型

语音合成⭐ 12.5kMIT

Wav2Lip

经典唇形同步方案,任意视频+任意音频=精准口型,无数项目底层引擎

数字人⭐ 11.0kMIT

SillyTavern

沉浸式 AI 角色扮演前端,角色卡系统+世界书+群聊+TTS 配音

聊天对话⭐ 12.0kAGPL-3.0

CosyVoice (阿里)

中文效果最佳——方言+情感控制+流式推理,延迟仅 150ms

语音合成⭐ 13.7kApache-2.0

AnimaHub

AI 漫剧生成系统——小说导入→剧本拆解→角色创建→视频合成流水线

漫画生成⭐ 7.8kApache-2.0

DiffRhythm

10 秒生成 4 分 45 秒完整歌曲——LRC 歌词精确对齐,速度之王

音乐音频⭐ 2.3kApache-2.0

Tortoise TTS

高质量神经 TTS,音质极佳但速度慢——适合离线高质量配音

语音合成⭐ 14.0kApache-2.0

browser-use

让 AI Agent 操作真实浏览器,填表/爬取/导航全自动

智能体⭐ 97.0kMIT

LibreChat

企业级多模型聊天平台——多用户+RBAC+审计日志,适合团队部署

聊天对话⭐ 21.0kMIT

MaxKB

中文用户最友好——一行 Docker 部署,零代码嵌入业务系统

知识库⭐ 20.3kGPL-3.0

Notex

开源版 NotebookLM——PDF/DOCX/PPTX 多格式+智能问答+PPT 生成+思维导图

办公效率⭐ 4.8kMIT

ChatGPT-on-WeChat (CowAgent)

曾是中文 AI Agent 社区标杆,微信/企业微信/钉钉/飞书多平台接入

智能体⭐ 45.0kMIT

GFPGAN

腾讯出品的人脸修复算法,老照片修复和 AI 绘画面部修正的经典工具

图像视频⭐ 37.0kApache-2.0

AnimateDiff

让 SD 动起来——文本到视频/图像到视频,Motion LoRA 控制运动幅度

图像视频⭐ 13.0kApache-2.0

Fish Speech

多语言高质量 TTS——VITS2 架构,8+ 语言,接近真人音质

语音合成⭐ 10.0kBSD-3-Clause

DeepPrintFilm

关键帧驱动漫剧生成——精确控制关键帧+AI 中间帧插值,帧率流畅

漫画生成⭐ 7.2kMIT

InternLM2.5 (书生·浦语)

上海AI实验室出品——推理/数学强,超长上下文,学术研究首选

开源模型⭐ 18.0kApache-2.0

Rowboat

会议场景杀手锏——连接 Gmail/日历构建知识图谱,自动准备会议简报

办公效率⭐ 4.2kMIT

KrillinAI

视频翻译配音一条龙——AI 翻译字幕+配音对齐+一键发布,出海神器

视频工具⭐ 5.0kMIT

LocalAI

OpenAI API 平替——纯 CPU 运行,支持多模型路由 + RAG + 函数调用

本地部署⭐ 28.0kMIT

ChatALL

同时向 10+ AI 提问并排对比——一键群发,找到最佳回答

聊天对话⭐ 16.4kApache-2.0

EchoMimicV2

蚂蚁/达摩院出品——音频驱动半身动画,头部+手势+上半身同步,虚拟主播首选

数字人⭐ 4.6kApache-2.0

Open Cowork

桌面虚拟同事——像人一样操作电脑:看屏幕→点击→填表→导出→发飞书

办公效率⭐ 1.5kMIT

Jan

美观跨平台的桌面端 AI 平台——MCP 协议集成 + 插件生态

本地部署⭐ 22.0kAGPL-3.0

Cline

VS Code 全自主 Agent 扩展——读文件+写代码+跑命令+浏览网页,端到端执行

编程开发⭐ 25.0kApache-2.0

LangChain + LangGraph

127K★ LLM 应用事实标准——LangGraph 1.0 正式版,有状态图式 Agent 编排引擎

智能体⭐ 127.0kMIT

Sana (NVIDIA)

英伟达出品——4K 高分辨率图像生成 + 视频生成,极致画质

图像视频⭐ 7.5kApache-2.0

Jan (Chat Mode)

桌面 AI 平台对话模式——本地模型+Cortex 引擎,离线聊天零延迟

聊天对话⭐ 22.0kAGPL-3.0

GraphRAG (Microsoft)

微软出品——知识图谱增强 RAG,实体关系推理 + 全局理解

知识库⭐ 20.0kMIT

F5-TTS

2 秒极速克隆——推理最快(RTF 0.15),MIT 协议可商用

语音合成⭐ 12.0kMIT

AIComicBuilder

AI 漫画生成器——剧本→角色设计→故事板→视频合成一体化

漫画生成⭐ 6.5kMIT

Yi-1.5 (零一万物)

中文长文本写作最佳——6B-34B,34B 版性价比极高

开源模型⭐ 12.0kYi License

LatentSync (字节跳动)

字节跳动——潜空间扩散模型唇形同步,高精度口型匹配

数字人⭐ 9.0kApache-2.0

AionUi

AI 工具统一桌面界面——封装 Gemini/Claude/Qwen 等 CLI,文件管理+Excel 处理

办公效率⭐ 3.5kMIT

Langflow

LangChain 的拖拽式 UI,低代码构建 RAG 和多步 Agent 流程

智能体⭐ 32.0kMIT

Text Generation WebUI (Oobabooga)

开发者全功能 WebUI——LoRA 微调 + 插件生态 + HuggingFace 兼容

本地部署⭐ 20.0kAGPL-3.0

Roo Code

AI 开发团队模拟器——多 Agent 并行协作,一人指挥一支 AI 开发团队

编程开发⭐ 21.0kApache-2.0

FastGPT

中文优化知识库平台——可视化流程编排 + 出站对话 + 企业微信集成

知识库⭐ 15.0kApache-2.0

HeyGem

30 秒创建数字分身——8 语言+离线可用,小白零门槛

数字人⭐ 8.5kApache-2.0

SongGen

单阶段文本到歌曲——ICML 2025 论文,流程极简

音乐音频⭐ 310MIT

Kimi K2.5

Office 办公一体——PPT/Word/Excel/PDF 无损互转,100 Agent 并行 1500 步骤

办公效率⭐ 3.8kApache-2.0

AutoClip

智能高光剪辑——AI 识别精彩片段+自动评分+批量处理,直播切片利器

视频工具⭐ 3.3kMIT

AnythingLLM

个人知识库工作台——拖拽文档即时问答,5 分钟搭建私有 RAG 系统

本地部署⭐ 17.0kMIT

SWE-agent

普林斯顿出品——让 Claude/GPT 自主使用终端修 GitHub Issue,SWE-bench 领先

编程开发⭐ 17.0kMIT

CrewAI

48K★ 角色扮演式多 Agent 编排——定义 Role/Goal/Backstory,Agent 自主分工协作

智能体⭐ 48.0kMIT

CogVideo (智谱)

智谱 AI 出品——中文优化视频生成模型,5 秒视频快速生成

图像视频⭐ 8.5kApache-2.0

big-AGI

开发者向 AI 聊天工作台——多会话并行 + 工具调用 + 代码高亮 + 函数执行

聊天对话⭐ 9.0kMIT

OpenSearch + RAG

AWS 开源搜索引擎 + RAG 插件——海量文档检索 + 向量搜索 + 全文搜索

知识库⭐ 10.3kApache-2.0

Diffutoon

真人视频转动漫风格——SD 驱动的视频风格迁移,照片级→动漫级

漫画生成⭐ 8.5kApache-2.0

Baichuan2 (百川智能)

中文语料扎实——7B/13B,中文指令遵循稳定,可商用

开源模型⭐ 11.0kBaichuan License

LiveTalking

实时数字人全栈方案——MuseTalk/Wav2Lip/ER-Nerf + WebRTC 直播推流

数字人⭐ 6.9kMIT

FluxMusic

Rectified Flow 音乐生成——训练稳定+生成快速

音乐音频⭐ 1.7kMIT

OfficeClaw (华为云)

企业级 AI 办公智能体——多 Agent 思辨专家团,全要素可编辑 PPT

办公效率⭐ 3.2kApache-2.0

videodl

30+ 平台视频下载器——抖音/B站/YouTube 等,优先高清无水印

视频工具⭐ 4.5kMIT

KoboldCPP

创意写作专用推理引擎——单文件部署 + 多模态 + MCP 桥接

本地部署⭐ 15.0kAGPL-3.0

Plandex

大型项目专用——200 万 token 上下文 + 差异审查沙盒 + 多模型组合

编程开发⭐ 14.0kApache-2.0

AutoGen / AG2 (Microsoft)

48K★ 微软多 Agent 对话框架——GroupChat 群聊模式 + 代码生成执行 + MAF 替代版

智能体⭐ 48.0kCC-BY-4.0

Bernini (字节跳动)

字节跳动开源——统一视频生成与编辑框架,生成+修复+增强一站式

图像视频⭐ 6.2kApache-2.0

Chroma

AI 原生向量数据库——专为 RAG 设计,5 行代码集成,开发者体验最佳

知识库⭐ 18.0kApache-2.0

MiniCPM-3 (OpenBMB)

小参数大能力——4B 参数媲美 7B,消费级 GPU 轻松运行

开源模型⭐ 14.0kApache-2.0

Sonic (腾讯&浙大)

一张照片高精度口型——支持长视频,流程简洁

数字人⭐ 7.5kApache-2.0

SongBloom

先粗后精两阶段策略——交替自回归草图+扩散精炼,结构连贯

音乐音频⭐ 652MIT

igedits

OpusClip 开源替代——长视频→短视频自动剪辑,字幕+人脸居中+热度评分

视频工具⭐ 3.8kMIT

privateGPT

隐私优先的文档问答系统——100% 离线 RAG + Milvus/Qdrant 向量库

本地部署⭐ 12.0kApache-2.0

Kilo Code

500+ 模型 + 5 大专业模式 + 并行子 Agent 协作——AutoFree 模式零成本

编程开发⭐ 13.0kApache-2.0

Goose

48K★ Rust 编写的可扩展 AI Agent——安装/执行/编辑/测试一体化,支持任意 LLM

智能体⭐ 48.0kApache-2.0

Hotshot-XL

SDXL 原生视频模型——基于 SDXL 微调,高质量 AI 动图 GIF 生成

图像视频⭐ 5.8kApache-2.0

Agnaistic

专注角色扮演的轻量前端——Markdown 角色卡 + 文本冒险 + 快速部署

聊天对话⭐ 4.5kAGPL-3.0

Piper

超轻量嵌入式 TTS——树莓派可运行,15 种语言,离线极速

语音合成⭐ 8.0kMIT

ComicTranslate

实时 AR 漫画翻译——手机拍照即可翻译,支持 AR 叠加显示

漫画生成⭐ 6.0kMIT

Phi-3.5 (Microsoft)

微软「小钢炮」——MIT 协议,3.8B/7B/14B,小参数大智慧

开源模型⭐ 12.0kMIT

Ultralight Digital Human

移动端数字人——手机上训练+运行,轻量化部署典范

数字人⭐ 5.8kMIT

TangoFlux

文本到音频的 Flow Matching——高保真音效+环境音+短音乐

音乐音频⭐ 2.1kMIT

Lingji Cut (灵剪)

本地优先的 AI 视频创作工作台——文案→配音→拍摄→剪辑全流程

视频工具⭐ 2.8kMIT