跳到内容

早上好,祝你今天高效顺利。

GitHub项目

共 65 篇文章

GitHub项目

LobeChat:一站式多模态聊天与Agent编排平台

厌倦了在多个AI服务之间来回切换?LobeChat是一个开源、可自托管的智能聊天平台,整合了GPT-4、Claude、Gemini等主流大模型,并支持文生图、语音对话、插件系统与自定义Agent。无论是开发者想快速搭建私有助手,还是爱好者追求更灵活的AI交互体验,它都能大幅降低门槛。核心看点- 多模型统一接入:内置数十种模型提供商(OpenAI、Anthropic、Google、国产模型等),无需手动配置API,一个界面即可切换对话引擎。 - 插件与工具链:支持联网搜索、代码执行、图片生成等插件,Agent可自主调用工具完成复杂任务,RAG能力通过知识库插件扩展。 - 优雅的对话体验:支持Markdown渲染、代码高亮、语音输入/输出,以及多模态内容(图片、文件)的拖拽交互,界面接近商业产品。▲ github.com(阿里云通义万相生成配图,非网页截图)适合谁- 希望统一管理多个AI API的开发者,或需要为团队搭建内部AI工作台的技术负责人。 - 对AI Agent和工具调用感兴趣的研究者,可基于其插件系统快速验证想法。 - 依赖:Node.js 18+,可一键Docker部署;使用自带模型需API Key,部分插件(如联网搜索)需额外配置。快去仓库的Releases和插件市场逛逛,看看如何定制你自己的AI工作流:LobeChat GitHub仓库

GitHub项目

Mastra:面向 AI Agent 的 TypeScript 编排框架,可观测与工具调用一体化

如果你正在用 TypeScript 构建多步骤 Agent 或 RAG 流水线,却苦于调试链路不透明、工具调用难管理,不妨看看 Mastra。这个开源框架把 Agent 编排、记忆管理、工具调用和可观测性打包进一套声明式 API,尤其适合需要精细控制 LLM 行为的 Node.js 后端开发者。核心看点- 声明式 Agent 编排:通过 YAML 或 TypeScript 定义任务图(DAG),支持并行执行、条件分支和循环重试,配合内置的 LLM 调用追踪,每一步的 Token 消耗和延迟都一目了然。 - 工具调用与记忆一体化:自带函数调用脚手架,能自动将外部 API 或数据库操作注册为 Agent 可调用的工具,并支持基于向量存储的短期/长期记忆,减少重复上下文注入。 - 与主流推理后端兼容:开箱支持 OpenAI、Anthropic、Ollama 等,也允许通过自定义 Provider 接入本地模型,配合 可观测性中间件 输出结构化日志,方便集成到 Grafana 或 Datadog。▲ github.com(阿里云通义万相生成配图,非网页截图)适合谁面向 Node.js 全栈或后端开发者,特别是正在搭建客服、代码审查、数据爬取等需要多步推理的 Agent 服务。依赖简单:仅需 Node 18+ 和 npm/pnpm,无需独立服务;若使用内置向量记忆则需一个 PostgreSQL 或 SQLite 实例。所有 API Key 由用户自行管理,框架不采集数据。Mastra 的 README 提供了从零搭建“天气查询 Agent”的快速入门,文档站还有更复杂的 RAG 流水线示例。如果你对 Agent 的可观测性有执念,它的 Tracing 模块值得单独翻翻——或许正是你下一个生产级应用缺失的那块拼图。戳仓库主页 Mastra on GitHub 开始探索。

GitHub项目

ChatGPT-on-Cloudflare:用 Workers 白嫖自建 AI 网关

如果你既想低成本调用 OpenAI / Anthropic / HuggingFace 等 API,又不想被厂商锁定或担心密钥泄露,这个仓库帮你用 Cloudflare Workers 搭建一个轻量 AI 网关。适合独立开发者、极客以及希望在教学或演示中快速集成多种大模型接口的爱好者。核心看点在 Workers 上部署后,你只需一个统一 URL 就能路由到不同模型后端,自动处理 API 密钥、速率限制与错误重试。支持流式输出(SSE),前后端可共用同一套鉴权逻辑,还能利用 Cloudflare 的全球边缘网络降低延迟。代码基于 MIT 许可证,逻辑清晰,方便二次定制。▲ github.com 仓库页截图(仅供参考,以 GitHub 为准)上手提示无需 GPU,只需一个 Cloudflare 账号(免费套餐即可)和对应模型厂商的 API Key。部署流程依赖 Wrangler CLI,仓库 README 给出了详尽的 wrangler.toml 配置示例,十分钟内可跑通。适合已有 API Key 但想统一管理调用入口的团队或个人。别满足于只读 README——你可以 fork 后加入自己的模型路由逻辑,甚至用 KV 存储实现用量统计。更多玩法藏在 ChatGPT-on-Cloudflare 的 Issues 和 Discussions 里。

GitHub项目

ChatGPT-Next-Web:自部署的跨平台AI聊天面板,一键接入多模型

厌倦了官方ChatGPT的订阅限制或频繁的网络问题?这个开源项目让你用Vercel或Docker在几分钟内部署一个功能完整的AI聊天Web UI,支持OpenAI、Claude、Gemini、本地模型(Ollama)等多种后端,并内置会话管理、Markdown渲染、语音输入等实用功能。适合想要拥有私人AI助手、团队共享API额度或折腾自托管方案的开发者与重度用户。核心看点- 多模型一键切换:在同一个对话界面里自由切换GPT-4、Claude 3、Gemini Pro甚至本地跑起来的Llama 3,不用再开多个标签页。 - 零门槛部署:支持Vercel一键部署(免费额度足够个人使用)、Docker本地运行、以及手动构建,README提供清晰的步骤截图,即使前端新手也能在10分钟内上线。 - 实用细节拉满:内置会话文件夹管理、Prompt模板库、导出/导入对话记录(JSON/Markdown)、全局遮罩(Mask)功能可预设角色设定,还支持PWA离线访问。▲ github.com(阿里云通义万相生成配图,非网页截图)上手提示- 无需GPU:纯前端项目,后端API由你指定的模型服务商提供(需自行申请OpenAI等API Key,或搭配Ollama使用本地模型)。 - Node.js 18+ 即可本地开发,Docker部署则需Docker Engine 20+。项目采用MIT许可证,可自由修改和商用。如果想给团队搭建一个统一的AI对话入口,或者单纯想摆脱官方客户端的种种限制,直接去仓库看README里的Vercel部署按钮,点一下就能拥有自己的AI面板。传送门:ChatGPT-Next-Web

GitHub项目

aisuite:Andrew Ng 出品,一行代码切换 LLM 提供方,告别 API 绑定

开发 AI 应用时,常常要同时试 OpenAI、Anthropic、Google 等多家模型,每家 API 格式不同,代码里写满 if-else 实在糟心。aisuite 是一个极简 Python 库,让你用同一套接口调用主流 LLM 提供方,支持流式输出、函数调用等,适合快速原型验证或多模型对比。核心看点统一接口:只需实例化 aisuite.Client(),传入 provider/model 字符串即可调用 GPT-4、Claude、Gemini、Groq 等,内部自动路由。轻量无侵入:不需要改原有项目结构,安装后替换 client.chat.completions.create 等调用即可。可扩展:基于 Provider 插件机制,社区可以轻松支持新厂商,目前覆盖 10+ 主流服务,且持续增加。▲ github.com(阿里云通义万相 生成配图,非网页截图)上手提示如果你是 Python 开发者,pip install aisuite 后设置对应 API Key 就能跑通。不需要 GPU,纯 API 调用,适合在个人项目或团队原型中快速切换模型做对比测试。注意不同提供商的函数调用格式略有差异,文档内有详细对比表。去仓库 README 看看支持了哪些厂商,顺便 fork 一份以备不时之需:aisuite GitHub 主页。

GitHub项目

Qwen2.5:阿里通义千问新一代开源大模型,多尺寸与长上下文

如果你正在寻找一个既能跑在消费级显卡上、又能处理超长上下文的开源大模型,Qwen2.5 系列值得你立刻点开。阿里云通义千问团队最新发布,覆盖从 0.5B 到 72B 共 7 个尺寸,全部开源且支持 128K tokens 上下文,Apache-2.0 许可,无论是研究实验还是生产部署都能找到合适的版本。核心看点- 全尺寸覆盖与灵活部署:从 0.5B 的轻量级模型(适合手机或端侧推理)到 72B 的旗舰版本(需要多卡 GPU),中间还有 1.5B、3B、7B、14B、32B 等梯度,开发者可根据硬件和场景自由选择。 - 超长上下文与多语言能力:原生支持 128K tokens 上下文窗口,且在多语言基准(包括中文、英文、代码、数学)上表现优异,尤其适合需要处理长文档、对话历史或代码库的 RAG/Agent 应用。 - 开源生态友好:模型权重已在 Hugging Face 和 ModelScope 发布,兼容 vLLM、llama.cpp、Ollama 等主流推理框架,微调也可直接接入 LLaMA-Factory,上手门槛极低。▲ github.com(阿里云通义万相生成配图,非网页截图)上手提示- 依赖与硬件:最小 0.5B 模型可在 CPU 或 4GB 显存的 GPU 上运行;72B 推荐使用 4×A100(80GB)或更高配置。无需 API Key,全部离线部署。 - 典型场景:长文档问答、代码生成与修复、多轮对话 Agent、本地知识库 RAG 系统。建议优先尝试 7B/14B 版本,在效果与资源消耗间取得平衡。 - 快速开始:通过 transformers 或 vLLM 加载模型,参考仓库 README 中的示例代码即可在 5 分钟内跑通推理。更多细节(如微调脚本、量化配置、Benchmark 结果)都写在仓库的文档里,建议直接去 README 的“模型列表”与“快速…

GitHub项目

Dify:拖拽搭建 AI 应用,RAG 与 Agent 工作流一站式平台

想快速把大模型接入业务,又不想从零写前后端和编排逻辑?Dify 提供了一个可视化的 AI 应用开发平台,支持 RAG 知识库、Agent 工具链、工作流编排,甚至一键发布为 API 或 Web 应用。无论是做客服机器人、文档问答还是自动化报告生成,它都能让开发者把精力放在 prompt 和逻辑上,而非基础设施。核心看点- 可视化编排:通过拖拽节点构建 AI 工作流,支持条件分支、循环、代码块,可串联 LLM 调用、知识检索、API 请求等,无需手写复杂逻辑。 - 内置 RAG 引擎:上传 PDF/网页/数据库,自动切片、向量化并建立索引,支持混合检索与重排序,直接提升问答准确率。 - 多模型与 Agent 支持:兼容 OpenAI、Claude、本地 Ollama 等数十种模型,Agent 可调用自定义工具(如搜索、计算器),通过 ReAct 模式自主决策。▲ github.com(阿里云通义万相生成配图,非网页截图)适合谁后端开发者、AI 应用产品经理、以及想快速验证 AI 想法的个人。部署依赖 Docker 和 PostgreSQL/Redis,社区版免费且开源(Apache-2.0 许可证)。如果不想自建,官方也提供云服务。从原型到生产,Dify 把 AI 应用开发的复杂度降了一个量级。去它的 GitHub 仓库 看示例视频和模板,你会发现原来搭个智能助手可以这么简单。

GitHub项目

用自然语言操作本地文件?这个开源Agent框架做到了

如果你曾幻想过对电脑说“帮我整理桌面文件,把PDF按项目分类归档”,却苦于没有趁手的开源工具,那这个仓库值得你立刻点开。它让LLM直接接管文件系统、调用Shell命令,甚至操作浏览器,而这一切都在本地运行,无需上传隐私数据。核心看点- 自然语言驱动文件操作:支持“找到上周修改的图片并压缩”这类模糊指令,Agent自动解析意图并拆解为find、zip等底层命令,无需手写脚本。 - 模块化工具注册:内置文件读写、代码执行、网页抓取等工具,开发者可像搭积木一样扩展自定义工具(如数据库查询、API调用),依赖注入机制让集成成本极低。 - 多模型后端兼容:默认支持OpenAI兼容接口,也提供llama.cpp本地推理适配器,可在无GPU的笔记本上运行小模型(如Qwen2.5-7B),兼顾隐私与性能。▲ github.com 仓库页截图(仅供参考,以 GitHub 为准)适合谁- 开发者:快速为现有项目添加“语音/文本→自动化操作”能力,例如让运维机器人根据日志摘要重启服务。 - 普通用户:厌倦了重复性文件整理或批量重命名?装个本地模型就能当“数字管家”。 - Agent研究者:仓库提供了清晰的工具抽象层和任务编排示例,适合作为自定义Agent原型的起点。 - 依赖:Python 3.10+,无GPU也可运行(CPU推理速度较慢),默认无需API Key(若用本地模型)。最后,翻翻它的README,你会发现从“一句话压缩视频”到“自动生成周报”的完整案例。仓库的Issues里还有不少社区贡献的实用工具,比如微信文件自动归档。快戳 open-interpreter 看看能否成为你的效率外挂。

GitHub项目
最新

Khoj:本地AI搜索你的知识库,比Obsidian自带搜索好用十倍

还在为记不清笔记放在哪个文件夹而抓狂?Khoj 能直接索引你本地的 Markdown、PDF、图片甚至代码,并用本地或云端的大模型给你精准答案。对 Obsidian、Logseq 用户来说,这几乎是知识管理的终局形态——安装一个插件,你的所有笔记瞬间拥有一个会思考的搜索引擎。核心看点- 多种数据源统一索引:支持本地文件、Obsidian 保险库、LaTeX、Org-mode 等,甚至能读取图片中的文字。索引后可通过自然语言提问,Khoj 会召回最相关片段并生成回答。 - 自由选择推理后端:既可以用 ChatGPT、Claude 等云端 API,也能全部在本地跑(通过 llama.cpp、Ollama),完全离线也能用。MIT 许可证,代码透明,隐私可控。 - 跨平台触手可及:桌面端有 Obsidian 插件、Emacs 包、Web 界面,移动端也有对应客户端。查询时还能一键跳到原始文件位置,非常顺手。▲ github.com(阿里云通义万相 生成配图,非网页截图)适合谁- 笔记重度用户:如果你每天记大量笔记但检索低效,Khoj 能直接给出理解后的答案,而不是单纯的关键词匹配。 - 隐私敏感的研究者:选择本地模型,所有数据不出机器,适合处理敏感文档。 - 喜欢折腾的自部署玩家:通过 Docker 或 pip install khoj 就能跑起来,依赖 Python 3.10+ 和至少 8GB 内存。若用本地模型还需 GPU,但也可纯 CPU 推理(速度稍慢)。Khoj 的 README 写得相当详尽,从安装到自定义插件都有教程。如果你也想让自己的笔记“活”起来,不妨点开仓库看看:GitHub - khoj-ai/khoj

GitHub项目

高效终端工具:ripgrep 快速搜索代码

ripgrep(rg)是一款基于 Rust 编写的命令行搜索工具,专为开发者设计,用于在目录中快速搜索文本模式。它比传统的 grep 快数倍,支持递归搜索、自动忽略 .gitignore 中的文件、以及丰富的正则表达式功能。其亮点在于跨平台兼容(Linux、macOS、Windows)和极低的内存占用,非常适合在大型代码库中定位字符串或函数定义。 该仓库由 Andrew Gallant 维护,拥有超过 5 万星标,许可证为 MIT 和 Unlicense 双许可,清晰且开放。近期提交活跃,持续修复 bug 并优化性能。无论是日常调试还是代码审查,ripgrep 都能显著提升效率,是 CLI 工具中的佼佼者。▲ github.com 仓库页截图(仅供参考,以 GitHub 为准) 你可以通过 ripgrep 访问仓库,获取安装指南和文档。建议直接使用包管理器安装,体验无缝集成。

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.