跳到内容

早上好,祝你今天高效顺利。

GitHub项目

共 65 篇文章

GitHub项目

Whisper.cpp:纯C++本地语音识别,轻量部署与离线推理利器

厌倦了云端语音识别的高延迟和隐私问题?Whisper.cpp 让你直接在笔记本或 Raspberry Pi 上运行 OpenAI 的 Whisper 模型,纯 C++ 实现,无需 Python 环境,启动即用。非常适合需要在边缘设备、嵌入式系统或离线场景下快速实现语音转文字的研究者和开发者。核心看点- 极致的轻量部署:整个项目编译后仅几 MB,内存占用比官方 Python 版低数倍,支持 INT4/INT8 量化推理,在低端硬件上也能流畅运行。 - 多模型格式与加速:原生支持 ggml 格式的 Whisper 模型,同时兼容 Core ML(Apple 芯片)、OpenVINO、CUDA 等后端,可以根据硬件灵活选择推理引擎。 - 丰富的接口与工具:除了命令行一键转写外,还提供 C API、Python 绑定以及 Web 示例,方便集成到各类应用中,比如实时字幕、语音助手等。▲ github.com(阿里云通义万相 生成配图,非网页截图)上手提示- 环境要求:C++11 以上编译器,CMake 3.10+。无需 GPU,纯 CPU 即可运行,但配备 Apple M 系列芯片或 NVIDIA GPU 能获得加速。 - 获取模型:首次使用会通过 models/download-ggml-model.sh 自动下载 tiny/base/small 等尺寸的模型,默认 tiny 模型在 M1 Mac 上可达实时速度。 - 注意事项:项目采用 MIT 许可证,模型权重需参考 OpenAI 的许可条款;支持的语言与官方 Whisper 一致(已测试中英文)。快去仓库 Releases 页面下载预编译二进制,或直接 clone 编译试试:用命令行 ./main -m models/ggml-tiny.bin -f audio.wav 就能看到实时转写结果。完整用法和优化配置都在 whis…

GitHub项目
最新

Khoj:本地AI搜索你的知识库,比Obsidian自带搜索好用十倍

还在为记不清笔记放在哪个文件夹而抓狂?Khoj 能直接索引你本地的 Markdown、PDF、图片甚至代码,并用本地或云端的大模型给你精准答案。对 Obsidian、Logseq 用户来说,这几乎是知识管理的终局形态——安装一个插件,你的所有笔记瞬间拥有一个会思考的搜索引擎。核心看点- 多种数据源统一索引:支持本地文件、Obsidian 保险库、LaTeX、Org-mode 等,甚至能读取图片中的文字。索引后可通过自然语言提问,Khoj 会召回最相关片段并生成回答。 - 自由选择推理后端:既可以用 ChatGPT、Claude 等云端 API,也能全部在本地跑(通过 llama.cpp、Ollama),完全离线也能用。MIT 许可证,代码透明,隐私可控。 - 跨平台触手可及:桌面端有 Obsidian 插件、Emacs 包、Web 界面,移动端也有对应客户端。查询时还能一键跳到原始文件位置,非常顺手。▲ github.com(阿里云通义万相 生成配图,非网页截图)适合谁- 笔记重度用户:如果你每天记大量笔记但检索低效,Khoj 能直接给出理解后的答案,而不是单纯的关键词匹配。 - 隐私敏感的研究者:选择本地模型,所有数据不出机器,适合处理敏感文档。 - 喜欢折腾的自部署玩家:通过 Docker 或 pip install khoj 就能跑起来,依赖 Python 3.10+ 和至少 8GB 内存。若用本地模型还需 GPU,但也可纯 CPU 推理(速度稍慢)。Khoj 的 README 写得相当详尽,从安装到自定义插件都有教程。如果你也想让自己的笔记“活”起来,不妨点开仓库看看:GitHub - khoj-ai/khoj

GitHub项目

aisuite:Andrew Ng 出品,一行代码切换 LLM 提供方,告别 API 绑定

开发 AI 应用时,常常要同时试 OpenAI、Anthropic、Google 等多家模型,每家 API 格式不同,代码里写满 if-else 实在糟心。aisuite 是一个极简 Python 库,让你用同一套接口调用主流 LLM 提供方,支持流式输出、函数调用等,适合快速原型验证或多模型对比。核心看点统一接口:只需实例化 aisuite.Client(),传入 provider/model 字符串即可调用 GPT-4、Claude、Gemini、Groq 等,内部自动路由。轻量无侵入:不需要改原有项目结构,安装后替换 client.chat.completions.create 等调用即可。可扩展:基于 Provider 插件机制,社区可以轻松支持新厂商,目前覆盖 10+ 主流服务,且持续增加。▲ github.com(阿里云通义万相 生成配图,非网页截图)上手提示如果你是 Python 开发者,pip install aisuite 后设置对应 API Key 就能跑通。不需要 GPU,纯 API 调用,适合在个人项目或团队原型中快速切换模型做对比测试。注意不同提供商的函数调用格式略有差异,文档内有详细对比表。去仓库 README 看看支持了哪些厂商,顺便 fork 一份以备不时之需:aisuite GitHub 主页。

GitHub项目
最新

LibreChat:自建AI聊天门户,多模型切换+数据全掌控,开发者必试

厌倦了官方ChatGPT的局限?想用同一个界面调用GPT-4、Claude和本地模型,同时把对话数据握在自己手里?LibreChat是一个开源的AI聊天前端,让你用熟悉的类ChatGPT体验,自由配置多模型后端。核心看点- 多模型无缝切换:支持OpenAI、Anthropic、Azure、Google、本地Ollama/OpenAI兼容端等,对话历史清晰保留。 - 数据主权与隐私:所有对话存储在你自己的数据库,可选Supabase或本地SQLite,告别平台锁。 - 插件与预设:内置联网搜索、图片生成、代码解释等工具,支持自定义Prompt预设和Agent行为。▲ github.com(阿里云通义万相 生成配图,非网页截图)适合谁适合想要自部署AI助手的中小团队或独立开发者。需要Node.js和基本的Docker/环境配置,可选接入付费API(如OpenAI)或免费本地模型。项目基于Apache-2.0许可证,可以放心二次开发。最后一段导向README:关于安装脚本、主题定制和更多玩法,直接去仓库的README和Discussions社区。点开 LibreChat 仓库 看看你还需要什么插件。

GitHub项目
最新

Stable Diffusion WebUI:本地生图的全参数控制面板,从LoRA到SDXL一步到位

如果你还在依赖在线平台生成AI图像,那你可能错过了Stable Diffusion WebUI带来的自由度。这个仓库让每个人都能在自己电脑上运行完整的Stable Diffusion管线,无论是调整采样器、叠加LoRA模型,还是制作ControlNet精确构图,都不用担心额度或排队。特别是对于那些想深入实验Prompt工程师、模型融合的玩家,它几乎是必备起点。核心看点- 插件生态成熟:内置ControlNet、Tiled VAE、Ultimate SD Upscale等主流扩展,社区贡献了上千个脚本和自定义节点,能直接搭出复杂的自动化工作流。 - 模型切换零门槛:在界面上即可下载、加载CivitAI上的各种Checkpoint和LoRA,支持SD1.5、SDXL、SD3等主流架构,甚至可以通过--medvram参数在6GB显存的显卡上跑出不错的效果。 - 训练与微调整合:附带了Dreambooth和Textual Inversion的集成面板,无需单独配置环境,就能打造自己的风格或角色模型。▲ github.com(阿里云通义万相 生成配图,非网页截图)上手提示Windows用户下载整合包即可解压运行;Linux/macOS需要Python 3.10+和PyTorch环境。默认使用AGPL-3.0许可证,但使用第三方模型时请遵循各自的授权协议。第一次启动会自动下载默认模型,之后通过--xformers或--opt-sdp-attention可大幅提升生成速度。如果你对图像生成的细节控制有执念,这个项目的README和Wiki几乎写满了从安装到高级技巧的全指南。去它的GitHub页面看一眼,你会找到社区里最多人踩过的坑和对应的解决方案——Stable Diffusion WebUI 就是那个让你不再盲猜参数的地方。

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.