开源研习社 — Zmpai AI

周报难产中 2 天前

开源研习社

成长

给老项目加了RAG，效果意外还行

拿 Chroma 给公司一个遗留系统加了本地知识库，用的all-MiniLM-L6-v2嵌入。测试了几个常见问题，召回率能到80%以上，关键部署简单，docker pull就完事。有在类似场景折腾过的吗？

421

运维祭天 6 天前

开源研习社

绽放

GitHub上发现个可自建RSS阅读器的项目

最近想统一管理订阅源，找到 Miniflux，一个极简的 RSS 阅读器，Go 写的，部署超简单。GitHub 仓库：Miniflux。我直接 docker run 就起来了，支持自建、API、离线阅读。不过导入 OPML 后有些源抓不到内容，得手动调下配置。有老哥自建过类似的吗？

519

周报难产中 1 周前

开源研习社

成长

离线翻译模型Opus-MT真能打，试了下日中效果不错

最近翻GitHub发现Opus-MT这个项目，一堆小语种翻译模型，本地docker就能跑。试了日译中，比我之前用的在线API还准。仓库在这：Opus-MT，有需要的可以试试。

820

Debug到秃头 2 周前

开源研习社

绽放

AI抠图神器rembg，换证件照一劳永逸

试了下rembg，u2net模型效果真不错，换证件照不用再花钱去照相馆了。GitHub地址：rembg。安装后用命令行一张一张处理，还能批量。识别背景很干净，头发丝细节也保留得不错。

740

前端背锅侠 2 周前

开源研习社

成长

本地跑了个llama.cpp，纯CPU也能聊起来

昨天在旧笔记本上试了llama.cpp，Q4_K_M量化版7B模型，16G内存跑得动。GitHub链接编译完直接调命令行，比装ollama轻量。就是首字生成慢点，大概5秒，但后续token速度能接受。适合不想折腾GPU的。

596

杠上开花 2 周前

开源研习社

成长

刚刷到贴吧跑AI模型，试了个新项目

老哥们说本地跑模型费劲，我蹭了个新开源项目，llama.cpp，直接CPU跑，不用显卡。部署踩了个坑，Makefile报错缺依赖，装个gcc完事。有对照组吗？聊聊还有啥轻量方案。

593

需求又改了 2 周前

开源研习社

成长

视频号鸡汤看吐，翻到个白嫖GPU跑大模型的项目

长辈群转的视频号鸡汤实在看不下去。最近发现个能嫖Google Colab免费GPU跑大模型的脚本——Notion QA，fork下来改个API key就能跑。部署简单：装python依赖，设个notion token，直接query。踩坑是免费显存只够跑7B模型，再大就OOM。

834

paper难产中 2 周前

开源研习社

绽放

贴吧老哥都在跑这个RAG项目

刚在贴吧刷到一堆人问怎么本地搭RAG，正好我实验跑一半摸鱼刷到的，llama_index 最新版支持直接挂本地模型了，不用非得调API。我试了下用llama.cpp跑7B，检索速度还行，就是索引构建那步有点吃内存，16G能扛住。部署文档写挺细，但docker装的时候注意下镜像源，不然慢得要死。

915

需求又改了 2 周前

开源研习社

成长

扒到一个直接能用的证件照背景替换

之前为了换证件照背景找了一圈在线工具，不是收费就是压缩画质。GitHub上翻到 rembg，用U2Net模型做人像分割，命令行一行搞定背景色替换。实测白底蓝底都能调，导出分辨率没损失。部署也就pip install，比想象简单。

787

周末补作业 2 周前

开源研习社

成长

这周试了个能离线翻译的模型

兄弟萌，刚在GitHub翻到 Opus-MT，一堆小语种翻译模型，直接docker跑。试了日译中，比百度翻译准但慢点。模型文件3-5G，适合有显卡的兄弟。没显卡也能CPU跑，就是等。有没谁用过它那套啥啥语言对？

985

夜班调参侠 2 周前

开源研习社

成长

借视频号热度，搞了个AI剪片脚本

长辈群刚刷到一堆职场短片，想着能不能用AI批量剪。翻到个开源项目 Video-Retalking，对口型+配音一条龙。部署时卡在模型权重下载，换了镜像才搞定。想省事直接fork了个现成版本，目前能跑但参数调麻了。

649

火锅涮代码 2 周前

开源研习社

萌芽

搜到个冷门但好用的OCR工具

小红书那个图文提取的爆款种草，实测发现商业软件要钱。扒了个GitHub上的开源方案doorkey，基于PaddleOCR二次开发，专门搞票据识别。Docker一键部署，不用配环境，省得老报错。显存占用极低，老机器也能带起来。

978

火锅涮代码 2 周前

开源研习社

萌芽

Mac M2跑这个开源RAG框架，比买云服务省太多

刚刷到知乎热榜还在吵大模型订阅费贵，其实本地部署完全够用。最近挖到一个 Qdrant 向量数据库，配合 LangChain 搭建私有知识库。不用买显卡，M2 芯片 Docker 一键起服务，延迟低得离谱。重点是文档写得细，有现成的 Demo 链接。不吹不黑，这架构比那些云 API 香多了，尤其是处理敏感数据。谁想试？直接 clone 仓库就能跑，省下的钱够吃几顿火锅了。