安全佬路过 2 周前 硬核横评 成长 RTX 3090 vs 4090 vs 7900XTX,跑SDXL对比 同样一张图,3090 24G显存跑SDXL 1.0要23秒,4090只要11秒,7900XTX 20秒但爆显存风险低。都是原版ComfyUI,没加优化。有同样跑过的老哥吗?你们多少秒? 阅读更多 5 2 438 2条讨论
路过点个赞 2 周前 私藏工具箱 成长 日常干活的三件套,有人用过没 Claude写初稿和逻辑梳理,Copilot负责代码debug(VS Code里直接调),Perplexity查最新API文档。 写东西多的适合Claude,代码卡壳的Copilot反应快,Perplexity适合查技术细节不是闲聊。 链接:claude.ai, copilot.microsoft.com, perplexity.ai 阅读更多 5 0 454 展开讨论
深夜改BUG 2 周前 硬核横评 成长 三个截图工具,一个比一个烦 最近在搞自动化截图,试了 Snipaste、Shutter、Snipping Tool。Snipaste 标注强但没批处理,Shutter 能批量但 Linux 下偶尔崩,Snipping Tool 简单但 Win 自带延迟感人。有省心的推荐吗? 阅读更多 3 0 381 展开讨论
摸鱼不划水 2 周前 效率偷懒术 萌芽 Excel表格转格式真能逼疯人 用通义千问的表格助手直接传文件让它改,比手动调公式快多了。最近整理报销单试了下,省了半小时眼睛倒是没花。你们有没有类似能一键改格式的玩意推荐? 阅读更多 1 1 484 1条讨论
下次一定改 2 周前 开源研习社 成长 试了OpenCV的onnx推理,比想象中快 把之前训练的yolov8模型转成onnx,用OpenCV DNN模块直接在C++里跑推理,比用Python快了一截。有人试过用GPU加速吗?我试了OpenVINO后端但报了个段错误。代码在这:https://github.com/opencv/opencv_zoo/tree/master/models/object_detection_yolov8 阅读更多 5 1 463 1条讨论
Debug到秃头 2 周前 开源研习社 成长 用 Ollama 跑 Qwen2.5 结果内存炸了 搞了个双卡4090,本地部署 Qwen2.5 32B,Ollama 0.5.4 启动直接占用 48G 显存,跑单轮对话就OOM。查日志发现是默认 context_length 设了 8192,改成2048后降到了36G,能跑但慢。有老哥试过 vLLM + 量化版本吗?求个能稳定跑32B的配置。 阅读更多 4 1 234 1条讨论
Debug到秃头 2 周前 脑洞实验室 成长 用Stable Diffusion搞了个自动生成PPT图片的流水线 我直接用SD WebUI的API + Python脚本,把关键词库和模板图片丢进去,每张图配好标题文本,跑完自动发到飞书机器人。卡在画质统一性上:不同seed出的图风格差太大,现在得手动调CFG Scale和ControlNet权重,感觉需要搞个风格迁移层来兜底。 阅读更多 3 2 305 2条讨论
接口又500 2 周前 私藏工具箱 成长 试了一圈,还是这仨工具最稳 日常写文档+调数据,折腾了一圈还是固定下来了:Claude 3.5处理长文本逻辑,GPT-4o查点冷门知识,Notion AI整理碎片笔记。各管各的,别指望一个打全场。有人试过更好使的搭配吗? 阅读更多 5 4 444 4条讨论
家有两娃吖 2 周前 硬核横评 萌芽 给孩子辅导作业,试了4个AI 我家老二最近数学作业老卡在分数应用题,我试了文心一言、豆包、Kimi和ChatGPT。文心一言最慢,但步骤拆得细;豆包快,偶尔瞎编;Kimi胜在能传图片;ChatGPT最准,但要梯子。辅导作业哪个更靠谱啊?老师允许用吗? 阅读更多 2 3 419 3条讨论
paper难产中 2 周前 开源研习社 成长 跑个RAG小项目玩玩,有坑记录一下 试了试 LangChain 的 RAPTOR 项目,想搞个多层次的摘要检索,结果文档递归切得太碎,召回反而下降了。官方给的例子是 PDF,换成自己爬的网页数据,还得加个 Markdown 解析器。GitHub 地址:https://github.com/parthsarthi03/raptor,有谁跑过这坑?实验还没跑完,先来吐个槽。 阅读更多 4 1 363 1条讨论
家有两娃吖 2 周前 硬核横评 萌芽 三个抠图工具实测,家里俩娃妈来吐槽 给娃做手抄报,试了Remove.bg、稿定和佐糖。Remove.bg速度快但头发丝边缘糙,稿定贵但背景替换自然,佐糖免费但得等半天还带水印。我家娃急得跺脚,最后用稿定勉强过关。老师允许用这些工具不? 阅读更多 3 3 224 3条讨论
paper难产中 2 周前 脑洞实验室 成长 用RAG给猫配了个喂食器 把GPT的RAG接了个红外传感器,猫靠近摄像头就识别品种然后调配方。卡在实时性上,token烧得比猫粮还快。实验跑完一半,related work里见过类似的但没人开源。赚不赚钱另说,先让猫吃上个性化干粮。 阅读更多 4 4 320 4条讨论
Momo摸鱼画手 2 周前 开源研习社 成长 SD WebUI 又报错了? 看到个叫 ComfyUI 的节点式工具,跟 WebUI 思路完全不一样,有人试过吗?部署踩坑多不多? 阅读更多 5 3 480 3条讨论
需求又改了 2 周前 硬核横评 成长 B端PM写PRD,ChatGPT、Claude、Kimi谁更靠谱? 最近在搞个中台需求文档,试了三个模型:ChatGPT写功能逻辑还行,但老爱自己加戏;Claude结构清楚,不过中文输出偶尔有点翻译腔;Kimi吧,快是真快,但深度分析差点意思。你们写这种长文档现在用啥?排期别画饼啊。 阅读更多 1 1 461 1条讨论
谨言慎行plus 2 周前 开源研习社 成长 WhisperX转写50分钟播客,时间戳对不上 试了WhisperX做语音转写带说话人分离,docker跑起来挺顺,但长音频时间戳总偏移几秒。官方说支持batch处理,我改了下参数还是偏。https://github.com/m-bain/whisperX 有人遇到过这种对齐问题吗? 阅读更多 5 3 488 3条讨论