Community · AI Topics
AI Community
Dive into global AI tools' hidden gems—hardcore comparisons, pro tips, monetization hacks, and honest reviews, all in one place.
Circle posts and replies are in Chinese; click EN at the top for instant browser translation. These pages are not indexed as separate English URLs.
登录后发起讨论
登录即可发布话题,支持配图、表情与手绘,与社区一起交流 AI 实践。
话题分类
全部话题
RTX 3090 vs 4090 vs 7900XTX,跑SDXL对比
同样一张图,3090 24G显存跑SDXL 1.0要23秒,4090只要11秒,7900XTX 20秒但爆显存风险低。都是原版ComfyUI,没加优化。有同样跑过的老哥吗?你们多少秒?
Claude写初稿和逻辑梳理,Copilot负责代码debug(VS Code里直接调),Perplexity查最新API文档。 写东西多的适合Claude,代码卡壳的Copilot反应快,Perplexity适合查技术细节不是闲聊。 链接:claude.ai, copilot.microsoft.com, perplexity.ai
最近在搞自动化截图,试了 Snipaste、Shutter、Snipping Tool。Snipaste 标注强但没批处理,Shutter 能批量但 Linux 下偶尔崩,Snipping Tool 简单但 Win 自带延迟感人。有省心的推荐吗?
用通义千问的表格助手直接传文件让它改,比手动调公式快多了。最近整理报销单试了下,省了半小时眼睛倒是没花。你们有没有类似能一键改格式的玩意推荐?
把之前训练的yolov8模型转成onnx,用OpenCV DNN模块直接在C++里跑推理,比用Python快了一截。有人试过用GPU加速吗?我试了OpenVINO后端但报了个段错误。代码在这:
https://github.com/opencv/opencv_zoo/tree/master/models/object_detection_yolov8
用 Ollama 跑 Qwen2.5 结果内存炸了
搞了个双卡4090,本地部署 Qwen2.5 32B,Ollama 0.5.4 启动直接占用 48G 显存,跑单轮对话就OOM。查日志发现是默认 context_length 设了 8192,改成2048后降到了36G,能跑但慢。有老哥试过 vLLM + 量化版本吗?求个能稳定跑32B的配置。
用Stable Diffusion搞了个自动生成PPT图片的流水线
我直接用SD WebUI的API + Python脚本,把关键词库和模板图片丢进去,每张图配好标题文本,跑完自动发到飞书机器人。卡在画质统一性上:不同seed出的图风格差太大,现在得手动调CFG Scale和ControlNet权重,感觉需要搞个风格迁移层来兜底。
日常写文档+调数据,折腾了一圈还是固定下来了:Claude 3.5处理长文本逻辑,GPT-4o查点冷门知识,Notion AI整理碎片笔记。各管各的,别指望一个打全场。有人试过更好使的搭配吗?
我家老二最近数学作业老卡在分数应用题,我试了文心一言、豆包、Kimi和ChatGPT。文心一言最慢,但步骤拆得细;豆包快,偶尔瞎编;Kimi胜在能传图片;ChatGPT最准,但要梯子。辅导作业哪个更靠谱啊?老师允许用吗?
试了试 LangChain 的 RAPTOR 项目,想搞个多层次的摘要检索,结果文档递归切得太碎,召回反而下降了。官方给的例子是 PDF,换成自己爬的网页数据,还得加个 Markdown 解析器。GitHub 地址:
https://github.com/parthsarthi03/raptor,有谁跑过这坑?实验还没跑完,先来吐个槽。
给娃做手抄报,试了Remove.bg、稿定和佐糖。Remove.bg速度快但头发丝边缘糙,稿定贵但背景替换自然,佐糖免费但得等半天还带水印。我家娃急得跺脚,最后用稿定勉强过关。老师允许用这些工具不?
把GPT的RAG接了个红外传感器,猫靠近摄像头就识别品种然后调配方。卡在实时性上,token烧得比猫粮还快。实验跑完一半,related work里见过类似的但没人开源。赚不赚钱另说,先让猫吃上个性化干粮。
看到个叫 ComfyUI 的节点式工具,跟 WebUI 思路完全不一样,有人试过吗?部署踩坑多不多?
B端PM写PRD,ChatGPT、Claude、Kimi谁更靠谱?
最近在搞个中台需求文档,试了三个模型:ChatGPT写功能逻辑还行,但老爱自己加戏;Claude结构清楚,不过中文输出偶尔有点翻译腔;Kimi吧,快是真快,但深度分析差点意思。你们写这种长文档现在用啥?排期别画饼啊。
试了WhisperX做语音转写带说话人分离,docker跑起来挺顺,但长音频时间戳总偏移几秒。官方说支持batch处理,我改了下参数还是偏。
https://github.com/m-bain/whisperX 有人遇到过这种对齐问题吗?
Welcome! This site is in Chinese. Tap EN in the top bar to read in English.