Community · AI Topics
AI Community
Dive into global AI tools' hidden gems—hardcore comparisons, pro tips, monetization hacks, and honest reviews, all in one place.
Circle posts and replies are in Chinese; click EN at the top for instant browser translation. These pages are not indexed as separate English URLs.
登录后发起讨论
登录即可发布话题,支持配图、表情与手绘,与社区一起交流 AI 实践。
话题分类
全部话题
我拿树莓派接了个马达和摄像头,跑了个YOLO猫脸检测,猫一动棒子就躲,本来想整成自适应逗猫。结果我家猫看了一眼就趴边上睡觉了,检测框都没触发。是不是帧率太低还是猫不鸟机械?有搞过动物交互的说说。
最近在搞一个叫Real-ESRGAN的开源项目,专门用来把模糊老照片放大修复的。GitHub链接:
https://github.com/xinntao/Real-ESRGAN。装的时候踩了个坑,Python版本得3.8以上,不然依赖报错。我是用conda建虚拟环境装的,然后下预训练模型,跑起来效果还行,就是显存吃挺狠。想搞个本地版的可以试试这个顺序:先装torch,再装依赖,最后下模型文件。有兄弟遇到过类似问题吗?
我把一个落灰的旧台灯拆了,用树莓派加摄像头和一个小屏幕,接上 Stable Diffusion 的实时画脸模型。灯一照到人脸,屏幕就生成卡通表情跟着动,还能眨眼。卡在延迟上,表情反应慢半秒,有点惊悚。想把这玩意儿做成个“情绪陪伴灯”,放家里应该能卖几百块吧。
刚试了briaai的RMBG v1.4,开源模型把图片背景抠得贼干净。部署就一个pip install加几行Python代码,MacBook都能跑。GitHub搜RMBG-1.4就能找到,别下错那个2.0的商用版。我测试时发现输入图片别太大,不然内存直接炸。
最近试了个AI生成个性化食谱,配合本地食材推荐,查了下居然有软件在众筹。有人做过类似的吗?比如用AI帮人设计家居软装方案,跑单赚分成,感觉需求不小。我手头有个方案,想找几个试水的聊聊。
之前试了gemini写周报,结果输出格式乱得不行,气得我换回claude。现在组合是claude搞文案+捏PPT框架,kimi专门搜资料,凑合着用。你们有啥稳定好搭配没,我还在找救场工具。
最近在琢磨能不能拿AI整点实际的东西,不是那种画图写文案的烂大街活儿。比如用视觉模型做老旧照片修复加自动上色,或者用大模型套壳搞个本地化的二手物品估价工具,感觉有点机会。各位有没有已经跑通或者觉得靠谱的坑,求个链接或者对照组,别光说概念。
就这个叫“GPT-SoVITS”的项目,昨天在GitHub上看到的,自己搭了个环境试了试。 我拿自己录了几句正常说话的声音训了大概半小时,生成出来的rap片段音色还原度能到七八成吧,就是情绪控制还差点意思。 有搞过的老哥没?你们数据集一般清多久的能稳?
今天心血来潮想用AI批量改几百个图的名字,结果脚本跑完一看,文件名全成了乱码加时间戳。还不如我手动一个个改呢,折腾一上午白费了。
我让AI给娃写个暑假计划,出来全是套话,什么“合理安排时间”“劳逸结合”,跟我自己编的没啥两样。还不如家长群抄一份。这玩意儿到底能不能用啊?
我最近在跑论文实验,试了LlamaIndex、LangChain和Haystack这三个做RAG的工具。同样是在文档集上做问答,LlamaIndex的检索精度高但配置麻烦,LangChain上手快但官方文档有点乱,Haystack的管道设计很清晰但社区小点。大家一般用哪个做实验?我实验还没跑完,想听听实际使用体验。
最近在搞一个AI客服SaaS,试了GPT-4o、Claude和DeepSeek三个模型处理客户投诉。GPT-4o贵但稳,Claude回复太啰嗦,DeepSeek中文快但偶尔跑偏。上线一周数据是这样——GPT-4o解决率高5%,但成本翻倍。你们选模型会优先看价格还是效果?
之前每周写周报都头疼,要回想这周干了啥。后来发现有个叫“周报生成器”的网站,把关键词输进去,AI就能帮你凑一段,还能选语气。我自己调了调提示词,现在十分钟搞定过去半小时的活儿,有类似困扰的可以试试。
为啥我身边的同学都用DeepSeek写论文,我还在用GPT硬撑?
刚研一,看了一圈周围同学的AI组合,有拿Claude润色的,有拿DeepSeek查文献的,就我一个人还在死磕GPT写综述。弱弱问一句,你们平时写论文是每步都用不同工具,还是一个从头到尾搞?我是不是该换个组合了。
我剪到凌晨四点刚试完最新版,那个AI自动分镜功能,说是智能识别镜头切换,结果我一段10分钟的视频给分了80多个片段。渲染等了俩小时出来一看,全是拼接奇怪的超短镜头,还不如我自己手动剪。你们用着咋样,还是我打开方式不对?
Welcome! This site is in Chinese. Tap EN in the top bar to read in English.