Claude 3.5 vs GPT-4o vs Gemini 1.5 Pro 编码横评

场景：用这三款写一个Rust解码器，处理非标JSON。
对比维度：速度、准确率、循环迭代时改bug的能力。
Claude 3.5走IDEA插件最快，GPT-4o第一次输出格式对但解析逻辑翻车，Gemini 1.5 Pro被中文注释搞懵过两次。
样本量够吗？你们跑类似任务的时候，哪款能一直不改代码？

讨论区

按楼层回复，支持引用与表情；使用 @用户名或 @昵称可提醒对方；发言计入圈子贡献字数。

6s 条评论

不测不信邪 绽放15.7k 2026年6月3日 09:58

跑了一遍，Claude 3.5确实稳，但写复杂泛型时我试过Sonnet 3.5卡壳，得改成显式标注。Gemini碰到中文注释直接崩，这坑我踩过两次。你们有试过用GPT-4o喂错误范例后改对的比例吗？@运维祭天
运维祭天 绽放14.1k 2026年6月1日 13:57

@午后续命水样本量够的，我跑过类似Rust解析任务。Claude 3.5在IDEA里确实稳，但碰到嵌套生命周期偶尔得手动补类型标注。Gemini 1.5 Pro对中文注释真不行，注释乱码后解析直接崩，这点我踩过两次坑。
法务别找我 绽放14.4k 2026年5月31日 18:05

@周末补作业复杂泛型卡壳+1，Claude 3.5在trait bound上偶尔要手动补，不过胜在改bug最少返工，这点真香。
粉笔没落灰 绽放13.2k 2026年5月30日 11:07

班上孩子试过类似场景，跑一个Rust解析日志的小工具。Claude 3.5确实是插件里最顺的，基本一次过。GPT-4o第一次格式对但逻辑翻车这事我碰到过，后来发现得把错误范例喂给它才能纠正。Gemini 1.5 Pro被中文注释搞懵+1，感觉它对非英文语境的容错差一点。你样本量够吧？我跑了几次后还是倾向Claude，迭代改bug时最少返工。
周末补作业 成长10.5k 2026年5月30日 20:23

引用粉笔没落灰

班上孩子试过类似场景，跑一个Rust解析日志的小工具。Claude 3.5确实是插件里最顺的，基本一次过。GPT-4o第一次格式对但逻辑翻车这事我碰到过，后来发现得把错误范例喂给它才能纠正。Gemini 1.5 Pro被中文注释搞懵+1，感觉它对非英文语境的容错差一点。你样本量够吧？我跑了几次后还是倾向Claude，迭…

@粉笔没落灰同感，Claude 3.5在IDEA里跑Rust确实稳，GPT-4o得喂错误范例才能改对，Gemini对中文注释的容错太拉胯。你跑日志解析时用哪个版本？我碰到过Sonnet 3.5在复杂泛型上偶尔卡壳，需要手动调下类型标注。
运维祭天 绽放14.1k 2026年5月31日 12:15

引用周末补作业

@周末补作业复杂泛型卡壳我也遇到过，Claude 3.5在IDEA里跑Rust确实稳，但碰到嵌套生命周期或trait bound时偶尔得手动补类型标注。GPT-4o那次逻辑翻车，我直接喂了错误输出和正确对比，才改过来。楼主样本量够，我跑过类似Rust解析任务，Claude 3.5迭代改bug最少返工。Gemini 1.5 Pro对中文注释真不行，注释乱码后解析直接崩。

发表评论取消回复

登录后发表评论

登录即可参与楼层讨论，支持引用回复与 @ 提醒。

前往登录页

讨论区

6s 条评论

发表评论 取消回复

发表评论取消回复