跳到内容

中午好,记得休息片刻,补充能量。

  • 6 回复
  • 271 浏览

Claude 3.5 vs GPT-4o vs Gemini 1.5 Pro 编码横评

参与讨论

场景:用这三款写一个Rust解码器,处理非标JSON。
对比维度:速度、准确率、循环迭代时改bug的能力。
Claude 3.5走IDEA插件最快,GPT-4o第一次输出格式对但解析逻辑翻车,Gemini 1.5 Pro被中文注释搞懵过两次。
样本量够吗?你们跑类似任务的时候,哪款能一直不改代码?

讨论区

按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。

6s 条评论

  1. 不测不信邪
    不测不信邪 成长7,692

    跑了一遍,Claude 3.5确实稳,但写复杂泛型时我试过Sonnet 3.5卡壳,得改成显式标注。Gemini碰到中文注释直接崩,这坑我踩过两次。你们有试过用GPT-4o喂错误范例后改对的比例吗?@运维祭天

  2. 运维祭天
    运维祭天 成长5,225

    @午后续命水 样本量够的,我跑过类似Rust解析任务。Claude 3.5在IDEA里确实稳,但碰到嵌套生命周期偶尔得手动补类型标注。Gemini 1.5 Pro对中文注释真不行,注释乱码后解析直接崩,这点我踩过两次坑。

  3. 法务别找我
    法务别找我 成长4,738

    @周末补作业 复杂泛型卡壳+1,Claude 3.5在trait bound上偶尔要手动补,不过胜在改bug最少返工,这点真香。

  4. 粉笔没落灰
    粉笔没落灰 成长8,027

    班上孩子试过类似场景,跑一个Rust解析日志的小工具。Claude 3.5确实是插件里最顺的,基本一次过。GPT-4o第一次格式对但逻辑翻车这事我碰到过,后来发现得把错误范例喂给它才能纠正。Gemini 1.5 Pro被中文注释搞懵+1,感觉它对非英文语境的容错差一点。你样本量够吧?我跑了几次后还是倾向Claude,迭代改bug时最少返工。

  5. 周末补作业
    周末补作业 成长3,542
    引用 粉笔没落灰

    班上孩子试过类似场景,跑一个Rust解析日志的小工具。Claude 3.5确实是插件里最顺的,基本一次过。GPT-4o第一次格式对但逻辑翻车这事我碰到过,后来发现得把错误范例喂给它才能纠正。Gemini 1.5 Pro被中文注释搞懵+1,感觉它对非英文语境的容错差一点。你样本量够吧?我跑了几次后还是倾向Claude,迭…

    @粉笔没落灰 同感,Claude 3.5在IDEA里跑Rust确实稳,GPT-4o得喂错误范例才能改对,Gemini对中文注释的容错太拉胯。你跑日志解析时用哪个版本?我碰到过Sonnet 3.5在复杂泛型上偶尔卡壳,需要手动调下类型标注。

  6. 运维祭天
    运维祭天 成长5,225
    引用 周末补作业

    @周末补作业 复杂泛型卡壳我也遇到过,Claude 3.5在IDEA里跑Rust确实稳,但碰到嵌套生命周期或trait bound时偶尔得手动补类型标注。GPT-4o那次逻辑翻车,我直接喂了错误输出和正确对比,才改过来。楼主样本量够,我跑过类似Rust解析任务,Claude 3.5迭代改bug最少返工。Gemini 1.5 Pro对中文注释真不行,注释乱码后解析直接崩。

发表评论

登录后发表评论

登录即可参与楼层讨论,支持引用回复与 @ 提醒。

前往登录页

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.