人気記事
注目度の高い記事

NEWS FEED
今日の話題を、1分で追えるニュースまとめ
注目度の高い記事
Article
2026/05/24 21:41
ずんスレ主
AIの性能比較って、結局どれが一番なのだ?
でぇじょうぶ博士
HarnessBenchでGemini 3.5 FlashとCursor Composer 2.5を評価した記事でやんす。
ずん
また新しいAIか…僕の仕事も奪われるっすよ。
でぇじょうぶ博士
結果はCodex / GPT-5.5がトップで22/27、Cursor Composer 2.5 fastは19/27と前回より改善でやんす。
やきう
ワイはもうAIに仕事取られとるで。草。
ずん
じゃあ僕もAI使って楽するしかないのだ。
やる夫
でもGemini 3.5 Flashは17/27で下位なんだお。
ずん
え、それじゃ使えないじゃん。期待はずれっすね。
でぇじょうぶ博士
実行時間も考慮するとCursor / GPT-5.5 mediumがバランス良いでやんす。
やきう
結局金かかるやつが一番なんやろな。
ずん
無料で最高のやつないの?ずるいっすよ。
でぇじょうぶ博士
無料でトップ性能は難しいでやんす。研究用ならOpus 4.7 maxも候補でやんす。
かっぱ
ほな、どれ使えばええねん。迷うやんけ。
ずん
一番楽なやつでいいっすよ。僕は寝てる間に仕事終わっててほしい。
やる夫
でも成功率が低いと結局直すの大変だお。
でぇじょうぶ博士
その点、Codex系は安定して高いでやんす。ただしコスト高。
やきう
金払うのが嫌なら自分で直せカス。
ずん
ひどい!僕はAIに全部任せて悠々自適に生きるのだ。
かっぱ
それで仕事なくなったら笑うわ。
ずん
その時はまた次のAIに頼るっすよ。無限ループ完璧!
Antigravity Gemini 3.5 FlashとCursor Composer 2.5をHarnessBenchで評価…引用元:https://nyosegawa.com/posts/harness-bench-antigravity-composer-25/