2025年:ai開発ツール技術スタックの年

Introducing the AI dev tool tech stackの意訳です。

4月、MicrosoftとGoogleが、自社で生成されるコードの30%がAIによるものであると発表しました。これは、AIコーディングツールが新たな段階に突入したことを意味しています。これらは、大企業においてさえエンジニアリングワークフローの重要な一部になっています。

現在、開発者界隈のX(旧Twitter)「バイブコーディング」夢中で、多くの開発者が次のような疑問を抱いています。AIの実際の活用例とはどのようなものか?開発者たちはエージェント的なコーディング機能を使って、本番環境向けの機能をまるごと「バイブコーディング」しているのか?それとも主に補完やプロトタイピングに使っているだけなのか?

開発者が本当に知りたいのは、チーム、企業、業界全体でのAI活用の成功例です。チームが実際に使っているAIツールは何か?どうすれば本当の価値を引き出せるのか?企業はAI利用にどんなルールを設けているのか?AIコーディングツールは本当に生産性を向上させているのか?それともバグを増やしながらコーディング速度だけが上がっているのか?

CodeRabbitでは毎月数百のエンジニアリングチームとAIの活用方法について話をしています。それによって、AI導入のトレンドをいち早くキャッチできており、ここ数ヶ月で開発チームの思考に顕著な共通点が見られるようになってきました。

ここからは、私たちが顧客から聞いていることと、それがなぜ「2025年はAI開発ツールスタックの年」と言えるのかを紹介します。

誰もがAIの課題を抱えている

私たちが話すチームの多くが、AIコーディングツールの一番の課題として挙げるのは「生産性や開発者体験(DevEx)の向上が一貫しないこと」です。調査によれば、AIコーディングツールはコードに最大41%多くのバグを生む可能性があるとされており、新たな課題も生んでいます。

数週間前、Cursorのデザインチーム責任者であるRyo Luが、Cursorでコードを書く際の注意点についてスレッドを投稿しました。そこでは、「AIスパゲッティコード」を避けるための12のステップが紹介されています。

ホビープロジェクトやシニア開発者ばかりのチームであれば、スパゲッティコードを排除できるかもしれません。しかし、規制の厳しい上場企業で、ジュニア開発者がレガシーコードベースにAIを使って変更を加えたら…想像するだけで恐ろしい話です。

さらに、バグ以外にもAIツールは他の開発工程でもボトルネックを生んでいます。

コードを書く量が増えれば、それだけコード(レビューすべき・テストすべき・ドキュメント化すべき・リファクタリングすべき)も増えます。結果として、「画期的な」AIの生産性向上効果は、開発プロセスの他の手動工程で滞ってしまうのです。しかも、AI生成コードは問題を抱えやすいため、それらの工程にかかる時間も増大します。

新しいコーディングには、新しい技術スタックが必要

多くの開発者が今年、大きな気付きに至りました。それは「変革的なテクノロジーを導入するなら、他の開発工程も変える必要がある」ということです。つまり、エンドツーエンドのAI開発ツールスタックが必要だということです。

破壊的技術はしばしばエコシステム全体に変化をもたらします。GitHubが2008年に登場したとき、3年後にはCircle CIやJenkinsといった関連ツールも登場しました。AIコーディングツールも、それより早いペースで同様の変化を起こしつつあります。

数年間AIツールを使ってきた開発リーダーたちは、AIツールが役立つときもあれば、逆効果になることもあると認識しています。真の生産性向上を得るには、AIが生む新たな課題に対処するための補完ツールが必要です。

また、AI導入をスタックとして捉えることで、コード生成だけでなく、その他の手作業(レビュー、テストなど)にもAIを使って生産性を高められます。誰もコードレビューやテストを書くのが好きなわけではないのですから、AIに任せた方が効率的です。

実際、開発工程の他フェーズでのAI活用は、コード生成以上のROIを生む場合もあります。なぜなら、それらのツールはバグを除去する方向に働くからです。

AI開発ツールスタックには何が含まれるのか?

私たちが顧客から見ているAI開発ツールスタックは、ソフトウェア開発ライフサイクルのあらゆる段階をサポートするAIツール群から構成される多層的なスタックです。

ここではそのスタックの各層と、その結びつき、そしておそらく今年末までに(すでにそうでないなら)ほとんどの開発者が使うことになる理由について紹介します。

  • 基盤レイヤー: AIコーディングツール

  • 必須レイヤー: AIコードレビューツール

  • 任意レイヤー: AIテストツール

  • 任意レイヤー: AIリファクタリングツール

  • 任意レイヤー: AIドキュメント生成ツール

基盤レイヤー:AIコーディングツール

多くのチームはまずここからスタートします。これらのツールは、現在書いているコードの補完や自然言語プロンプトから関数・テスト・コンポーネント全体を生成することで、開発者がより高速にコードを書くことを支援します。最近ではコードベースの理解力が増し、コード品質への配慮も強化され、エージェント的なマルチステップタスクへの対応にも注力されています。しかし、これらのツールは依然としてバグや脆弱性、パフォーマンス低下の要因になりやすく、多くのコード修正やレビュー作業が必要になります。

近年よく聞かれるのが次の2点です。

  1. 開発者は1つのツールだけでなく、目的に応じて複数のツールを使い分けている(この投稿がそれを皮肉っています)。

  2. 使用するツールに対するこだわりが強くなり、AIアシスタントの選択がPC派かMac派かのように分かれるようになった。

その結果、多くのチームが特定のツールに一律でライセンスを付与するのではなく、開発者自身が使いたいAIアシスタントを選べるようにしています。その方が使いこなされやすく、企業にとっても利益があります。

これらのツールは以下の5カテゴリに分類できます(一部ツールは複数カテゴリに該当):

  • 補完系ツール: GitHub Copilot, Cursor Tab, Windsurf, TabNine, Sourcegraph Cody, Qodo, Jetbrains

  • AIコーディングアシスタント: GitHub Copilot, Cursor, Windsurf, Claude Code, OpenAI Codex CLI, Zed, Cody (Sourcegraph), Aider, Qodo, Cline, Roocode, Blackbox, OpenHands, Gemini Code Assist, Augment Code, Amazon Q, JetBrains AI Assistant

  • エージェント型コーディング: Cursor, Windsurf, GitHub Copilot, Claude Code, OpenAI Codex, Cline, Roocode, Blackbox AI, Continue, Devin, Jules, Augment Code, OpenHands

  • AIアプリ生成ツール: Lovable, v0, Bolt, Builder.io, Figma Make, Fine.dev, Stitch

  • コードベースコンテキストツール: Repomix, Repo Prompt, Context7

必須レイヤー:AIコードレビューツール

AIコードレビューツールはスタックの中心に位置します。なぜなら、AIによって急増したコードを手動でレビューし続けるのは現実的ではないからです。

レビュー負荷が増せばチームのバーンアウト(燃え尽き症候群)リスクも高まり、品質劣化にも繋がります。研究によれば、開発者が集中してレビューできるのは最大で約400行まで。それを超えると見逃しやミスが増え、結果的に本番環境でのバグ対応が必要になります。

AIコードレビューツールは、PRマージの高速化(最大4倍)やレビュー時間の短縮(最大50%)に役立ち、AIによって増加したバグの混入を防ぐためにも不可欠です。AI生成コードのバグ増加率が最大41%とも言われている中、この層の活用はAI活用による生産性を損なわずに済む重要な鍵となります。

さらに、コード品質の向上、レビュー疲労の軽減、チーム横断でのベストプラクティスの標準化にも寄与します。出力結果も、開発者のプロンプトスキルに左右される生成系AIツールとは異なり、一貫性があります。

加えて、AIは「繰り返し」「面倒」な作業の自動化に強みを持ちます。PRに何十個もコメントを手で付ける代わりに、AIに任せてクリックで修正案を適用し、見逃したバグまで検出してもらえるのです。

主なツール分類:

  • AIコーディングツール内機能: Cursor, GitHub Copilot, JetBrains, Windsurf Forge(非推奨)

  • GitベースのAIコードレビュー: CodeRabbit, Bito, Greptile, Qodo, Graphite Diamond

  • IDEとGitの両対応ツール: CodeRabbit, SonarQube, Qodo, Sourcery

任意レイヤー:AI QAテスト生成・実行ツール

多くの開発チームにとって、QAテストはすでに何らかの形でAIが関与している領域です。しかし、最近登場しているAI搭載QAツールは、さらに多くの面倒な作業を自動化できることを約束しています。特に、ユーザーの行動をシミュレートするようなエンドツーエンドテストの生成や保守といった、時間がかかる作業に対して有効です。

すべてのテストシナリオを手作業で考える代わりに、自然言語の説明からAIがテストケースやスクリプトを自動生成してくれます。

主な利点は、やはりスピードです。AIはテストスイートの生成・実行を数分でこなし、数十のシナリオを一度に生成できます。また、人的ミスで見落とされがちなパターンも網羅的にチェック可能です。さらに、一部ツールではUIやデータの変化に応じて自動でテストを更新してくれる「自己修復」機能もあり、保守コストを抑えながらテストスイートを常に最新状態に保てます。

分類は以下の通りです:

  • AIテスト生成ツール: Testim, Mabl, Functionalize, testRigor, Autify, ACCELQ, Qodex, Tricentis

  • AIテスト実行・保守ツール: MuukTest, Applitools, Sauce Labs, Perfecto, Meticulous

任意レイヤー:AIリファクタリングツール

一部のAIコーディングツールはリファクタリングも可能と謳っていますが、実際には品質が不十分なことも多くあります。そのため、多くの企業はリファクタリングに特化したAIツールを導入しています。これらは、開発ツールスタックの一部としてAIコーディングツールとは別に活用されます。

AIリファクタリングツールは、煩雑かつ繰り返しの多い改善作業を自動化することで、コードベースの最適化(軽微な修正から大規模なアーキテクチャ変更まで)を支援します。手作業で非効率な箇所を探したり、同じ変更を複数箇所に反映させる必要はありません。自然言語で目的を伝えるだけで、AIが修正点を見つけ、必要に応じて実行します。

分類は以下の通りです:

  • 半自動ツール: CodeGPT, GitHub Copilot, Amazon CodeWhisperer, Sourcegraph Cody

  • 完全自動ツール: Claude Code, Devin, OpenAI Codex

任意レイヤー:AIドキュメント生成ツール

AIを導入する際、最初に注目されることは少ないものの、いざ使い始めると非常にありがたみを感じるのが「ドキュメント作成」です。インラインコメントやdocstringなど、最も退屈で後回しにされがちな作業のひとつです。

このようなAIツールを使えば、新しい関数を1つ1つ手作業で記述したり、古いガイドを見直したりする必要がなくなります。コードをもとにAIが可読性の高い最新のドキュメントを自動で生成し、膨大な時間の節約に繋がります。

主なツール:

  • コードレベルのドキュメントツール: DeepWiki, Cursor, CodeRabbit, Swimm, GitLoop, GitSummarize

サンプルスタック

では、実際のAI開発ツールスタックはどのような構成になっているのでしょうか?企業によって構成は様々ですが、以下に代表的なパターンを紹介します。

「包括的」スタック

私たちが接している企業の中には、AIコーディングツール、コードレビューツール、QAツール、リファクタリングツール、ドキュメントツールのすべてを含むエンドツーエンドのAI開発ツールスタックを導入している、あるいは導入中の企業が増えています。

これらの企業は、C-suiteやエンジニアリング部門が中心となってAI導入を積極的に推進している場合が多く、AIコーディングツールの初期導入にも前向きで、その効果を実感していたことが背景にあります。さらに高い生産性と開発者体験(DevEx)を追求し、他レイヤーのツール導入に取り組んでいます。

「選べるAIツール」スタック

開発サイクル全体にAIツールを導入し、かつチームメンバーにツール選択の自由を与える企業も増えています。これらの企業は、ツールによって得意分野が異なること、そして開発者自身が使いやすいと感じるツールの方が成果につながることを理解しています。

このアプローチは、AI導入率を高めるだけでなく、開発者の満足度や体験の向上にも繋がっています。AIコーディングツール(CursorかCopilotかClaude Codeか?)だけでなく、他のツールにも選択肢を用意している企業もあります。

「複数コーディングツール」スタック

「ツールの選択肢を与える」だけでなく、「複数ツールの併用を許容」している企業も存在します。たとえば、LovableでUIプロトタイプを作成し、Cursorでアプリ本体を実装したり、TabNineで補完を使いながら、ChatGPTでコード生成を行ったりします。

生産性向上の理由が合理的であれば、複数のツール利用を許可する企業が増えています。

「部分導入」スタック

すべてのツールを一度に導入している企業ばかりではありません。多くの企業が部分的な導入から始めています。

典型的には、AIコーディングツールとAIコードレビューツールを導入し、さらに1つの補助ツール(AIリファクタリング、QA、ドキュメントツールのいずれか)を追加するという構成です。どのツールを追加するかは、コードベースの性質や社内のスキル、ニーズによって異なります。たとえば、大企業は社内にQAチームを抱えていることが多いためAI QAツールを採用しやすく、一方で小規模企業はQAを外部に委託するケースが多くなります。

「必須」スタック

最後に、AIコーディングツールとAIコードレビューツールのみで構成される「ミニマルな」スタックも多くの企業で採用されています。AIコーディングによってバグが増えたりレビューが煩雑になる中で、それを緩和するための最低限の構成です。

特にコードレビューツールは、時間短縮・品質維持の両面で高いROIを誇り、多くの企業が導入しています。

独自のAI開発ツールスタックを構築するには:考慮すべき点

AI開発ツールスタックの構築に関しては、さまざまなアプローチがあります。
多くの企業はまずAIコーディングツールを導入し、そこから発生する課題に応じて、必要に迫られて個別のツールを後追いで導入するという流れです。

一方で、CTOや技術リーダーが中心となり、開発サイクル全体を見渡した上で意図的にツールを選定・検証し、PoC(概念実証)を行ってから導入する企業もあります。中には、AIコーディングツールの導入をあえて後回しにして、まずはコードレビューツールで技術的負債の処理から始めた企業もあります。

私たちは能動的な構築アプローチを推奨しています。なぜなら、多くのチームが問題が深刻化してから対処を始め、納期遅延や開発者の燃え尽きに苦しんでいるケースを見てきたからです。

特定のツール導入に関する事例や詳細については、こちらの別記事をご覧ください。各カテゴリごとの具体的な活用例や、チームへの効果について紹介しています。

あなたのAI開発ツールスタックの構築状況や導入して良かったツールについても、ぜひ教えてください。
X(Twitter)LinkedIn でタグを付けてシェアしてください!

当社のAIコードレビューツールを試してみたい方はこちら → 14日間の無料トライアル!

0
Subscribe to my newsletter

Read articles from Atsushi Nakatsugawa directly inside your inbox. Subscribe to the newsletter, and don't miss out.

Written by

Atsushi Nakatsugawa
Atsushi Nakatsugawa