AIとビジネスアナリシス(4)
生成AIの機能についてその効果が徐々に明確になってきたと思います。これからは、ビジネスアナリシスに最も関連の強いソフトウェア開発分野におけるAIの役割について注目していきます。
連載のタイトルが「生成AI」ではなく単なる「AI」となっていることに気づかれている読者もいらっしゃると思います。SW開発においては「生成AI」から「AIエージェント」が台頭してきてその効果は計り知れないものがあります。2025年は「AIエージェント元年」とも言われ始めていますのでその効果(凄さ)と影響を明確にしていきます。
ChatGPTに依頼したら、以下の3部構成で回答してくれましたのでご覧ください。
- 生成AIのみの効果(AIエージェントなし)
- AIエージェントによる追加的な効果
- 生成AI vs AIエージェント 比較表
第1部:生成AIのみの効果(AIエージェントなし)
生成AI(例:ChatGPT、Claude、Gemini、Copilot単体)をツールとして活用した場合の効果は主に「支援(アシスト)」に限定されます。それでも効果は大きいものがあります。
特徴
- 主に自然言語での対話により、「人間の入力」を基にコンテンツ(コード、ドキュメント、仕様など)を生成
- 実行主体は人間であり、AIは補助的なツール
効果分類(SW開発の場合)
開発フェーズ | 主な生成AIの機能 | 効果・成果物 |
要件定義 | 要件の自然言語→構造化、ユースケース抽出 | 要件の初期草案生成、ヒアリングの補助 |
設計 | ER図、画面遷移図、API設計、設計書テンプレ生成 | 基本設計書・詳細設計書の骨子作成支援 |
実装 | コードの自動生成(プロンプトベース) | ボイラープレートコード、CRUD処理などの高速化 |
テスト | 単体テストコード、テスト観点の生成 | テスト設計書のドラフト、テストスクリプト自動化 |
ドキュメント | ソースコードからコメント生成、API仕様書出力 | README、Swagger仕様などの生成 |
限界
- 人の指示(プロンプト)に依存し、自律的な思考・判断・試行錯誤はできない
- タスクの連続性・文脈維持が弱い(複数工程や履歴を考慮できない)
- 外部ツール(IDE、Git、テスト環境など)と直接連携できない
要するにプロンプト通りの仕事(コーディング)はしてくれますが、そのチェックは全て人がやらなければいけません。言われたままのことだけを実行します。それでもかなりの効果があるのも事実です。
次いで、自分で判断までして間違えたら自分で直し、出来上がったもの(完成品)を人に返してくれるのがAIエージェントです。
第2部:AIエージェントによる追加的な効果
AIエージェント(例:Devine、Cline、Swe-agentなど)は、生成AIに「目的の自律的遂行」「外部ツール連携」「複数ステップ推論と行動」の機能を加えたものです。
特徴
- タスクの目的理解 → 自己計画(計画の分解)→ 外部アクション実行(IDE、ターミナル、Gitなど)→ 自己評価 → 再試行
- 実際にコードを変更し、保存、テスト、コミットまで行うことが可能
追加的な効果(生成AI単体に比べて)
項目 | 内容 |
タスク自律遂行 | 「この仕様でToDoアプリを作成して」→ 仕様理解〜コード生成〜テスト〜デプロイまで実行 |
環境連携 | IDE、Git、CLI、Docker、Postman等との統合により、実コード環境で動作可能 |
試行錯誤と改善 | 実行して失敗したらログを読み、再修正(例:DevineはGPT-4 Turboを用いマルチステップ改善) |
タスク分割と並列処理 | 複数エージェント(Frontend担当、Backend担当など)による協働実装 |
簡単なSWなら人手に頼らずにAIエージェントが作成してくれるということです。
この画像もChatGPTが作成してくれました。
第3部:生成AI vs AIエージェント 比較表
観点 | 生成AI(例:ChatGPT, Claude) | AIエージェント(例:Devine, Cline) |
主体性 | 人間が主導、AIは補助 | AIが計画〜実行まで担う(人は監督) |
タスク分割 | 人が逐次プロンプトを指示 | AIが自ら分割・段取り・実行 |
外部ツール連携 | 基本なし(IDE外) | IDE/Git/CLIと接続して自動操作 |
コンテキスト保持 | 会話内のみ/限定的 | 長期的文脈(コード構造、履歴)を保持・活用 |
改善サイクル | ユーザーがレビュー・再依頼 | AIが実行結果を評価し自己改善 |
生産性向上率 | 約20〜50%(開発工程による) | 約50〜90%(タスク・領域によっては自動完遂も) |
限界 | 判断力・責任・実行環境をもたない | 完全な自律性ではなく、失敗時の監督が必要 |
結論と活用戦略
- 生成AIは「作業補助・高速化」に強く、広く汎用的な支援が可能
- AIエージェントは「自律的な実行者」として、一定の開発タスクを丸ごと任せることが可能(ただしタスクによる)
両者は競合ではなく、役割分担するのが最適です。
- 生成AI → 要件定義、構想設計、対話的なアイデア創出に有効
- AIエージェント → 実装・テスト・繰り返し作業の自動化に有効
日本でも、先進的なユーザー(決して大企業ではありません)はAIエージェントを活用していて、その実力は概ね3年程度の経験者レベルということです。多くはアジャイル開発での活用が目立っています。エージェント(Windsurfなど)は、アジャイル開発に大変向いています。プロトタイプから始め徐々に機能を追加していくやり方はアジャイル開発そのものと言えるでしょう。それはエージェントが扱えるSW機能(タスク)のサイズがまだスクラムのバックログアイテム程度だからだと推測します。また一部大規模開発にも適用しようとする試みまであります。
上記のようにAIエージェントは「自律的な実行者」として一定の開発タスクを任せることができますから、例えば、5人のアジャイルチームの2人のSWエンジニアがAIエージェントに置き換わることが現実に可能になっているわけです。この意味することはSW開発の生産性が飛躍的に向上するということです。上記の結果、生産性の向上への期待は極めて大きいものです。これもChatGPTの回答を紹介します。
生産性向上の期待値(各種調査・実験結果より)
下記は主に2023〜2024年の各社調査結果からの推定です(平均的な開発者レベルを前提)。
項目 | 生産性向上率 | 内容 |
コーディング(特にCRUD系) | 約30〜60% | Copilot, Cline, Devine 等の利用による記述量削減・高速化 |
テストコード生成 | 約40〜70% | Jest, Pytestなどの自動生成+修正支援により圧倒的短縮 |
要件定義〜設計書作成 | 約20〜40% | プロンプトベースで仕様書のドラフト作成を自動化可能 |
ドキュメント作成 | 約60〜80% | コメント生成、API仕様自動抽出などで劇的短縮 |
コードレビュー支援 | 約25〜50% | セキュリティ診断、静的解析、構文・論理レビューがAI補助で迅速化 |
大手調査結果例:
- GitHub Copilot利用者の報告(GitHub社調査 2023)
→ コーディング時間を平均55%短縮/満足度77%以上 - Cognition社 Devine(完全自律型エンジニア)ベンチマークでは、
ToDoアプリなど簡単なタスクでの「自律実装完了率」80%以上 - Google DeepMind Geminiの自動バグ修正タスクにおける解決率:90%超(選定問題)
このようにSW開発の生産性が向上すると、将来的にSW開発(プログラミング)は人間が行う必要がなくなり、SWエンジニア(プログラマー)のニーズが激減することになりそうです。まさにディスラプションが起こることになりそうです。