【検証】Claude CodeのAgent Skillsに見積もりを「丸投げ」したら、エンジニアの苦悩は解消されるのか？

はじめに

エンジニアという仕事をしていると、コードを書いている時間と同じくらい（あるいはそれ以上に）「これ、どれくらいでできそう？」という問いに向き合う時間が多い気がしませんか？

新規プロジェクト全体のバッファを含めた概算見積もり
スプリントごとの細かなタスク見積もり
予期せぬバグへの緊急対応見積もり

今回は、そんなエンジニアの永遠の課題である「見積もり」を、Agent Skillsを使って標準化・自動化してみた検証記録をお届けします。

そもそも、なぜ見積もりは「ブレる」のか

私たちは普段、ある程度のフレームワーク（三点見積もり法やストーリーポイントなど）に沿って見積もりを行っています。しかし、最終的にはどうしても「個人の経験値」というスパイスが加わります。

「この規模なら、以前の経験からしてこれくらいかな……」
「このメンバー構成なら、少し多めに見ておこう」

結果として、同じようなタスクでも担当者によって粒度が変わったり、見積もりを出す作業自体に数時間を費やしてしまったり。「見積もりのための見積もり」で工数が削られるという本末転倒な状況もしばしば発生します。

「だったら、個人の主観を排除して、Agent Skillsで統一してしまえばいいのでは？」
そんな思いつきから、今回の検証は始まりました。

【実践】Agent Skillsで「見積もりスキル」を作成

今回は、skill-creator を使って対話方式で見積もりのスキルを作成しました。作成に要した時間はわずか10分ほどです。

作成したスキルの内容の一部抜粋

# IT見積もりスキル

WBSやタスクリストをもとに、IT開発プロジェクトの工数（人日）をマークダウン表形式で見積もる。

## 見積もり方針

手法: 経験則ベース（一般的なITプロジェクトの実績値を参考に推定）

単位: 人日（1人日 = 8時間）

フェーズ: 設計フェーズ・開発フェーズを分けて集計

バッファ: リスク係数として合計工数に20%を自動加算（バッファの根拠も明示する）

## 入力の受け取り方

ユーザーが提示するWBS・タスクリストをそのまま入力として扱う。タスクが曖昧な場合は、適切な粒度に分解して見積もること。不明な前提（技術スタック、チーム規模、既存資産の有無など）があれば、見積もりの仮定として明示する。

## 工数の目安（経験則）

タスクの複雑度を「小・中・大」の3段階で判断。

小（シンプルなCRUD等）：設計 0.5〜1.0 / 開発 1.0〜2.0

中（複数テーブル連携等）：設計 1.0〜2.0 / 開発 2.0〜4.0

大（複雑なロジック等）：設計 2.0〜4.0 / 開発 4.0〜8.0

and more…

実際に「丸投げ」してみた結果

以下の具体的なタスクリスト（WBS）を入力し、Claudeに見積もりを依頼しました。

入力したデータ

前提:
- 開発者スキルレベル: 中級（実務経験3年程度）
- 新規開発（既存コードの流用なし）
- フロントエンド・バックエンドともに標準的なWebフレームワークを使用（例: React + REST API）
- DBはリレーショナルDB（PostgreSQL等）を使用
- チーム構成: フロントエンド1名 / バックエンド1名（合計2名体制を想定）
- 社内システムのため、外部公開・大規模トラフィック対応は対象外
タスク:
- ユーザー認証機能（ログイン・ログアウト・パスワードリセット）
- 打刻機能（出勤・退勤・休憩の打刻）
- 勤怠実績一覧画面（月次カレンダー表示）
- 承認フロー（上長による承認・却下）
- 管理者向け集計レポート（CSV出力付き）

Claudeからの出力結果

Claude Skillsが算出した見積もり結果がこちらです。

1. 工数内訳表

#	タスク	設計（人日）	開発（人日）	小計（人日）	備考
1	ユーザー認証機能	1.5	4.0	5.5	複雑度：中。パスワードリセット含む
2	打刻機能	1.5	4.0	5.5	複雑度：中。重複チェック・状態管理
3	勤怠実績一覧画面	2.0	5.0	7.0	複雑度：大。UI実装・集計ロジック
4	承認フロー	2.0	5.0	7.0	複雑度：大。アクセス制御・状態遷移
5	管理者向け集計レポート	1.5	4.5	6.0	複雑度：中〜大。CSV生成・フィルタ
合計（バッファ前）		8.5	22.5	31.0
バッファ（20%）				6.2	手戻り・レビュー対応想定
合計（バッファ後）				37.2

2. サマリー

合計工数（バッファ後）: 37.2 人日
期間目安（2名体制）: 約1ヶ月強（4〜5週間）

検証から見えた「AI見積もり」の真価

いかがでしょうか。
雑に提示したタスクから、わずかな時間でこれだけの精度で出力されました。今回は検証用としてざっくりとしたSkillの内容であることと、雑なインプットを考えれば及第点の結果だと個人的には感じました。
今後、プロジェクト固有のコーディング規約や技術スタックの詳細を追加していけば、さらに精度は向上するでしょう。

そしてこの手法の最大のメリットは、精度そのものよりも「判断基準の平準化」にあります。個人の「さじ加減」が入る隙を減らし、プロンプトに組み込んだ一定のアルゴリズムに基づいて算出させることができるので、「個人の経験値」からくる「ブレ」も最小限に抑えることができます。

AI活用で見積もりが変わる3つのポイント

ロジックの明文化: 「なぜその工数になったのか」がAIによって言語化されるため、クライアントや上司への説明コストが激減します。
属人性の排除: 個人の「さじ加減」が入る隙をなくし、チーム全体で一定の基準（アルゴリズム）に基づいた算出が可能になります。
メンタルモデルの負荷軽減: 過去の記憶を掘り返す作業をAIに任せ、人間は「AIが出した基準値に対する微調整」に集中できます。

まとめ

結論として、Agent Skillsによる見積もり自動化は、エンジニアの苦悩を大幅に軽減するポテンシャルを秘めています。
もちろん、AIがすべてを完璧に予測できるわけではありません。しかし、「AIが提示した叩き台を人間がレビューする」というフローにシフトすることで、見積もり業務はもっとクリエイティブで楽なものになるはずです。
皆さんの現場でも、ぜひ「見積もりのAI化」を試してみてはいかがでしょうか？

最後に

最後まで読んでいただきありがとうございました。この記事が、日々見積もりに追われるエンジニアの皆さんの参考になれば幸いです。

【検証】Claude CodeのAgent Skillsに見積もりを「丸投げ」したら、エンジニアの苦悩は解消されるのか？

はじめに

そもそも、なぜ見積もりは「ブレる」のか

【実践】Agent Skillsで「見積もりスキル」を作成

# IT見積もりスキル

## 見積もり方針

## 入力の受け取り方

## 工数の目安（経験則）