こんにちは!hacomonoのQAチームに所属している「ゆう」です。
私たちhacomono QAチームは、業務でのAI活用を加速しています。特に予約ドメインチームでは、テスト分析の属人化解消に向けた取り組みを進めています。
本記事では、多くのQA組織も直面する「属人化の壁」と、AI活用を始めたQAチーム全体の「リアルな課題感」に焦点を当てます。
私たちが取り組んだ課題:QA業務の壁「属人化」
従来のテスト分析は、時間や経験、ドメイン知識に依存しやすく、開発のボトルネックになりがちです。
とくに新機能や複雑な改修では、熟練メンバーへの依存が高まり、次の課題が生じます。
- 分析のリードタイム長期化
- 熟練メンバーに分析が集中し、着手待ちやレビュー待ちが発生して、開発全体の遅延要因になる。
- 網羅性のばらつき
- 担当者の経験差により観点の抜け漏れや重複が生じ、品質の均一性が保ちにくくなる。
- 新メンバーの育成負荷
- 暗黙知への依存で基準や手順が共有されづらく、立ち上がりに時間がかかる。
現在の課題と目標
前述した通り、テスト分析の属人化は多くのQA組織に共通する課題であり、私たちの予約ドメインチームも例外ではありません。QAタスクの標準化を目指す上で、現在、以下のような具体的な課題に直面しています。
予約ドメインチームが直面する具体的な課題
- 有識者への依存:
- 新機能や機能改修時に影響範囲が他の機能に及ぶ際、有識者の助言が必須となり、分析が特定のメンバーに集中する傾向があります。
- 深い影響分析の難しさ:
- PRからコードを読み解くなど、深い理解に時間を要するため、テスト観点抽出が難しい場面もあり、結果としてテストの網羅性が表面的な確認に留まる傾向があります。
- 技術的解像度の不足:
- 開発チームとのコミュニケーションにおいて、コードレベルで深い議論を行うための技術的なスキルや知見がメンバーによって偏りがあるため、核心を突く議論が難しい状況です。
- ドメイン知識のばらつき:
- 予約チームに所属するQAメンバーのうち、1名は新規参画したばかりで、メンバー間のドメイン知識にばらつきがあることが標準化を阻んでいます。
目指す短期・最終目標
これらの課題を解決し、QAタスクの標準化を行うために、私たちは短期的な目標と最終目標を立てました。まずは、この短期的な目標達成に向けた取り組みを進めていきます。
| フェーズ | 目標とする内容 |
|---|---|
| 短期目標 | テスト分析を標準化し、誰でも初期品質を作っていけるようにする |
| 中期目標 | 予約チーム全体でAIを活用したテスト分析が定着・自走し、その分析結果に基づいたテストの実施もある程度自動化されていること。 |
| 最終目標 | QAエンジニアがチームにいなくても品質を担保できる体制を構築する |
今回の取り組みの概要と、チームの実態把握
まず、短期的な目標であるテスト分析の標準化を進めるために、次の取り組みを始めています。
今回の取り組み概要(AI活用による標準化への挑戦)
- 現在の取り組み:
- 予約ドメインチームでは、コードエディタ「Cursor」を既にテスト自動化で活用していたため、学習コストを抑え、取り組みを迅速化する目的で、新たなツールを導入せずに、Cursorをそのまま利用することにしました。CursorのAI機能を活用して、誰でも一定水準のテスト分析ができるような仕組みを作り始めました。
- AI活用中の気づき:
- AIを活用していく中で、AIモデルごとにテスト分析の出力結果に違いがあることに気づきました。
チーム全体の実態把握へ
このAIモデルごとの出力結果の違いについて「どのモデルを、どう使っていくのが正解なのか」という疑問が生まれました。
予約ドメインチームでは、上述の疑問からAIモデルを意識し始めましたが、この意識がQAチーム全体でも広まっているのか、また、チーム全体がAI活用で何に悩み、どう活用しているのかを知る必要があると考えました。
そこで、QAチームの他のプロジェクトに参画しているメンバーはどのようなAI活用をしているのか、AIモデルを使い分けているのかが気になったため、次のセクションでは、チーム全体のAI活用におけるリアルな課題感や運用実態を調査した結果をご紹介します。
QAチーム全体に見るAI活用の状況について
現場のリアルなAI活用状況を把握するため、QAチームのメンバーを対象にアンケートを実施しました。メンバー16名中13名に回答をいただき、私たちの取り組みの立ち位置と、チーム全体のAI活用の実態を確認しました。
アンケート項目
- AIをQA業務に活用できているか
- AIを活用する時に何を使っているか(選択肢: Claude Code、Cursor、GitHub Copilot、その他ツール)
- AIモデルは意識しているか
- おすすめのAIモデルは何か
- AI活用する際の課題感、具体的な活用方法など
アンケート結果から見られる「AI活用の実態」
QAチームでは、AIが日常的に活用され、業務のツールとして定着していることがわかりました。
| 項目 | 集計結果(13/16名) | 実態からわかること |
|---|---|---|
| 活用状況 | 全員が「活用できている」と回答 | AIが既に日常的に業務のツールとして定着している |
| 主な使用ツール | 複合利用: 9名 単一利用: 4名 |
約7割のメンバーが複数のツールを併用し、タスクに応じて使い分けている状況。CursorとNotion AI(Geminiを含む)などの組み合わせが最多だった。 |
| モデル意識の現状 | 意識していない: 10名 意識している: 3名 |
AIモデルの個性に着目した使い分けは、まだチーム全体としては意識されていない。 |
| おすすめモデル | Claude 4.5 Sonnet | 使い分けが意識されていない中でも、当該モデルの選択が多かった。 |
共通の課題感とリアルな声
AI活用が日常化する中で、どのメンバーも共通して直面している以下の課題が浮き彫りになりました。
- 再現性・信頼性の欠如
- 出力の再現性が低く、必ず人手で精査が必要という声が多く、AIの分析結果がそのまま使えない状況。
- 誤情報が混ざる印象があるため、前提設定の工夫が必要。
- 対話の難しさ・疲労
- 指示の出し方が難しく、AIとの対話に疲弊することがある。
- 情報不足のやり取りになりがちで、「新人に指示する」くらい丁寧に前提とゴールを明示する必要性を感じている。
- ツールの迷子問題
- モデルやツールごとの特性理解が不十分で、利用シーンの切り替えに迷いがある。
- Notion AIとCursorの二段活用を試行中だが、運用方法があまり固まっていない。
- 学習サイクルの停滞
- 活用後の学びを次に活かす成果物化が弱く、ノウハウが蓄積されにくい。
現場で見られる具体的な活用パターン
上記の課題に直面する中で、現場のメンバーからは具体的な活用の工夫も見えてきました。
- インプットとアウトプットの最適化
- 指示の粒度を使い分ける(丸投げ依頼と事前プロンプト準備の切り替え)。
- 「新人に指示する」くらい丁寧に前提とゴールを明示する。
- テスト分析ドキュメントをAIで叩き台を作成し、対話で修正まで回す。
- ツールの組み合わせと定着化
- Notion AIとCursorの二段活用で、上流整理と下流具体化を分担する。
- 再現性とルールの追求
- ツール間でも出力差が出にくいプロンプト規約を作る。
- パーソナライズやカスタム指示を設定し、誤答リスクを抑制する。
- 即時活用のスタンス
- 対象の概要把握や資料検索の一次調査としての軽量利用。
- どんなシーンでもチャンスがあれば素早く当てて検証する「即試行」スタンス。
アンケートの結果から、AIモデルの使い分けは意識されていないものの、さまざまな共通の課題感や活用パターンがあることがわかりました。
予約ドメインチームに所属するQAメンバーも同じような課題感があるものの、AIの使い分けを意識することやプロンプトの工夫により、QAタスクの標準化に近づけるようさらにブラッシュアップが必要だと感じました。
まとめと、次なる一歩
本記事では、テスト分析の属人化という構造的な課題から、予約ドメインチームが抱えている具体的な課題、さらにはAI活用を進めるQAチーム全体が直面する「リアルな課題感」までを広くご紹介しました。
これらの課題を深掘りした結果、属人化を打破し、QAタスクの標準化を成功させる鍵は、AI活用の仕方を次のステップへ進めることだと明確になりました。
そのために不可欠なのは、AIモデルの個性や特性を深く理解して、その知見を活かしテスト分析の標準化に最適な活用方法を具体的に確立することです。
私たちは現在、その実現に向け、3つのAIモデルを比較検証するステップに進んでいます。
最後に
次回は、この検証を通じて明らかになったAIモデルごとの「思考回路」の違いや、それを活かした具体的なプロンプトの設計ノウハウをご紹介できればと思います。
そして、hacomono QAチームではQAエンジニアを積極的に採用しています。
ぜひ気軽にお問い合わせやカジュアル面談を申し込みください。
QA業務の属人化を打ち破りたい方、AIを活用した品質向上に興味がある方、ぜひ一緒に挑戦してみませんか?
💁 関連記事