
想定読者
本記事は、以下のような方々を想定読者としています。
- QAエンジニア、テストエンジニア、品質保証に関わる実務者
- AI技術の品質保証への応用に関心をお持ちのエンジニア
はじめに
こんにちは、QA部の大段です。
8月にご紹介した「QA部のAX宣言」では、「AI for QA」と「QA for AI」という二つの軸での品質保証の進化についてお話しました。今回は、その「AI for QA」の実現に向けた現在地を正確に把握するために、2025年7月に実施したQA部内での生成AIツール活用状況調査の結果をご報告いたします。 developersblog.dmm.com
調査概要
調査の背景と目的
QA部において生成AIツールの活用が徐々に広がっているものの、必ずしもその実態が明確ではありませんでした。どのような業務でどの程度活用されているのか、どのような課題があるのかを把握し、効果的な支援策を検討するために、今回の調査を実施しました。
調査の主な目的は、QA部内での生成AIツール活用状況の可視化、業務プロセス別の利用率とレベルの把握、そして活用における課題や要望の洗い出しです。これらの情報を基に、組織全体のAI活用をより効果的に促進していくための方針を策定することを目指しました。
調査方法と回答状況
調査は2025年7月3日から7月11日までの7日間で実施し、QA部メンバー全員(SES含む)を対象とし、回答率は85.96%で、49名の皆さんに回答していただきました。
調査では、各業務プロセスでの生成AI活用レベルを測定するために、私たちが定義しているAXレベル(未活用・助手・協働・置換・自律の5段階)を用いました。このレベル分けにより、単純な利用の有無ではなく、どの程度まで業務にAIが組み込まれているかを詳細に把握できました。
対象業務プロセス
今回の調査では、QA部の業務を「テスト計画」「テストのモニタリングとコントロール」「テスト分析」「テスト設計」「テスト実装」「テスト実行」「テスト完了」「ルーチンワーク」の8つのプロセスに分類しました。

AXレベル定義
私たちは生成AI活用のレベルを以下の5段階で定義しています。助手レベルは人主導でAIが補助する段階で、AI活用度は25%程度です。 協働レベルでは人とAIが分業し、AIが処理・予測を行い人が判断する関係で、活用度は50%程度となります。 置換レベルではAI主導で人が監視する形となり、活用度は75%程度まで高まります。 もっとも高度な自律レベルでは、AIが自律的に判断し実行する段階で、活用度は100%に達します。
なお、QA部では活用度の目標を50%(協働レベル)に設定しており、人とAIが適切に役割分担しながら協働する状態を目指しています。

調査結果:現状分析
利用ツールの分布状況
QA部でもっとも利用されている生成AIツールは、Geminiが35名(71%)ともっとも多く、次いでNotebookLMが30名(61%)、Claudeが24名(49%)となりました。 GitHub Copilotの利用者は2名(4%)と少なく、使用なしと回答したのは6名(12%)でした。
興味深いのは、多くのメンバーが複数のツールを併用している点です。これは用途に応じてツールを使い分けている状況を示しており、各ツールの特徴を理解し適材適所で活用していることが伺えます。

業務プロセス別活用状況
全体傾向:助手レベル中心の活用
調査結果でもっとも顕著だったのは、全業務プロセスで助手レベル(25%以下)での活用が主流となっていることです。協働レベル以上の高度な活用は限定的で、特にテスト実行・テスト完了では低い活用率を示しています。この結果は、現在のQA部におけるAI活用が、まだ基本的な効率化の段階にあることを示しています。
しかしながら、この「助手レベル中心」という現状は決して否定的に捉えるべきものではありません。AI活用の第一歩として、人間が主導権を握りながらAIの支援を受けるという段階は、組織としてAIとの協働関係を学習していくうえで重要なプロセスと言えます。

活用が進んでいる業務プロセス
テスト分析がもっとも活用の進んだ領域として浮上しました。他の業務プロセスと比較して相対的にAI活用が進展しており、助手レベルから協働レベルまで幅広い活用が見られます。 具体的には、テスト対象の仕様書レビューや既存システムの仕様把握・整理、類似する要件の明確化、テストすべき要件の列挙といった業務でAIが活用されています。
これらの業務は、大量の情報を整理・分析する必要があり、AIの得意分野と人間の判断力がうまく組み合わせられる領域です。 そのため、他の業務プロセスよりも自然にAI活用が進んだと考えられます。
テスト設計においても一定の活用が見られ、特に新規・変更テストのテストケース生成で比較的多様な活用レベルが確認されました。 テストケース作成は従来から属人化しやすい業務でしたが、AIの支援により標準化と効率化が同時に進んでいることが伺えます。
活用が限定的な業務プロセス
テスト実行はもっとも活用が困難な領域として明確になりました。AI活用率が極めて限定的で、全業務で0%(全く使っていない)が圧倒的多数を占めています。 これは手動実行中心の業務特性によるものと考えられ、現在の生成AIツールでは直接的な支援がまだ困難な領域です。
一方で、ルーチンワークでは自動化ポテンシャルが高いにも関わらず、AI活用が限定的という興味深い結果が出ました。 QA業務のオンボーディングや質問対応、品質計画や本番不具合・障害管理などの業務は、実は生成AIが得意とする情報整理や文書作成と親和性が高く、今後の活用拡大が期待できる領域です。
チーム別の特徴的な傾向
調査では興味深いチーム間の格差も明らかになりました。 この格差は単なる偶然ではなく、各チームの業務特性や組織文化、メンバー構成などが複合的に影響していると考えられます。
QAグループ第1チーム
第1チームは助手レベル中心の限定的活用で、全体的に保守的なAI活用姿勢を示しています。テスト分析の一部業務で活用が進んでいるものの、新しい技術への慎重な取り組み方が特徴的です。これは品質保証という責任の重い業務において、確実性を重視する姿勢の表れとも言えます。一方で、この慎重さが革新的な効率化の機会を逃している可能性もあります。

QAグループ第2チーム
第2チームでは協働レベル(25-50%)での活用が他チームより進展しており、特にテスト分析業務で積極的なAI活用を実践している先進チームです。 人とAIの役割分担が適切に行われており、目標としている50%の活用度にもっとも近い状況を実現しています。

QAグループ第3チーム
第3チームは置換レベル(50-75%)での活用がもっとも進展し、テスト分析・テスト設計業務でAIが業務を代行する高度な活用を実現している最先進チームです。 目標の50%を大きく超える活用度を達成しており、AIに対する信頼度も高いことが伺えます。ただし、過度なAI依存によるリスクも考慮し、人間の判断力とのバランスを保つことが今後の課題となります。

デバッググループ
デバッググループはAI活用率が全体的に低く、助手レベルでの部分的活用にとどまっています。 しかし、ゲームのデバッグ業務は不具合票の作成やゲームシナリオの確認、プレイデータの分析など、AIが得意とする情報整理や文書作成と親和性が高い領域です。 また、大量のプレイログから異常パターンを発見したり、テストケースの網羅性を向上させたりする場面でも、AIの活用余地は大きいと考えられます。このチームへの重点的な支援により、組織全体の活用レベル向上に大きく貢献する可能性があります。

このチーム間格差は、AI活用スキルの属人化やチーム文化の違いを反映していると考えられます。同時に、先進チームの知見を他チームに展開することで、組織全体のレベルアップが可能であることも示しています。
活用による効果と成果
実感されている具体的効果
アンケートでは、AI活用による具体的な効果についても調査しました。もっとも実感しやすい効果として作業工数削減が挙げられ、特にテスト設計・テストケース作成で5名が効果を実感しています。従来は経験豊富なメンバーに依存していた業務が、AIの支援により新人メンバーでも適切に実行できるようになったという声が多く聞かれました。
作業スピードアップの面では、テスト実行効率向上で4名が効果を実感しており、AIの処理能力を活用することで業務のスピードアップを実現しています。また、分析作業の簡素化やレポート作成・議事録作成・資料更新において大幅な時間短縮に貢献しているという報告もありました。
作業品質向上については、抜け漏れ観点の発見で4名が効果を実感しています。AIが人間では気づきにくい部分を補完してくれることで、テスト設計の網羅性が向上し、品質そのものの向上につながっているという報告が印象的でした。
学習・理解促進の面では、AIがメンター的な役割を果たし、QAエンジニアの継続的な学習をサポートしているという声がありました。コーディング習得支援や創造的なテストアプローチの発見を促進しており、従来であれば特定のスキルを持つメンバーに依存していた業務が、AI活用によりチーム全体で対応できるようになったという成果が報告されています。

業務の質的変化
単純作業をAIに任せることで、人はQA活動に対してより新しい方法やより良い方法がないか考えたり、実現に向けて試行錯誤するための時間に集中できるようになったという報告が複数ありました。これまで手作業に費やしていた時間を、創造的な品質改善活動や戦略的な品質保証の検討に充てることができ、QA組織全体の付加価値向上につながっているという声は特に注目すべき成果です。
また、定型的な業務以外でも多様な活用が報告されました。GASのコーディング支援や質問対応といった情報収集・検索、QAプロセス分析やクレーム・要望分析といったデータ分析、資料再構成などのコンテンツ作成、グループ管理などの業務管理まで、幅広い領域でAIが活用されています。

課題と改善への取り組み
明らかになった主要課題
調査で明らかになった課題は、大きく3つのカテゴリに分類されます。まず操作・運用面では、プロンプト作成スキル不足が最大の課題として浮上しました。基本的な指示の仕方から応用的な技術まで幅広い支援が必要な状況で、効果的なプロンプトが作成できないために期待した結果が得られないという声が多く聞かれました。
品質・精度面では、AI出力の信頼性に対する不安が大きな課題となっています。推測データや不正確な分析結果への対処法が不明であったり、ピンポイントな回答が得られなかったり、間違った指示にも従ってしまうといった問題が報告されています。
技術的制約については、文字数・容量制限がもっとも頻繁に挙げられました。Claudeの文字数制限や会話継続性の問題、添付ファイル容量上限、生成途中での制限など、長文での作業や大容量ファイルの処理が困難という声が多数ありました。

段階的な改善アクション
これらの課題に対して、私たちは段階的なアプローチで改善に取り組んでいます。操作・運用面と品質・精度面の課題については、情報入力・プロンプト作成フォローの実施により対応します。具体的には、効果的なプロンプト作成技術の社内勉強会開催、業務別ベストプラクティス集の作成・共有、経験豊富なメンバーによる個別サポート体制の構築を進めています。
技術的制約については、API活用の推進と分割処理テクニック共有により解決を図ります。API活用による制限回避方法の指導、大容量データの効果的な分割処理手法の共有、技術的課題の解決事例集の整備を通じて、現在の制約を回避する方法を組織内で共有していきます。
全体的な改善としては、生成AIの基礎知識底上げと具体的活用事例の共有を継続的に行います。定期的なAI活用事例共有会の開催、チーム間の知見交換プログラムの実施、外部コミュニティとの連携による最新情報の収集を通じて、組織全体のAI活用レベルの向上を目指しています。
今後への展望と要望
メンバーからの具体的要望
今後使ってみたい生成AIツールや利用にあたっての要望として、特に学習・知識習得のニーズが高かったです。6名のメンバーから「生成AI(LLM)理解のための書籍導入、業界内ツール情報収集、AI基礎知識習得」といった要望が挙げられ、基礎的な知識の底上げが急務となっています。
また、特定ツールへの関心も高く、Claude CodeやGitHub Copilot、Autify Nexus、GPT(上位プラン)、PKSHAChatbot、AI Programmer、Geminiなどのツールへの関心が示されています。これらのツールは、より専門的な用途や高度な機能を提供するものが多く、現在の助手レベルからの発展を志向する意識が感じられます。
ツール連携への期待も3名から挙げられ、Boxやチャットワークとの連携、Figma画像のリネーム・Box保存自動化、スプレッドシートへの直接出力など、日常業務で使用するツールとの連携による効率化への強いニーズがありました。

私たちの次のステップ
短期的な取り組みとして、まずはスキル格差の解消を最優先に進めています。 プロンプト作成研修と先輩メンバーによるサポート体制の本格運用により、組織全体のベースラインを引き上げることを目指しています。 同時に、先進チームの手法を他チームに展開することで、成功事例の横展開を図っています。 また、API活用とワークフロー自動化の推進により、技術的制約の解決にも取り組んでいます。
中期的な取り組みとしては、日常業務で使用するツールとAIの連携自動化を重点的に進めていきます。 Boxやチャットワーク、スプレッドシートなど、既存のワークフローにAIを組み込むことで、より実用的で効果的な活用を実現していく計画です。 また、AI活用のナレッジベース構築と継続的アップデートにより、組織全体の知見を体系化し、新しく参加するメンバーでも迅速にAI活用のノウハウを習得できる環境を整備します。
長期的なビジョンとして、「AI for QA」の理想的な姿である助手レベルから協働・置換レベルへの段階的な移行を目指します。 特に、テスト分析・設計業務では協働レベルでの安定運用を実現し、ルーチンワークでは置換レベルでの自動化を推進していきます。現在は困難とされているテスト実行についても、新しいアプローチでのAI活用の可能性を探索し続けます。
おわりに
今回の調査により、QA部における生成AI活用の現状と課題が明確になりました。現在は「助手レベル」での基本的な効率化が中心となっていますが、一部のチームではすでに「協働レベル」や「置換レベル」での高度な活用も始まっています。
重要なのは、この格差を問題として捉えるのではなく、組織全体の成長機会として活用することです。先進的な取り組みを行っているチームの知見を共有し、課題を抱えているメンバーへの適切なサポートを提供することで、組織全体のAI活用レベルの底上げを図ります。
「AI for QA」の実現は一朝一夕には達成できませんが、今回の調査結果を基盤として、着実に歩みを進めていきます。AIという強力なパートナーと共に、より効率的で高品質な品質保証を実現し、最終的にはユーザーの皆様により良いプロダクトをお届けできるよう、QA部全員で取り組んでまいります。
次回は、具体的な生成AI活用事例や、実際のワークフローでの活用方法について詳しくご紹介予定です。QA業務でのAI活用に関心をお持ちの方は、ぜひご期待ください。