データ分析

DEIM2026(第18回データ工学と情報マネジメントに関するフォーラム)に参加しました!

はじめに DEIM2026の概要 参加レポート 一般発表(技術報告) スポンサーブース インタラクティブセッション [1F-04] ターゲットベクトルを用いた SPLADE への明示的な知識注入による概念マッピング効果検証 [5G-01] マルチドメイン推薦のための協調知識グラ…

アイテム埋め込みの正規化が推薦頻度に与える影響を調べてみた

はじめに 背景: 正規化の有無で内積ベースの類似度は変わる → レコメンド結果はどう変わる? DMM のレコメンド - Two-Tower モデルによるレコメンド ベクトルの長さは推薦頻度に影響する 単純なモデルで影響を調べてみた 実験設定 比較するモデル 結果: アイ…

データ組織へのClaude Code導入と、その後の利用状況

はじめに 導入の概要:Google Cloud基盤を活用した運用 導入経路の詳細 予算管理の詳細 チームでの活用状況 費用管理実績 ✅ 活用できているケース ⚠️ 活用が難しかったケース データ分析特有の課題と技術的解決策 課題1:Jupyter Notebook (.ipynb) のトーク…

MCP Toolboxで実現する、BigQueryとLookerを用いたデータ分析の効率化

1. はじめに 2. 背景 データ分析における課題 3. MCP Toolbox for Databasesを導入 Toolboxの概要 BigQuery / Lookerで利用可能なツール BigQueryで利用可能なツール Lookerで利用可能なツール セットアップ 動作確認 4. MCP Toolbox for Databasesの業務活…

BigQuery自動キャンセルで社内データ基盤のコスト最適化

1. はじめに 2. 背景と目的 3. 機能概要 3.1 Airflow を中心にした実装 3.2 キャンセル処理の流れ 3.3 キャンセル後の通知 3.4 キャンセル除外対象 4. 運用の成果 5. まとめ 1. はじめに こんにちは。開発統括本部 データ基盤開発部の林 沛萱(リン ペイ シ…

DMMデータサイエンスグループがRecSys 2025に参加しました!

はじめに RecSys 2025 概要 開催概要 印象に残ったセッション・発表 菊谷パート LONGER: Scaling Up Long Sequence Modeling in Industrial Recommenders 概要 グローバルトークン トークンマージ Hybrid Attention 推論時のKVキャッシュ 実験 感想 寺井パー…

SIGIR 2025に参加しました! DMMデータサイエンスグループ

はじめに SIGIR 2025の概要 各自が印象に残ったセッション・発表 基調講演(Keynotes) day1| BM25 and All That - A Look Back(Stephen Robertson) day2| Digital Health(Ophir Frieder) day3| Please meet AI, our dear new colleague. In other words…

その通信、信頼できる?DMMの不正対策が挑んだ“Zero Trust” API制御の設計思想

General 背景 Zero Trust と BeyondCorp コンテキスト・ベースの必要性 不正対策領域への応用 BeyondCorp 処理フローと 4種の主要コンポーネント 最後の部品 Gateway 全体フロー Component 分割の価値 Blacklight の API 制御における モデルと抽象化 段階的…

JSAI2025(第39回人工知能学会全国大会)に参加しました!

はじめに JSAI2025の概要 参加レポート ブース展示 インダストリアルセッション 懇親会 聴講セッション おわりに はじめに 皆さん、こんにちは!データサイエンスグループの平野と菊谷です。 私たちは2024年にDMM.comに新卒入社し、現在はデータサイエンスグ…

DEIM2025(第17回データ工学と情報マネジメントに関するフォーラム)に参加しました!

はじめに DEIM2025の概要 参加レポート 一般発表(技術報告) インタラクティブセッション スポンサー賞 おわりに はじめに 皆さん、こんにちは!データサイエンスグループの平野と菊谷です。 私達は2024年にDMM.comに新卒入社し、現在はデータサイエンスグ…

Google Analytics 4 / Google Tag Managerを活用したエンドユーザー行動ログ取得の取り組み

はじめに CDPグループについて CDPシステム基盤の全体 なぜ GA4 GTMを選定したのか 全体としての選定理由 GTM 選定理由 Google Analytics4 選定理由 CDPシステム基盤の詳細 i3-CDP-Tracking-Tag-API 実際の配信タグ 既存システム Server Container なぜサー…

グロースフェーズのサービスにおけるインハウスデザイナーのすすめ

はじめに 24年の歴史ある「ライブコミュニケーションサービス」 インハウスデザイナーの良いところ 他ステークホルダーとの連携がスムーズ サービスとの距離感が近い データに基づいたデザインができる デザイナーが共通認識を作れる デザイン以外の業務にも…

介入群と非介入群のサンプル数に偏りがあるときの効果検証

はじめに モチベーション データセット 効果検証に用いる手法 X-Learner データの前処理 効果検証 サンプル数に偏りがない場合 サンプル数に偏りがある場合 精度低下の要因 時系列モデルによる効果推定 まとめ さいごに はじめに はじめまして。マーケティン…

アクセス解析ツールで収集したデータをQuickSightで見る

アクセス解析ツールで見えないもの 情報収集と視覚化の機能を分割する 収集したデータと視覚化の実践 まとめ アクセス解析ツールで見えないもの 合同会社EXNOAのプレイヤーPF部の知久です。 本稿では私のチームで行っているユーザ行動解析の一部を紹介したい…

データサイエンスを駆使した事業成長を手がける「Growth Scienceグループ」の正体とは?

はじめに Growth Scienceグループの紹介 検索改善チーム レコメンドチーム アナリストチーム 基盤エンジニア これから実現したいこと 分析手法の紹介 ユースケース 差異分析の考え方 メリット デメリット 応用例 総括 最後に はじめに はじめまして。DMMのGr…

情報を取得し定量化する 〜ポイント有効期限切れお知らせメール〜

こんにちは! ペイメントサービス部 ポイントグループの北澤です。 普段はDMMポイントに関するシステムの開発や保守、ペイメントサービス全体を改善するための共通基盤の開発を行っています。 この記事では、ポイント有効期限切れお知らせメールの効果測定を…

データドリブンデザイン - 共通言語の構築 -

こんにちは。DMM.com デザイナーの根本大地です。DMMではデザインの支援組織に所属。ユーザ行動解析/UIデザイン/フロントエンドなど複数の職能を兼務し、デザインサポート役として、所属組織をまたいでサービスの開発現場における課題解決に取り組んでいます…

DMMにおけるユーザーレビュー基盤の変革(データ駆動戦略を実現する『三種の神器』編)【Developers Summit 2019】

はじめに 登壇内容 プロダクトがGrowthする流れ データ駆動戦略についての『Why / What / How to』 ユーザーレビュー基盤について データ駆動戦略を実現する『三種の神器』 データ分析基盤 優れた指標 高速にデータ駆動で計測→学習するための開発プロセス ま…

DMMにおけるユーザーレビュー基盤の変革(プロダクトをGrowthさせるデータ駆動戦略編)

はじめに なぜ、データ戦略が必要なのか 優れた指標でないとデータは『駆動』しない。 優れた指標の種類 DMM.comにおけるユーザーレビュー基盤のデータ駆動について コホート分析・A/Bテストから仮説の糸口を見つける まとめ 最後に はじめに こんにちは、プ…