SRE

re:Invent 2025 で見えた、AI 時代の開発ロール再編と SRE の再定義

はじめに 個別最適の限界と、AIによる強制的な標準化 re:Invent キーノートで示された Frontier Agent という未来 re:Invent で実際に試した AI エージェント AWS DevOps Agent AWS Security Agent AWSの方とのディスカッションで深まった AI DLC の現実感 …

オブザーバビリティ成熟度モデルをGitHub公開!明日から使える評価フレームワーク

SRE

はじめに これまでの取り組みの流れ 第1段階:社内での実践と評価 第2段階:外部カンファレンスでの知見共有 第3段階:GitHubでの完全公開 なぜ公開したのか 1. 外部への貢献:明日から使える実用的なツール 2. 自社への学び:多様な視点からの発展 公開した…

ボットからのアクセスで負荷が偏るケースを発見しました

はじめに 急にレスポンスタイムが悪化した 問題のリクエストの特定を試みるが失敗した スティッキーセッションを無効化するため、Blue/Greenデプロイメントへ移行する ECSの組み込みBlue/GreenデプロイメントはDMMブックスと相性が良くない ALBのリスナール…

Observability Conference Tokyo 2025に登壇しました!オブザーバビリティ成熟度モデルの実践事例を共有

SRE

はじめに Observability Conference Tokyo 2025とは 発表内容 発表資料と詳細ブログ 当日の様子:会場の熱気と参加者の反応 Ask the Speakerコーナーでの対話 SNSでの反響と外部からの評価 登壇を通じた学びと気づき 発表準備での苦労と工夫 本番で意識した…

KubeCon + CloudNativeCon Japan 2025に参加しました!

はじめに KubeCon + CloudNativeCon Japan 2025 とは レポート Kubernetes SIG Node Intro and Deep Dive そもそも SIG Node とは何か In-Place PodResize (インプレース Pod リサイズ): Sidecar Containers (サイドカーコンテナ): DRA (Dynamic Resource Al…

DMM全体のオブザーバビリティってどのレベル?成熟度評価で分かったこと

SRE

はじめに 第1章:なぜオブザーバビリティ成熟度評価を始めたのか オブザーバビリティとは 私たちDMM全体が抱えていた課題 SRE部が主導した理由 成熟度評価を採用した理由 第2章:オブザーバビリティ成熟度モデルの構築 モデル設計の方針 評価項目の構成 オブ…

DMMオンクレにおける動画ストリーミング方式の進化

自己紹介 1. はじめに 2. Motion JPEGの採用とその背景 3. HLSの基本構造とキャッシュ戦略 キャッシュ戦略 4. 最終構成と移行方針 CDNを活用した移行方針と最終構成 一度はリリースしたS3ベース構成 その他の構成検討 CloudFront VPC オリジン + CloudFront …

【ラスベガス出張】DMMの新卒2人が行く! Google Cloud Next 25 @Las Vegas

はじめに レポート Opening Keynote: The new way to cloud Maximize your cloud ROI- A practical approach to efficiency and optimization. Observability(可観測性)について Developer Keynote 「You Can Just Build Things」 GKE turns 10 and looks to…

ECSタスクの停止理由をログに残しましょう

はじめに なぜECSタスクの停止理由をログとして保存するべきなのか? New Relic や Datadog にECSタスクの停止ログを送信する方法 Terraformを使った実装例 1. Amazon Data Firehose 用のIAMロールの作成 2. Amazon EventBridge 用のIAMロールの作成 3. Amaz…

AWS NAT Gatewayの通信分析とコスト最適化

はじめに 背景 NAT Gatewayの通信分析 調査のために必要なリソース構成 調査1: AWS内の通信 AWS内通信の調査結果例 調査2: AWS以外との通信 AWS以外との通信調査結果例 NAT Gatewayの通信量削減案 案1: VPCエンドポイントの作成 案2: 通信内部化 案3: VPC Pe…

DMMにおけるNew Relic導入と社内情報発信の取り組み

はじめに New Relic導入活動の背景 New Relicとは? 社内への情報発信活動 1. New Relicを活用するための社内勉強会 2. New Relicに関する社内情報発信 1. おすすめ機能紹介 2. アップデート情報 3. メンテナンス情報 3. Slackでのサポート体制 今後の取り組…

Amazon ECRプルスルーキャッシュを使ってみた

はじめに ECRのプルスルーキャッシュリポジトリとは プルスルーキャッシュリポジトリ機能の全体イメージ プルスルーキャッシュ機能を使いはじめる前に確認すること (1)NAT 経由のイメージpull通信コスト (2)プルスルーキャッシュ機能利用時のストレー…

研修からSREチームでの業務まで!EXNOA新卒1年目が経験したこと

はじめに 入社後の研修 全体研修 技術研修 配属後から今まで オンボーディング CEDEC参加 サービス稼働状況の監視 社内使用プログラミング言語のバージョン更新 社内向けサービス構築への参画 おわりに はじめに こんにちは!24新卒としてEXNOAに入社した、…

CloudRun + BigTableパフォーマンスチューニング

はじめに 背景 対策 LoadBalancer CloudRun Application BigTable まとめ はじめに マーケティングテクノロジー部の田中翔です。 マーケティングテクノロジー部で開発/運用している配信システムでは、Google Cloud CloudRun + BigTableを使用しています。 今…

開発生産性Conference2024 登壇レポート - 開発生産性向上のための監視運用の改善 -

はじめに 開発生産性Conferenceとは 登壇内容 開発生産性向上のための監視運用の改善 登壇の様子 New Relic様とのディスカッション ディスカッションの様子 SNSでの反応 おわりに はじめに こんにちは! ITインフラ本部 SRE部の湯浅です。 2024年6月28日、29…

Workload Discovery on AWS を運用に組み込んでみた

SRE

Workload Discovery on AWS を運用に組み込んでみた 経緯 Workload Discovery on AWS とは? 主な機能 導入概要 実践的な使用例 アーキテクチャ図作成 1. リソース情報をインポートする 2. Diagram を作成する 3. Diagram を修正する 4. Diagram をファイル…

手間いらずで最新保守 Renovateによる依存関係の自動化術

SRE

Renovate とは? 主な機能 導入概要 実践的な使用例 ベストプラクティスと注意点 まとめ こんにちは。ITインフラ本部 SRE部の庭野です。 今回は、私たちSRE部で運用管理しているプロジェクトの依存関係更新作業を自動化するツール、Renovateについて紹介しま…

GuardDutyのMalware Protectionを導入してみました!

はじめに GuardDutyのMalware Protectionを導入してみた Malware Protection とは Malware Protectionのサービス仕様 Malware Protectionの仕組み 利用料金 検出対象 EBSの暗号化方法によるスキャンの可否 ECS 実行環境によるスキャンの可否 Malware Protect…