サイト横断型レコメンデーションシステムの構築 【コンテンツ配信事業者様】
コンテンツ配信事業者様
情報通信業
- IT・情報通信業
- クラウド活用
- システム開発
- 業務改善
プロジェクト概要
クラウドを活用したサイト横断型のレコメンデーションシステムを構築しました。
各サイトのレコメンド仕様の策定からフォーマットの統一化、リアルタイムに収集・分析・生成を図る仕組みなど、企画提案から実装、そして運用後の改善までプロジェクトに参画しました。
開発の背景
音楽・電子書籍等の大規模コンテンツサイトを複数運営しユーザーの行動ログデータを各サイト毎に活用しているが、サイトを横断する形式ではデータを有効に活用できていない。
システム要件
- サイトと横断する形でのおすすめ商品、いわゆる『レコメンド機能』を搭載する
- 各サイトに蓄積されたユーザーの行動ログデータとアウトプットするルールを統一
- 今後の拡張性を見据えクラウドにて動作するシステムを構築
- 収集対象となる行動ログデータは4,000万件程度を想定
- レコメンド機能の表示は200万強/日のアクセスを想定
システム構成図
開発ツール・環境など
- AWS
- Java
- Tomcat
- Nginx
開発体制・期間
- 体制:
統括PM:1名
PM:1名
MEM:12名 - 期間:2014年7月~2014年12月
設計・運用のポイント
- ログデータ解析のためのアーキテクチャとして、「Apache Mahout」を採用。
- 「Apache Mahout」の機能を活用し、協調フィルタリングによるビッグデータの解析を実現。
- レコメンド情報の提供。
- 各サイトに対して、協調フィルタリングによる解析で生成されたレコメンド情報を提供するための Web API をクラウド環境上に構築。
- Web API はサイト側の要求を HTTPS で受け、処理結果をJSON形式のデータとして返却。
- Web APIのフロントとしてNginxを採用。大量アクセスへの対処は、Nginx のキャッシュ機能を活用することで解決。