2009年創業。埼玉県川越市一筋のIT企業です。
イー・レンジャー株式会社 電話
イー・レンジャー株式会社 > [クラウド] Google Cloud Next ’17 Toykoに行ってきました

[クラウド] Google Cloud Next ’17 Toykoに行ってきました

最終更新日: 2017/06/15 6:51pm

カテゴリー: クラウド, ディープラーニング, プログラミング, 先進技術

こんにちは。経理の小高です。

昨日(6/14)、Google Cloud Next ’17 TokyoのDay1に行ってきました。

google cloud next 17 tokyo イーレンジャー株式会社

 

G-Suit関連と機械学習関連のセッションを中心にお話を聞いてきました。

一番驚いたのが、Googleの人が「TensorFlow」のことを「テンサーフロー」と呼んだこと、という情けない有様でした。(日本の数学では「Tensor」を「テンソル」と呼びます)

先端的なところだと、リクルートテクノロジーズさんとGMOインターネットさんが登壇したセッションは「共にリコメンデーションシステムについての発表だった」という意味で興味深かったです。

GMOインターネットさんは「Akane」というデジタルマーケティングツール(アドテクノロジー)のお話で、この仕組みの改良にGoogleのサービスを使ったとのこと。

 

リコメンデーションは「協調フィルタリング(collaborative filtering)」という理屈がベースにあって、比較的に枯れた技術領域です。

理屈としては、商品が10万点あってお客様が1万人いる場合、縦軸に商品、横軸にお客様をとった表をつくってお客様の満足度を点数として入れると、10万次元のデータが1万個できます。(このような行列を評価行列 user-evaluation matrix, user-rating matrixといいます)

とてつもない話に聞こえますが、この表(行列)の中で数字(満足度)が入っているセルは(比率として)とても少ないはずで、こういう状況を疎(スパース)といいます。これをコンピュータでグイっと計算して、10万次元を相当数落としちゃうことができます(これを次元縮約といいます)。それがうまくいって、たとえば4000-5000次元くらいのオーダーになると、GPUに収まるのでコンピュータで無理なく行列演算ができます(GPUに収まるというのはかなり重要な要件で、複数マシンで複雑な行列演算(テンソル演算)をクラスタさせるのはアルゴリズム的&システム構成的にかなり大変です。)。そして、この辺りがリコメンデーションシステムを作る際の肝になります。当然、次元を効率的に評価行列の特徴を損なわずに減らせれば、演算速度も削減できますから、繰り返し計算が多かったり、オンライン学習的な処理をするのにとても有利になります。

この辺りにご興味のある方は2013年の私のブログ「Amazon EMRでMahoutのレコメンデーションのワクワク感を体験する:30分でできる分散レコメンデーション」をご参照ください。4年も前の記事ですが基本は同じはずで、「30分でできる」と書いたように「データさえ揃えば(実際にはこれが大変なことです)」基本的なリコメンデーションシステムは、分散環境(BlogではHadoop & 当時のMahout=今のSparkで構築)で結構簡単にできて、クラスターにスケールできます。

こういったバックグラウンドの中でGMOインターネットさんの話が興味深かったのは、次元縮約(パワポにALSと書いてあったので、Alternative Least Squareで次元縮約をしてると思われました)したら、それを特徴量としてディープラーニングに突っ込んだ、という部分。ABテストで2.5倍よくなったとのこと。

ディープラーニングの自然言語処理(NLP)では(評価行列のような)疎なデータ表現から分散表現にデータの表現方法が置き換わってきています。GMOインターネットさんの事例も同じように評価行列(疎な行列)を分散表現化していると解釈できるのではないかな、と思われました。

 

リクルートテクノロジーズさんのお話はApache Sparkのクラスタ+Apache Beamを使って、リクルートグループのサイト横断的なリコメンデーションシステムをつくる、というお話でした。

Google Cloud Platformを使うと「簡単にできますよ」という発表でしたが、機械学習的な部分でもう少し突っ込んだお話が聞けたら楽しかったかな、と思いました。

発表者の方がIEEEに出した論文のタイトルをパワポに出されていて、matrixのfactorialというような意味合いに受け取れたので、行列の分解(次元縮約)に関する研究をされているのかな、と邪推しました。

 

←「」前の記事へ   次の記事へ「」→