山下寛人オフィシャルブログ

オイシックス株式会社 執行役員 システム本部長 山下寛人の公式ブログです。

分散度合いを可視化する

あらかじめお断りしておきますと、題名の件を考え中で、答えはありません。

レコメンデーションのロジックを考えています。購入している人を似ているものどうし分類します。同じグループの中で注文されている商品のランキングを作り、その中でまだ買ったことがないものを推薦するという方法を考えます。

このとき、顧客単価が高い場合だとどの人も広範囲にいろんなものを買っていて、全体売上ランキングとだいたい似通った形になることが予想されます。顧客単価が低い人はいろいろなグループに分かれ、この方式のレコメンドが効きそうです。例えば野菜しか買わないグループ、お惣菜しか買わないグループ、嗜好品中心のグループなど。

それを検証するために実際の購買データから注文するカテゴリーが人によってどれくらい偏りがあるかを調べたいと思います。一回の注文で平均何カテゴリーを注文しているか調べれば単価が高い層と低い層で違いがわかりそうです。しかしこれは調べなくてもほぼ確実にそうだと思います。なんかプロットして点の集まり具合がわかるような感じにできないかと思いますがいいやり方が思い浮かびません。思いついたらまた書きます。誰かわかる人いませんか?