タグ

Rとmathに関するteddy-gのブックマーク (2)

  • 非負値行列因子分解(NMF)によるレコメンドのちょっとした例 - About connecting the dots.

    最近線形代数についていろいろ読みなおしたりしてるのですが(線形代数チートシートを前の記事でまとめてあります),その一環でレコメンドアルゴリズムについていくつか試してみたので,それを解説します.順序としては,基の協調フィルタリング(ユーザベースド,アイテムベースド)→特異値分解(SVD)→非負値行列因子分解(NMF)になります. 基的な考え方 ここで取り扱うのは,すべて以下のようなユーザ×商品のマトリックスをベースとしたレコメンドになります*1.ここでは映画レンタルサービスを例にして考えます.6人のユーザが,4つの映画*2のうちレンタル視聴したものについては,1-5点の5段階評価を行いました.0になっているものは「みていない」ということになります. まずはざっと評価の状況をみると,「千と千尋の神隠し」が最もよく視聴されていて,6人中4人がみています.次にみられているのは「となりのトトロ」

    teddy-g
    teddy-g 2016/03/01
    アイテムベース、ユーザベースのレコメンドの基本手法から、SVD&NMF使う方法まで簡潔に説明。アイテムの類似性×ユーザプロファイルでレコメンドする際に、SVD或いはNMFでプロファイルを再構築する感じ。
  • 相関係数の有意性を確かめる方法について -相関係数について1歩踏み込む- - Data Science by R and Python

    相関係数とは? 相関係数については、8月のエントリーを参照してもらうと良いかと思います。 「相関係数」ってなんですか? -意味と利点と欠点をわかりやすく- - Data Science by R and Python 簡単に説明しておくと、相関というのは「2つの変数の間に存在する、直線的関係」を指しています。相関係数というのは、その直線度合いを0~1の数字で表したものと言えます。ただし、値には大小関係しかありません(相関係数0.8は、相関係数0.4のときよりも2倍相関が強いという意味ではないので注意してください)。 さて、データの分析・解析に関わらず、いくつかの変数があるデータでは、相関係数を計算して、変数の間に関係があるかをチェックするのが一般的です。前のエントリーにもあるようにこれは「直線的な関係」しか調べられないですし、色々と制約もあり、いちいち確認するのは面倒ですが、それでも使い勝

    相関係数の有意性を確かめる方法について -相関係数について1歩踏み込む- - Data Science by R and Python
    teddy-g
    teddy-g 2016/03/01
    相関係数が有意かどうかを調べるためにK-S検定を使う。∵有意なら正規分布に沿ってるから。他にヒストグラム作ってビジュアルに確認する、Q-Qプロットを描くという手法も。
  • 1
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy