運営元のロゴ Copyright © 2007-2025 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。

自己紹介 d:id:gnarl twitter:todesking いちおう情報系 興味 プログラミング言語処理系 ソフトウェア・アーキテクチャ(オブジェクト指向設計とか) 機械学習(ニワカ) 推薦エンジンを作ってるチームに所属してます 最近の仕事: javaでニュース記事の特徴語を解析して云々 ruby+sinatraでなんかつくる仕事 アジェンダ(1) 推薦システムとはなにか 推薦システムの種類 コンテンツベース、行動ベース ユーザ-アイテム、アイテム-アイテム モデルベース、メモリベース この辺の話は皆さんのほうが専門家ですね…… 省略します アジェンダ(2) 推薦システムの精度をはかる MAE/RMSE Precision, Recall 推薦システムの抱える問題点 スパースネスの問題 コールドスタートの問題 この辺の話を長々とすると会場の研究者にしらけた顔をされる…… 省略します
true positive, false positive, true negative, false negative 2008-06-22-2 [IIR] 情報検索や機械学習や自動分類なんかでよく出てくるんだけど、 未だに頭が大混乱してしまう true positive, false positive, true negative, false negative の話題。 「Introduction to Information Retrieval」の 第8章[2008-06-22-1]に出てきます。 まずは、 8.3 の表: RelevantNonrelevantRetrievedtrue positives(tp)false positives(fp)Not retrievedfalse negatives(fn)true negatives(tn) 輪講参加者から覚え方を教えて頂
検索における適合率 (Precision) と再現率 (Recall) 2008-01-17-1 [IIR] 「Introduction to Information Retrieval」[1] の輪講の第一回[2008-01-12-1]でちらっと話しましたが、第一章の 1.1 に Precision と Recall の説明があります(第八章でも出てきます)。 若干混乱しやすくややこしい話なので、ここで改めて解説します。 § Precision (適合率) とは、 全検索結果に対しての、 検索要求 (information need) を満たす検索結果の割合です。 例えば、 「MacBook Air の重量を知りたい」という検索要求を満たすために検索キー「MacBook Air 重さ」でウェブ検索した結果100件のうち、検索要求を満たす(重さが分かる)のが85件だとすると、 Precis
概要 現在、Web上の莫大な情報の中から、ユーザが必要な情報を 得る手段として検索エンジンが広く用いられている。 各検索エンジンでは、検索結果を順位付けし、 一般的に評価の高いWebページを検索結果の上位と することで効率化を図っている。 しかし、有用であるということは主観的であるため、 一般的に評価の高いページが誰にでも有用であるとは限らない。 本研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを 得ることで、各ユーザの要求により適合した結果を提示する 検索方法を提案する。 従来手法 重要語抽出の従来手法 多くの自然言語文書処理において用いられている 代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。 対象
This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "Mean reciprocal rank" – news · newspapers · books · scholar · JSTOR (June 2007) (Learn how and when to remove this message) The mean reciprocal rank is a statistic measure for evaluating any process that
ウェブグラフのリンク解析によるページの評価と言えば PageRank が著名ですが、もうひとつ Jon Kleinberg による HITS (Hyperlink-induced topic search)も有名です。最初の論文 Authoritative Sources in a Hyperlinked Environment は 1999年です。IIR の 21章で、この PageRank と HITS についての解説がありました。 HITS HITS はウェブページの評価に二つの軸を用います。一つが authority スコア、もう一つが hub スコアです。 例えば「Perl の情報が欲しい」という検索要求に対しては CPAN や 開発者である Larry Wall のホームページなどが重要度の高いページかと思います。これらのページは「Perl に関して信頼できる情報源」ということ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く