[B! ir] nhayatoのブックマーク

irに関するnhayatoのブックマーク (8)

検索エンジンはいかにして動くのか？記事一覧 | gihyo.jp
運営元のロゴ Copyright © 2007-2025 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。
nhayato 2014/10/07
ir
リンク
Elastic — The Search AI Company
Search and analytics, data ingestion, and visualization – all at your fingertips.
nhayato 2013/09/25
ir
リンク
Real World Recommdnder - 現実世界の推薦システムにおける、精度と速度以外の話 -
自己紹介 d:id:gnarl twitter:todesking いちおう情報系興味プログラミング言語処理系ソフトウェア・アーキテクチャ(オブジェクト指向設計とか) 機械学習(ニワカ) 推薦エンジンを作ってるチームに所属してます最近の仕事: javaでニュース記事の特徴語を解析して云々 ruby+sinatraでなんかつくる仕事アジェンダ(1) 推薦システムとはなにか推薦システムの種類コンテンツベース、行動ベースユーザ-アイテム、アイテム-アイテムモデルベース、メモリベースこの辺の話は皆さんのほうが専門家ですね…… 省略しますアジェンダ(2) 推薦システムの精度をはかる MAE/RMSE Precision, Recall 推薦システムの抱える問題点スパースネスの問題コールドスタートの問題この辺の話を長々とすると会場の研究者にしらけた顔をされる…… 省略します
nhayato 2013/07/08
研究

ir
リンク
true positive, false positive, true negative, false negative
true positive, false positive, true negative, false negative 2008-06-22-2 [IIR] 情報検索や機械学習や自動分類なんかでよく出てくるんだけど、未だに頭が大混乱してしまう true positive, false positive, true negative, false negative の話題。「Introduction to Information Retrieval」の第8章[2008-06-22-1]に出てきます。まずは、 8.3 の表： RelevantNonrelevantRetrievedtrue positives(tp)false positives(fp)Not retrievedfalse negatives(fn)true negatives(tn) 輪講参加者から覚え方を教えて頂
nhayato 2012/11/17
ir
リンク
検索における適合率 (Precision) と再現率 (Recall)
検索における適合率 (Precision) と再現率 (Recall) 2008-01-17-1 [IIR] 「Introduction to Information Retrieval」[1] の輪講の第一回[2008-01-12-1]でちらっと話しましたが、第一章の 1.1 に Precision と Recall の説明があります（第八章でも出てきます）。若干混乱しやすくややこしい話なので、ここで改めて解説します。 § Precision (適合率) とは、全検索結果に対しての、検索要求 (information need) を満たす検索結果の割合です。例えば、「MacBook Air の重量を知りたい」という検索要求を満たすために検索キー「MacBook Air 重さ」でウェブ検索した結果100件のうち、検索要求を満たす（重さが分かる）のが85件だとすると、 Precis
nhayato 2012/11/17
ir
リンク
語の共起情報を用いたWeb検索
概要現在、Web上の莫大な情報の中から、ユーザが必要な情報を得る手段として検索エンジンが広く用いられている。各検索エンジンでは、検索結果を順位付けし、一般的に評価の高いWebページを検索結果の上位とすることで効率化を図っている。しかし、有用であるということは主観的であるため、一般的に評価の高いページが誰にでも有用であるとは限らない。本研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを得ることで、各ユーザの要求により適合した結果を提示する検索方法を提案する。従来手法重要語抽出の従来手法多くの自然言語文書処理において用いられている代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。対象
nhayato 2012/11/01
ir
リンク
Mean reciprocal rank - Wikipedia
This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "Mean reciprocal rank" – news · newspapers · books · scholar · JSTOR (June 2007) (Learn how and when to remove this message) The mean reciprocal rank is a statistic measure for evaluating any process that
nhayato 2012/11/01
IR
リンク
HITS, 主成分分析, SVD - naoyaのはてなダイアリー
ウェブグラフのリンク解析によるページの評価と言えば PageRank が著名ですが、もうひとつ Jon Kleinberg による HITS (Hyperlink-induced topic search)も有名です。最初の論文 Authoritative Sources in a Hyperlinked Environment は 1999年です。IIR の 21章で、この PageRank と HITS についての解説がありました。 HITS HITS はウェブページの評価に二つの軸を用います。一つが authority スコア、もう一つが hub スコアです。例えば「Perl の情報が欲しい」という検索要求に対しては CPAN や開発者である Larry Wall のホームページなどが重要度の高いページかと思います。これらのページは「Perl に関して信頼できる情報源」ということ
nhayato 2012/11/01
IR
リンク
1

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

はてなブックマーク

タグ

関連タグで絞り込む (2)

irに関するnhayatoのブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第4週）

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.