Content-Length: 283472 | pFad | https://b.hatena.ne.jp/gologo13/20100525#bookmark-2791882
データ http://dl.dropbox.com/u/2996612/idf.txt.bz2 集計条件 品詞は細分類を無視 文書数はタイトルの行数とし、空の文書*1でもカウントを行っている*2 定義式 : 単語のIDF値 : 総文書数 : 単語が出現する文書の総数 文書数、異なり単語数 総ドキュメント数 123,7429 単語異なり数 216,9308 データ形式と例 タブ区切り データ例 形態素 品詞 idf値 あいぞう 名詞 6.09252 あいぞめ 名詞 5.01334 あいた 感動詞 4.58737 あいたい 名詞 4.46927 あいだ 名詞 2.82231 *1:WP2TXTの変換によって本文がなくなる場合がある *2:めんどくさかったので・・・ データ 1-gram http://dl.dropbox.com/u/2996612/1gram.bz2 2-gram http:
Information Theory, Inference, and Learning Algorithms (Hardback, 640 pages, Published September 2003) Order your copy Price: £35.00 / $60.00 from |CUP UK/USA| |amazon.co.uk/.com/.ca/.co.jp| | Barnes & Noble USA | booksprice. | fetchbook.info | allbookstores | biggerbooks | blackwells | directtextbook | kalahari.net (South Africa) | Special Paperback edition for South Asia.| Download the book too
(追記:2009/03/25) id:tokuhirom さんからコメントを頂きました。このベンチマークは問題があるそうです。 http://d.hatena.ne.jp/higepon/20050615/1118829090#c (追記:終わり) PerlにはC言語で書かれた関数を呼び出すためにXSという仕組みが存在します。 一部CPANモジュールでも使われているためご存知の方も多いと思いますが、今回はこのXSの簡単な利用方法を紹介したいと思います。 なおXSは、はてなでも使用しています。 さてXSモジュールを使うとうれしい事は C言語で書くことにより、処理が高速になる可能性がある 既存のC言語ライブラリ資産をPerlから利用することができる Perlがあまり得意でない、メモリ内などに存在するビット単位での細かなデータ構造を、あれこれできる などが挙げられると思います。 今回は、高速化に
Theory of Alignment Generators and Applications to Statistical Machine Translation Raghavendra Udupa U. Hemanta K. Maji IBM India Research Laboratory, New Delhi {uraghave, hemantkm}@in.ibm.com Abstract Viterbi Alignment and Decoding are two fundamen- tal search problems in Statistical Machine Trans- lation. Both the problems are known to be NP- hard and therefore, it is unlikely that there exists
【永久保存版】これからiPadを買う人へ...覚えておきたい便利技10選2010.05.24 17:00 iPhoneユーザーなら迷わず使えちゃいそうですね... いやいや、iPad革命が非PCユーザー層の高齢者や子どもたちにまでも及ぶとはよく言ったものですが、でも、バリバリのパワーユーザーだからワクドキなiPadでもありますよね。とにかく買ってからすぐに使いこなしたい! でも、あんまりハウツー物なガイドブックとかマニュアルとかを読みあさって習得していくっていうのもなぁ。 そんなあなたへ、iPad大好きなギズ編集部から、とっておきのティップスを厳選10技に絞ってご紹介いたしませう。そんなのとっくに知ってるさって読者の皆さまも多いんでしょうけど、まずは導入編ということで、ぜひ1度はおさらいの意味でも続きからご覧くださいませ。 1. フリーズした時のリセット方法 意外と知らなかったりする困った
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "階層構造" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2011年11月) 階層構造(かいそうこうぞう、英語: hierarchy、ヒエラルキー)は、ある事象や認識対象の構造が、高層建築物のように、各階を、下層から上層へと順に積み重ねて全体を構成している場合の構造である。あるいは、積み木構造ともいえる。 また、ある要素が複数集まることでひとつのユニット(集合体)を形成し、そのユニットが複数集まることでさらに大きなひとつの大ユニットを形成し、その大ユニットが……という構造も、階層構造である。 階層構造を特徴づける性質は、高次の階層は、
現在、意味解析の結果である文の意味の内部表現としては、 格フレーム による記述がよく用いられている。格フレームとは、動詞を基準として、取り 得る格とその値に関する制約を記述したものである。格の種類としてFillmore は表3のようなものを考案した。 表 3: Fillmoreの格システム 例えば、図8に示すように、動詞buyは動作主・対象格が必須で、 補助的に場所格・時間格をとって、``My brother bought a pen yesterday.'' のような文を作ることができる。この場合、brotherがperson、penがthing、 yesterdayがtimeの各属性を満たすことを確認した後、フレームに単一化する ことで、意味的に不適合な文を排除できる。 このような格は動詞毎に作るのが確実であるが、同じような格を取る動詞をグ ループ化する方が一般性がある。さらに進んで
格文法は、動詞(さらには形容詞・名詞)とその深層格(動作主・場所・道具のような意味役割)との組み合わせから成るものとして文を分析しようとする理論である。 フィルモアによれば、動詞はそれぞれいくつかの深層格を選択し、それらは格フレームを成す。格フレームはその動詞の意味的結合価の重要な側面を記述するものである。格フレームには、例えば一つの深層格は一文に一つしか現れないなどの制約がある。格には義務的なものと随意的なものがあり、義務的格を削除すると非文法的になる。例えば Mary gave the apples はこの意味で非文法的である。 格文法の根幹をなす仮説は、主語や目的語のような文法役割は深層格に依存して決まるということである。フィルモアは1968年の論文で、主語の選択に関する普遍的規則として次のような階層を提案している: 動作主 (Agent) > 道具 (Instrument) > 対
英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Grammatical case|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説
Welcome to the Carnegie Mellon Speech Group website! Our group explores different facets of automatic speech and auditory processing. Our group has a long and interesting history, from the first working Speech Understanding System demonstration in 1972 though various first and innovations. Today the group encompasses research from signal analysis to spoken language understanding.
出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。 記事の信頼性向上にご協力をお願いいたします。(2024年11月) モンタギュー文法(モンタギューぶんぽう、英語: Montague grammar)は、自然言語の意味論へのアプローチの一つ。アメリカ合衆国の論理学者リチャード・モンタギューの名を採って名付けられた。 モンタギュー文法は形式論理学、特にラムダ計算と集合論にもとづき、内包論理とタイプ理論も利用している。モンタギューはこのアプローチを1960年代から1970年代の初頭にかけて率先した。 モンタギューによれば(英語のような)自然言語の意味論と(述語論理のような)形式言語のそれとの間に本質的な違いはない。モンタギュー文法の中心的な概念は論文 "The Proper Treatment of Quantification in Ordinary En
W3C Recommendation 16 March 2004 This version: http://www.w3.org/TR/2004/REC-speech-grammar-20040316/ Latest version: http://www.w3.org/TR/speech-grammar/ Previous version: http://www.w3.org/TR/2003/PR-speech-grammar-20031218/ Editors: Andrew Hunt, ScanSoft Scott McGlashan, Hewlett-Packard Contributors: See Acknowledgements Please refer to the errata for this document, which may include some norma
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く
Fetched URL: https://b.hatena.ne.jp/gologo13/20100525#bookmark-2791882
Alternative Proxies: