Content-Length: 336234 | pFad | http://b.hatena.ne.jp/myrmecoleon/scan/archive/
カナダのトロント大学ロバーツ図書館内にオフィスを構えるInternet Archive Canadaが資金難により75%のレイオフを実施したそうです。全47人のスタッフのうち33人が解雇され、資料のスキャンを担当するスタッフは27人から11人に減ったそうです。その結果、夜間の作業を実施することが難しくなり、スキャンのペースは月1,500冊から250冊に減少すると見られているようです。 Internet Archive Canada branch cuts 75% of staff (The VARSITY 2011/8/18付けニュース) http://thevarsity.ca/articles/46743 Internet Archive Canada Laying Off Most Staff (torontoist 2011/7/14付けニュース) http://torontois
johokanri.jp 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy
電子ジャーナルのアーカイブ事業等を行っている非営利団体Ithakaが、デジタル化した後の紙媒体の雑誌をいつまで保存するかについてのレポートを公表しています。スキャンミスの修正、デジタル資料の保存問題等に対応するために、紙媒体資料も一定期間の保存が必要としており、例えば、上質のデジタル化がなされた文字のみの資料の場合には、最低一部を20年は保存する必要がある、としています。 What to Withdraw: Print Collections Management in the Wake of Digitization http://www.ithaka.org/ithaka-s-r/research/what-to-withdraw Ithaka Reports on How Long To Keep Print Journals(2009/10/1付けLibrary Journalの記
日本HPは、「現存の貴重な芸術文化財を保護するとともに、一般の人々の目に触れる機会の少ない作品を複製することにより、より多くの人々が文化財を理解する機会を持てるように」という趣旨のもと、同社が持つ最新テクノロジーを使って文化財の複製保護=デジタルアーカイブ事業をワールドワイドで手がけている。出力機器にHPのプリンタが使われている写真展や絵画展に足を運んだ人もいるのではないだろうか。 今回公開される「北野天神縁起絵巻(平成記録本)」は、数ある天神縁起絵巻の中において現存最古(13世紀初頭)のもので、秘蔵の「根本縁起」として尊ばれてきた、全9巻から成る国宝「北野天神縁起絵巻(承久本)」の複製版だ。2008年2月に京都の北野天満宮に奉納され、「承久本を平成20年に持ちうる最高の技術を使って記録した本」として「平成記録本」と名付けられた。複製作業では、3900万画素のハッセルブラッド製デジタルカメ
いきなり、JPEG2000だとか、LZWってなヘンテコ話をはじめて、「しんぷるは、とうとう発狂?」と思った方、ちょいとお時間よろしいですか?30秒で、ご説明します。 奥さん、要は布団圧縮パックですよ! (http://www.rakuten.co.jp/silknet/512825/566573/より画像を拝借してますので、ご購入の際は、ぜひ、このリンク先より。ちなみに、単にGoogleで「布団圧縮パック」って入れて出てきたってな関係です。) ってな感じで、パソコンの中の「データ」ってのも一緒。そのまんまだと、パンパンになっちゃうから、ペッタンコにして、たーくさん収納できるようにすんの。 でも、布団圧縮を使った場合、いざ使おうと思ったときに、元の「ふかふか」に戻らなかったら、ガックシだよね。同様に、画像データってのも、使おうと思ったときに、元の状態に戻ってくれないと困るわけ。 かと言って、
Universal Library Projectという国境を越えた壮大な取り組みによって、100万冊を超える書籍がデジタル化された形で無償提供されている。中国、インド、エジプト、米国の各研究者によるこの共同プロジェクトの最終目標は、すべての出版物のデジタル化、地理的および社会経済的な境界に縛られない情報参照の実現、技術的な発展基盤の提供、出版物の時流を超えた保存にある。 現在、中国語、英語、アラビア語、インドの各種言語など、20以上の言語にわたる150万冊の書籍が1つのWebポータルから参照できる。このオンライン図書館には、世界中の私有および公的なコレクションの希少書や絶版書も含まれる。 「著作権が切れて忘れられている書籍はたくさんあるが、研究者や学生にとっては有益なものであり、一般の人々にとっても役立つはずだ」と語るのは、著作権の専門家であり、米国カーネギーメロン大学でコンピュータサイ
http://d.hatena.ne.jp/simpleA/20071116#1195171267 超整理すると、こんな感じ。 何回かにわたり、いろんな切り口で、現状整理しまーす。 どんなときも、現状把握が大切。 切り口(1) ビジネスモデル 広告モデル Google 販売モデル Amazon系BookSurge 寄付金モデル Internet Archive ってなわけで、今日のところは、何が言いたいのかって言うと、「書籍の電子化にかかる費用を回収するモデルは、少なくとも3つあり、そのモデルに応じたスキャン対象書籍ってのがあるよ。そして、書籍のスキャン技術が浸透しつつある現在、新たなビジネスモデルが出現する可能性が高いよね。でも、残念ながら、日本では新しいモデルの出現を待つって段階に到達してなくて、かなり遅れちゃってるから、もっと一緒にがんばろうよ」ってこと。 さて、上の3つのモデルは米
インターネット検索サービス大手のグーグルが貴重な書籍のデジタル化に乗り出した。7月に慶応大とデジタル化契約を結び、まずは大学の所蔵本に狙いをつける。 大学は巨額の費用がかかる独自のデジタル化には及び腰で、グーグルとの提携は魅力的だが、文化財の囲い込みにつながりかねないという警戒感も根強い。 グーグルは既に、スタンフォード大、オックスフォード大、ニューヨーク公共図書館など26機関と提携した。図書館側が無償で蔵書をグーグルに貸し出して、グーグルが本をスキャン、デジタル画像として保存・公開する。 アジアで初めて提携した慶応大の場合も同様で、グーグルは、同大が所蔵する著作権の保護期間(著者の没後50年)が終了した蔵書12万冊を読み取り、デジタルデータ化して、自由に検索できるようにする計画だ。 慶応大はこれまでに数億円規模の予算を投じ独自に貴重本10万ページ以上をデジタル化してきた。しかし、実績豊富
ロボットアームを駆使し、『イリアス』最古の写本を3Dスキャン 2007年6月11日 サイエンス・テクノロジー コメント: トラックバック (0) Amy Hackney Blackwell 2007年06月11日 米FARO社製スキャナー付きロボットアームを駆使して写本の3Dスキャンを行なうMatt Field氏。 Photo: Amy Hackney Blackwell スライドショーはこちら(英文) 図書館の棚で千年以上も埃をかぶっていたホメロスの叙事詩『イリアス』の最古の写本が、間もなくデジタル化され閲覧できるようになる。 16世紀から続くベネチアの図書館を研究チームが訪れ、10世紀のものと見られるこの写本の超高精細3Dコピーを作成した。ロボットアームに取り付けたレーザースキャナーによって、写本に残るあらゆるシワや欠損までもが写し取られている。 写本は羊皮紙を用いており、全645ペ
インドのマイソール大学(Mysore University)はGoogleとともに、大学が所蔵する紀元前からの文書8万点をデジタル化し、Google Book Searchで提供する計画を進めているそうです。 Google to Digitize Ancient Texts at University in India http://chronicle.com/news/article/2345/google-to-digitize-ancient-texts-at-university-in-india Google to digitise 800,000 books at Mysore varsity http://mangalorean.com/news.php?newstype=local&newsid=44056#
(必読)ニューヨークタイムズっていう有名な新聞に、『History, Digitized (and Abridged)』ってなタイトルの記事がでてたよ。http://www.nytimes.com/2007/03/10/business/yourmoney/11archive.html?ex=1331355600&en=ac8d2f50c8dfc12d&ei=5124&partner=permalink&exprod=permalink 今日は、その中から一つ。(明日も、もう一つ。(時差の関係上、あさってになっちゃったけど)) この図をみよー。クリックすれば、元のおおきなやつ見れるよ。 右上の方を見ると、Mission Impossibleってコーナーがあるでしょ。 そこによると、米国公文書館(The National Archive)には、90億点の「TEXT RECORDS(書類みたい
(プラプラと旅してたので、ちょっとしたブランクがあったけど、「捨てる」の続きね。) (サンフランシスコなんで)坂道を登りながら、こう考えた。 本を捨てれば悔やまれる。捨てずに残せば床抜ける。 兎角に人の世は住みにくい。住みにくさが高じると、安い所へ引き越したくなる。どこへ越しても住みにくいと悟った時、 床の増強に走る。というわけで、今日は、捨てたくても捨てられない、でも床が抜けるのも困る、ってな欲張りな人向け。 さて、木造の床は、何冊の本まで耐えられるのか?http://oshiete.homes.jp/kotaeru.php3?qid=2537813こちらを信じる限り、8畳の部屋なら、最低2,400kgまでは耐えれるように設計するらしい。(ちなみに、「豊島区の底抜けおじさん」は、最低でも6,000kgは溜め込んでたらしいよ。部屋の広さに関して情報見つからんけど、20畳以上の部屋であるわけ
9月11日に書いたものの続編。 前回の要約 出版された当時は「同じ本」だったものが、汚れたり、書き込みされたり、折られたり、切られたりして、もはや「スキャン」上「同じ本」とは言えないようになってる という感じで、本の状態に注目して「本の大量スキャンプロジェクトにおいては、ダブりなんてないよ」ってことを主張してみた。 今回は、仮に本の状態が全く同じだったとしても、それでも「ダブりなんてないよ」ということを見てみる。特にスキャン画像の傾きとOCRについて注目してみるよ。 fuzzy2さんが、家庭用スキャナとOCRで、小説『涼宮ハルヒの憂鬱』(結構、いろんなところでこの小説の話題を目にするんだけど、いまだに読んだことがない、お恥ずかしい限り。)を電子化して、OCR結果を検討してる。必見。 http://d.hatena.ne.jp/fuzzy2/20060916/p1 http://d.hate
Internet Archiveでどんな作業が行われているのか、を紹介する。(詳細を知りたい人は、こちらを。) 昨日、オークランドに10台のマシンを並べて、スキャン作業をしていることを書いた。 各マシンは、1時間あたり500ページのスキャンをする。 オペレータは2交代制で、1日の時間は14時間。(一人8時間勤務で、途中休憩1時間だと思う。) 1台あたり、1日7,000ページをスキャンすることになる。 10台あるので、1日70,000ページ。 だいたい、こういう場合、1冊は350ページくらいと想定するのが相場なので、1日200冊が電子化されていく。 まぁ、だいたい年間に300日くらいあるので、1年で60,000冊。 彼らの予算は、1冊あたり35ドルくらいなので、年間210万ドル。日本円で約2億円かな。 前に、某S大学が800万冊の蔵書を全てスキャンする予算として、270億円くらいだと言ってい
Internet Archiveの作業は、予定では1日200冊なのに、実際は1ヶ月400冊というペースでしか進んでいないことを紹介した。 今日は、なんでそんなに遅いのか、もう少し詳しく見てみる。 1ヶ月だと、だいたい稼動日として20日ある。すると、1ヶ月400冊というのは、1日あたり20冊。前にも書いたが、マシンは10台あるので、1台あたり1日2冊。しかも2シフトであることを考えると、早番の人は7時間かけて1冊、遅番の人も7時間かけて1冊、って計算になる。 本当にこんなことをしているのか、詳しく調べてみた。 幸い、Internet Archiveは、何でも情報公開するオープンな会社。調べようと思えば、何でも分かる(気がする)。 この本、ページ数としては400ページだが、約40分でスキャン作業を終えている。 なんでこんなことが分かるかというと、 まずこのページに行って、 画面左側にある「Al
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く
Fetched URL: http://b.hatena.ne.jp/myrmecoleon/scan/archive/
Alternative Proxies: