[B! OCR] John_Kawanishiのブックマーク

PDFファイルの文字をコピーできるように変換する方法【今日のワークハック】 | ライフハッカー・ジャパン

ChatGPTは「努力の必要性をタイムリープさせるツール」。#100日チャレンジで人生が変わった大塚あみさんのAI活用術【使える!AIワークハック】

John_Kawanishi 2025/02/20

PDF
OCR

リンク

OCRはもう不要？視覚的特徴とテキストを高精度に捉える！次世代マルチモーダルAIモデル『MPLUG-DOCOWL2』登場！ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです！今回は、PDF解析とドキュメントインテリジェンスの最先端技術「MPLUG-DOCOWL2」について、解説していきます。このモデルは、高解像度のマルチページドキュメントを効率的かつ正確に解析する技術として注目されています。特に、従来のOCR（光学文字認識）ベースの解析手法が抱える課題を解決し、従来のOCR技術を必要とせず、新しい水準の性能と効率を実現しました。この記事では、技術的な背景、MPLUG-DOCOWL2の構造と革新性、他の技術との比較、そして具体的なデモンストレーションを交え

John_Kawanishi 2024/11/19

AI
OCR

リンク

スマホの写真に映ったテキストをPCにコピーできたら便利！実はWindows 11標準で可能／「スマートフォン連携」の簡易OCRを試す【やじうまの杜】

John_Kawanishi 2024/10/05

iPhone
OCR

リンク

【Excel】PDFや画像を見ながら表を手入力する時代は終わった！画像認識を活用しよう【いまさら聞けないExcelの使い方講座】

John_Kawanishi 2024/08/18

Excel
OCR

リンク

【Excel】PDFや画像を見ながら表を手入力する時代は終わった！画像認識を活用しよう【再掲】【今すぐ読みたい！人気記事】

John_Kawanishi 2024/08/16

Excel
OCR

リンク

無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

John_Kawanishi 2024/02/11

リンク

【Excel】PDF上の表は手入力しなくても簡単に取り込める！紙のスキャンデータでも大丈夫【いまさら聞けないExcelの使い方講座】

John_Kawanishi 2023/10/19

リンク

無料のOCRフリーソフト14選！PDFや手書き文字をテキスト化

OCR（光学認識技術）とは、紙文書のデータを読み込んでデジタル化する技術のことです。日本のオフィスワーカーの生産性向上を阻む壁のひとつに、大量の紙文書の存在があるとされており、OCRの活用がその解決につながると期待されています。ただ、新たなソフトウェアや技術を導入する時に、まずはスモールスタートで始めてみたいというニーズはあるでしょう。そうした方におすすめしたいのが、フリーソフトの活用です。 OCRのサービス・企業の一覧ページ OCRの仕組み 104サービスをマッピング！AI-OCRカオスマップを無料プレゼント OCRのフリーソフトについてご紹介していく前に、まずはOCRの仕組みについて詳しくみていきましょう。一般的なOCR処理の場合、スキャナーでスキャニングするだけで実行されるわけではありません。スキャニングを行った後にOCRの専用ソフトを使用してテキストを抽出し、ドキュメントとして出

John_Kawanishi 2023/10/19

OCR

リンク

無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する

はじめに日々の業務作業で、画面や画像を見てその内容によって、その後の作業の流れや結果を変更する場面があります。そういった業務作業をPower Automate for desktopで自動化する際に、OCRのアクションを利用できます。今回は、文字列が含まれた画像ファイルが複数入ったフォルダーを用意して、その中の各画像の文字列を抽出するサンプルフローを作成します。［注意］アクションには、MicrosoftコグニティブのOCRの機能もありますが今回は使用しません。Azureアカウントなどは不要です。「ファイル選択ダイアログ」アクションの後に「OCRを使ってテキストを抽出」アクションを使用するとデッドロックしてフリーズしてしまう問題があるようですので、ご注意ください。フォルダー／素材の準備まずはOCR読み込みのもととなる画像ファイルと、サンプル実行に必要なフォルダーを準備します。

John_Kawanishi 2023/10/19

リンク

岸本元 on X: "国会図書館デジタルコレクションで「ドラゴンクエスト」と検索すると、大正11年に刊行された『本居宣長稿本全集』がヒットする。いくらなんでも大正時代の本居宣長の本にドラクエの話は書かれてないだろと驚いたが、何者かが原本に落書きしたのを読み取ったようだったhttps://t.co/t2DHCNuxgK https://t.co/3oMcKg6yvs"

John_Kawanishi 2023/03/04

リンク

《2022年決定版》AI OCRツールのおすすめ5選を比較！選び方のポイントも紹介 | AI専門ニュースメディア AINOW

最終更新日： 2022年2月8日近年、DXを推進する企業が増えています。 DXを実現するためには、紙などのアナログデータをデジタル形式に変換するプロセス、いわゆる「デジタイゼーション」が欠かせません。 ▼ DX（デジタルトランスフォーメーション）について詳しくはこちら

John_Kawanishi 2022/09/22

AI
OCR

リンク

Windowsでもついに画像内のテキストコピーが可能に！ | ライフハッカー・ジャパン

サンディスクのmicroSDカード 512GBが40%OFF。写真や動画のデータ置き場はこれで良くない?【Amazonセール】

John_Kawanishi 2022/09/20

OCR

リンク

画像からテキストを抽出～「PowerToys」に簡易OCR・物差しなど3つの新ツール／「PowerToys 0.62.0」が公開

John_Kawanishi 2022/09/08

精度はソコソコだかエビデンスから文字や数字を読んで書くのに助かる

リンク

画面の表示内容を文字起こし！　「Microsoft PowerToys」向けOCR機能の開発が進行中

MicrosoftがWindows 11向けにリリースしている公式ユーティリティーアプリ「PowerToys」に、画面の表示内容や画像ファイルに含まれる文字を読み取る「OCR機能」が追加される予定だ。現在、実装に向けた作業がGitHub上で進められている。 PowerToysは、ディスプレイの指定した位置にウィンドウをスナップ配置できる「FancyZones」や複数のファイル名を一括で変更できる「PowerRename」、右クリックメニューから画像サイズを変更できる「Image Resizer」など、複数のユーティリティーを内包している。開発が進められているOCR機能もユーティリティーの1つとして開発が進んでおり、画面内の指定された領域または画像ファイルに含まれる文字を認識してテキストとして取り込めるという。画像ファイルのOCR機能は、GoogleのWebブラウザ「Chrome」でも「

John_Kawanishi 2022/08/21

｢画像FileのOCR機能はGoogleのWebBrowser｢Chrome｣でも｢Google Lens｣として実装されている.それに対してPowerToysに実装される予定の機能は任意のAppsで利用できることが大きなMeritである｣

リンク

Optical Character Recognition (OCR) for Windows 10

Optical Character Recognition (OCR) is part of the Universal Windows Platform (UWP), which means that it can be used in all apps targeting Windows 10. With OCR you can extract text and text layout information from images. It’s designed to handle various types of images, from scanned documents to photos. At the same time, it is highly optimized and runs entirely on the device without requiring an I

John_Kawanishi 2022/08/20

リンク

PowerToys、画像から文字を抽出できる機能を開発中

John_Kawanishi 2022/08/18

リンク

読み取り精度100%が不可能と認め、失敗に備えユーザー体験を磨き込む話 - LayerX エンジニアブログ

どうも！バクラクでOCRの開発を担当する高際 @shun_tak です！バクラクでは「圧倒的に使いやすいプロダクトを届け、ワクワクする働き方を。」というプロダクトビジョンを掲げて開発しています。バクラクビジョン note.com そんなバクラクでは文書のデータ化を支援するため、文書の読み取り機能＝OCR機能を提供しています。これにより、多様なレイアウト・大量の文書も瞬時にデータ化することができます。以下、瞬時に読み取られる様子 youtu.be OCRで読み取ってデータ入力されるだけでも使いやすいプロダクトになっているかなと思いますが、この記事ではさらに一歩踏み込んで、「圧倒的に」使いやすくするための工夫の一端をお見せしたいと思います。前提：請求書OCRで解きたい問題請求書OCRは、経理に届く支払請求書を読み取ってデータ化します。データ化したい項目は、「いつまでに、だれに、いくら

John_Kawanishi 2022/07/13

OCR

リンク

Windows版「Excel」に画像認識機能、紙の書類からテーブルデータの取り込みが簡単に／ただし、日本語のサポートは……

John_Kawanishi 2022/06/15

｢ただし、本機能は日本語をサポートしていないので注意。編集部にて試用したところ機能自体は利用可能で、UIも日本語に翻訳されているが、テキストの認識は製品レベルではないようだ｣

excel
OCR

リンク

紙資料の表をExcelのデータに変換する方法。Officeのスマホアプリでスキャンできる

新聞や書籍、パンフレットなど、紙の資料に印刷された表をデジタル化したいときは、iPhoneやAndroid、Chromebookで使える［Office］アプリが便利です。表の構造や内容を読み取ってデータを自動生成し、Excelの表に変換することができます。スマートフォンで手軽にOCRができるパソコンで作成中のビジネス文書の中に、紙の資料のデータを引用したいことがあります。例えば、新聞や書籍、パンフレットなどに掲載されている表が該当します。そのようなとき、普通なら紙資料を見ながら手入力しようと思いますが......実は、もっとスマートな方法があります。iPhoneやAndroidスマートフォン、そして最近人気のChromebookでも使えるアプリを使いましょう。 Microsoftの提供する［Office］アプリには、紙資料をきれいに写真（画像）として読み取るスキャン機能に加えて、その