[B! machinelearning][ai] ma2のブックマーク

日本語OCRを作ったので解説してみる - Qiita

日本語OCRを作ったので詳しく解説してみる GitHub↓で公開中。 https://github.com/tanreinama/OCR_Japanease 日本語OCRとは文字通り日本語のOCRです。OCRとは、画像から文字を認識するプログラムです。前回の記事 https://qiita.com/tanreinama/it ems/e171449e66d5221afe7e 使用するニューラルネットワークこのOCRプログラムのメインは、基本的にはディープラーニングによって作成されたニューラルネットワークの実行です。 OCRに必要となるのは、文章領域・文字の検出用と、文字のクラス分類用の二つのニューラルネットワークです。 Center Line Detection まず、OCRでは、画像中にある文字を全て取り出せば、それで良いわけではありません。文字は繋がって文章となり、ひとまとまりの

ma2 2021/02/26

リンク

Rubyの機械学習ライブラリまとめ

はじめに最近では、機械学習関連Gemが多く開発され、Rubyでも機械学習できるようになってきました。代表的なものを、ざっくりとまとめてみました。まとめ情報いきなりですが、この記事は私の偏見で選んだものですので、他のまとめ情報も紹介します。もっとも大きなのがAndrei Beliankou (arbox) さんのまとめリポジトリです。色んなものが紹介されています。 Rails エンジニアにとっては、SearchkickやStrong Migrationsで有名な、Andrew Kane (ankane) さんも、機械学習関連のGemを多く作成しています。C/C++のAPIが提供されている、他言語の機械学習ライブラリを、FFI/Fiddle/Riceでラップして、Rubyで使えるようにしています。ankaneさん自身が書かれた、それらGemのまとめ記事があります。ベクトル・行列・線形代数

ma2 2021/02/15

リンク

機械学習でFizzBuzzを実現する

元ネタ実行結果 Google Colaboratoryで動かした結果は以下です教師データの作成学習用の教師データを生成して確認します。本来は教師データは外部から提供されるはずだが、今回はそれがないので自分で生成する。 import numpy as np def fizzbuzz(n:int): if n % 15 == 0: return "FizzBuzz" if n % 5 == 0: return "buzz" if n % 3 == 0: return "Fizz" return n def generate_sample_data(size=1000): feature = np.random.randint(0, np.iinfo(np.int32).max, size) label = list(map(fizzbuzz, feature)) return featu

ma2 2021/01/18

リンク

GitHub - The-Japan-DataScientist-Society/100knocks-preprocess: データサイエンス100本ノック（構造化データ加工編）

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ma2 2020/08/12

リンク

How to build your own Feature Store - Hopsworks

ma2 2020/05/27

リンク

Announcing PyCaret: An open source, low-code machine learning library in Python

We are excited to announce PyCaret, an open source machine learning library in Python to train and deploy supervised and unsupervised machine learning models in a low-code environment. PyCaret allows you to go from preparing data to deploying models within seconds from your choice of notebook environment. In comparison with the other open source machine learning libraries, PyCaret is an alternate

ma2 2020/04/19

リンク

機械学習初心者はGoogleAutoML Tablesを使ってみては？メリットや使い方、使用感を知っておこう

※「AutoML Tables┃Google Cloud」より引用とりあえず機械学習に触れてみたいという方にとって、基本無料で利用できるというのは非常に魅力的でしょう。 GoogleAutoML Tables を実際に使ってみた最後にGoogleAutoML Tableの体験デモを機械学習初心者の筆者が実際に行ってみた手順と感想をご紹介します。なお、デモの内容や手順は「クイックスタート」に従っています。手順1：GoogleAutoML Tablesを有効化するまずは、Google Cloud Platformに登録し、GoogleAutoML Tablesを有効化します。 Google Cloud Platform登録時には支払元のクレジットカードを登録する必要がありますが、料金が自動的に発生することはありません。手順2：データをインポートする続いて機械学習の対象となるデータを

ma2 2020/04/17

リンク

機械学習モデルを作成する - Training

Microsoft Learn では、対話的な方法で、従来の機械学習の概要を理解することができます。これらのラーニングパスは、ディープラーニングのトピックに移行するための優れた基盤にもなり、各自の生産性を向上させます。最も基本的な従来の機械学習モデルから、探索的データ分析やカスタマイジングのアーキテクチャまで、ブラウザーを離れることなく、概念的内容や対話型の Jupyter Notebook を簡単に把握することができます。知識と興味に応じて自分のパスを選択してください。オプション 1: 完全なコース: 機械学習のためのデータサイエンスの基礎ほとんどのユーザーには、このパスがお勧めです。これには、概念の理解を最大限に高めるカスタムフローを備えた、他の 2 つのラーニングパスと同じモジュールがすべて含まれています。基になる概念と、最も一般的な機械学習ツールでモデルを構

ma2 2020/01/16

リンク

機械学習で使用する手法を全公開 - Qiita

株式会社デジサクがお送りするプログラミング記事、今回はAI(機械学習)について扱っていこうと思います。 ※ 無料セミナーも開催中なので、ぜひご覧になってみて下さい。はじめに kaggleや学習サイトなど誰でも機械学習を学べる機会が増えてきました。その反面、情報量が多すぎて全体感を掴めていない人が多いと感じています。そこで、様々な参考書や記事で紹介されている機械学習で使用する手法を全公開しようと思います。細かなコーディングはリンクを貼っておくので、そちらを参照されてください。 SNS でも色々な情報を発信しているので、記事を読んで良いなと感じて頂けたら Twitterアカウント「Saku731」もフォロー頂けると嬉しいです。機械学習の一連手順まず、機械学習を習得するために必要なスキルは下記です。実務の場では数段細かな作業が必要になりますが、最初は下記を勉強するだけで十分で

ma2 2020/01/03

リンク

【データ分析の必読10冊+差をつける10冊＋100冊超】データサイエンス、データ分析、機械学習関連の本 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Update版2023年版データ分析の100冊を書きましたよ！必読10冊を更新。データサイエンス、データ分析、機械学習周りでおすすめ図書10選のような記事は良く見ますが、網羅的な紹介記事はあまり見かけないので自分が欲しいと思い書きました。私よりたくさん読んでいる方は多々いらっしゃると思いますが、記事を書いてくださいな。別の観点でデータ分析プロジェクトのフェーズ毎の参考書籍紹介という記事を新たに書きました。データ分析の各フェーズ（データ分析プロジェクト全体-ビジネス状況の理解-データの理解-データの準備-モデルの作成-評価-展開）毎

ma2 2019/04/01

リンク

【13個掲載】機械学習に使える日本語のデータセットまとめ - Qiita

※本記事は、Lionbridge AI発の連載記事を再編集したものです。他の機械学習に使えるオープン・データセットまとめ記事は、こちらからご覧ください。本記事は、日本語のデータセットを紹介いたします。日本語の公開データセットを無料ダウンロードできるポータルサイトや、自然言語処理に使える日本語のテキストデータセットを含みます。機械学習に使える日本語のデータセットポータル DATA GO JP: 日本政府のデータカタログサイト。日本政府は、公共データを広く公開することにより、国民生活の向上、企業活動の活性化等を通じ、我が国の社会経済の発展に寄与する観点から、機械判読に適したデータ形式を、営利目的も含めた二次利用が可能な利用ルールで公開する「オープンデータ」の取組を推進しています。このウェブサイトは、二次利用が可能な公共データの案内・横断的検索を目的としたオープンデータの「データカタログサイ

ma2 2019/03/26

リンク

第3回　ベイジアンフィルタを実装してみよう | gihyo.jp

さらに詳細な利用方法が知りたい方は、Yahoo!デベロッパーズネットワークのマニュアルを参照してください。ベイジアンフィルタの実装ここから本格的にベイジアンフィルタの実装に入っていきます。その前に、まずは先程のリスト1のコードを利用して入力された文章をわかち書きし、単語の集合を返す関数を作成しnaivebayes.pyとして保存しましょう。こちらも先程のmorphological.pyと同様にutf-8で保存してください。リスト2　文章の分割をする関数（naivebayes.py） # -*- coding: utf-8 -*- import math import sys #yahoo!形態素解析 import morphological def getwords(doc): words = [s.lower() for s in morphological.split(doc)

ma2 2019/03/13

リンク

はじめてのAdversarial Example

今回はadversarial exampleについて解説していきます。Adversarial exampleというのは、下図のように摂動を与えることによりモデルに間違った答えを出力させてしまうもののことです。この例では、もともとモデルがパンダと正しく分類することができていた画像に摂動を与えることで、テナガザルと誤分類させています。しかし、人間には元の画像との違いはほとんど分からず、パンダのままに見えます。 Adversarial exampleは機械学習モデルを実用化していく上で大きな問題となります。例えば、交通標識をadversarial exampleにしてしまえば、自動運転車をだませてしまう可能性があります。注目を集めてきている研究分野ですが、まだちゃんと調べたことがないという人も多いかと思います。今回もなるべく丁寧に解説していきたいと思います。目次基礎攻撃防御論文紹介

ma2 2018/07/19

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

machinelearningとaiに関するma2のブックマーク (13)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第4週）

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

pFad - (p)hone/(F)rame/(a)nonymizer/(d)eclutterfier! Saves Data!