Content-Length: 285180 | pFad | https://b.hatena.ne.jp/bluescreen/20250129#bookmark-4765429776164301536

bluescreenのブックマーク / 2025年1月29日 - はてなブックマーク

タグ

2025年1月29日のブックマーク (10件)

  • 低コストで超高性能な「DeepSeek-R1」に似たAIモデルを誰でも開発できるようにオープンでない部分を補完するプロジェクト「Open-R1」をHugging Faceが始動

    中国AI企業が2025年1月20日(月)にリリースしたAIモデル「DeepSeek-R1」は、「OpenAI o1」と同等の性能を備えつつ学習コストや運用コストが低いことを特徴としています。このDeepSeek-R1は、モデルデータが無料で公開されているのですが、学習に必要なデータセットやコードは公開されていません。新たに、AI開発プラットフォームの「Hugging Face」がDeepSeek-R1の非公開部分を再現してオープンソース化するプロジェクト「Open-R1」を開始しました。 Open-R1: a fully open reproduction of DeepSeek-R1 https://huggingface.co/blog/open-r1 DeepSeek-R1は中国に拠点を置くAI企業のDeepSeekが開発したAIモデルで、数学性能やコーディング性能などを測定する複

    低コストで超高性能な「DeepSeek-R1」に似たAIモデルを誰でも開発できるようにオープンでない部分を補完するプロジェクト「Open-R1」をHugging Faceが始動
  • DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか

    2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、AppleMicrosoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。 DeepSeek FAQ – Stratechery by Ben Thompson https://stratechery.com/2025/deepseek-faq/ 17 Thoughts About the Big DeepSeek Selloff - Bloomberg https://www.bloomberg.com/news/ne

    DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか
  • 【蒸留モデル】DeepSeek-R1ローカル実行時におすすめのモデル - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 大規模言語モデル(LLM)をローカル環境で実行することへの需要が高まっています。記事では、2025年1月にリリースされたDeepSeek-R1モデルファミリーを、Ollamaを使用してローカル環境で実行する方法について解説します。 Roo Codeと使用するには下記も御覧ください 環境要件 実行環境には以下が必要です: Ollamaがインストール済みであること GPUを使用する場合:NVIDIA GPUと対応するドライバー モデルに応じた十分なRAMとGPUメモリ(詳細は後述) まだOllamaをインストールしていない場合は、Olla

    【蒸留モデル】DeepSeek-R1ローカル実行時におすすめのモデル - Qiita
  • 聴く技術書!ラジオ好きエンジニアに贈る2025年おすすめテック系Podcast7選 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに IT業界で日々奮闘しているみなさん、おつかれさまです。自己研鑽に励むみなさんなので、新しい技術を学んだり情報収集したいけど、なかなかまとまった時間が取れない…そんな思いを抱えてやいらっしゃいませんか。 この記事では、そんなあなたのために!スキマ時間を有効活用できる、聴くだけで知識が深まっちゃう雑談テック系Podcastを厳選して7番組ご紹介します。通勤時間や家事の合間など、ちょっとした空き時間で気軽に聴けるので、ぜひ参考にしてみてください。 筆者ってどんなやつ? 主にL1~L3を領域にしているネットワークエンジニア 広域ネット

    聴く技術書!ラジオ好きエンジニアに贈る2025年おすすめテック系Podcast7選 - Qiita
  • Webサービスぶっ壊れ地獄、行きやすぜ!

    はじめに なあジョージさんよ……あんた、いつもこう言ってたよな? 「便利さとシンプルさ、それがユーザーも開発者も幸せにする秘訣だ」ってよ。 あたしゃな、その言葉に乗っかっちまった。ユーザーのため? 開発を効率化するため? そりゃあ立派なもんだ。でもな、それが「命取り」になることがあるんだぜ。 シンプルに作ったはずのサービスが、悪意ある奴らに好き勝手利用されて、時には「あたしの知らなかった地獄」を見せてくれる。越えたらいけない一線がある。そんな話を、今日はしようじゃねえか。 さあ、これがあたしらの舞台だ。 セキュリティの教科書には載らない、バグバウンティでも指摘されない、ニュースにもならない、「 現場のWebサービスぶっ壊れ地獄 」 ……教えてやりますぜ!! 1. サインアップし放題からのクレカ決済し放題地獄 この地獄、知ってやがるかい? 聞いてくれよ。ユーザーを簡単にサインアップさせる……

    Webサービスぶっ壊れ地獄、行きやすぜ!
  • LLMチューニングのための強化学習:GRPO(Group Relative Policy Optimization) - どこから見てもメンダコ

    DeepSeek-R1にも採用されたLLMチューニングのための強化学習手法 GRPO(Group Relative Policy Optimization)について考えたことをまとめます。 GRPO: DeepSeek-R1の強化学習ファインチューニング手法 前提手法:TRPO/PPO TRPO: Trust Region Policy Optimization PPO: Proximal Policy Optimization GRPOとPPOの差分:①アドバンテージ算出と②参照モデルからのKL距離制約 変更点①: アドバンテージAの算出方法 REINFORCE: 価値関数近似なし方策勾配法 PPO(Actor-Critic): 価値関数近似あり方策勾配法 GRPO: スケーリングされたREINFORCE 変更点 ②: 参照モデル(SFTモデル)からのKL距離制約 従来は参照モデル制約は

    LLMチューニングのための強化学習:GRPO(Group Relative Policy Optimization) - どこから見てもメンダコ
  • ChatGPT超えの中国AI「DeepSeek-R1」の衝撃

    中国AIスタートアップ「DeepSeek」は2025年1月20日、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」を公開した。 使用・複製・改変・再配布を自由に許可する寛容なMITライセンス下でのオープンソース提供および従来比95〜97%のコスト減となるAPI価格が特徴で、AI業界に激震が起きている。 強化学習を重視、コールドスタート問題にも対応 論文によると、DeepSeek-R1の特筆すべき点は、強化学習(RL:Reinforcement Learning)を駆使し、従来の教師あり学習(SFT:Supervised Fine-Tuning)に頼らず、自律的に思考連鎖(CoT:Chain-of-Thought)を学習する点だ。このアプローチにより、モデルは複雑な問題を解決するための思考の連鎖を探索し、自己検証や振り

    ChatGPT超えの中国AI「DeepSeek-R1」の衝撃
  • DeepSeek-R1の論文読んだ?【勉強になるよ】

    記事は、DeepSeek-R1の論文とDeepSeekMathの論文を読んだ私の理解をもとに記載しています。 論文で使われている技術に関しては、ある程度の知識を持っているので、大きくは外していないとは思いますが、私の主観も入っている部分もありますので、ご了承ください。 また、DeepSeek-R1の論文が公開される前に、小型モデルに対して同様の実験(強化学習)をしていたグループがあるようです。 そちらのレポートは下記になります。 意図せず、DeepSeek-R1-Zeroの再現実験のようなレポートになっていますが、レポートの著者はDeepSeek-R1論文の公開前から実験していると主張しています。 こちらも非常に興味深かったため紹介です。 論文の興味深いところ 論文は、大きく分けて3つの構成でできています 強化学習による思考能力の強化 LLM(DeepSeek-V3-Base)に対

    DeepSeek-R1の論文読んだ?【勉強になるよ】
  • AI業界に激震、突如公開の中華AI「DeepSeek」“驚きポイント”まとめ

    1月20日(日時間)に登場した大規模言語モデル「DeepSeek-R1」に、AI開発者やユーザーたちが驚いている。中国のスタートアップDeepSeekが開発したこのモデルは、分野によっては米OpenAIの「o1」に匹敵するとうたう性能が特徴。モデルは無料でダウンロードも可能で、商用利用も認められている。 DeepSeekはChatGPTに似たチャットUIも無料で提供しており、同サービス上では、現時点ではo1と併用できないWeb検索機能も利用できる。つまり、OpenAIをはじめとした他社のハイエンドモデルに近い性能のモデルがスタートアップから突然公開され、さらに同等以上の機能とコストパフォーマンスを持つサービスとしてもリリースされたわけだ。 それだけでも衝撃だが、開発コストや地政学的リスクなど、業界に影響を与える話題は枚挙にいとまがない。世界中のハイテク株に影響を与えた可能性も出ており、S

    AI業界に激震、突如公開の中華AI「DeepSeek」“驚きポイント”まとめ
  • Ryzen AI Max+ 395 のゲーミング性能が判明。APUでデスクトップ向けGeForce RTX 4060 Ti相当の性能に

    Ryzen AI Max+ 395 のゲーミング性能が判明。APUでデスクトップ向けGeForce RTX 4060 Ti相当の性能に AMDはCES 2025でノートPC向けに内蔵GPUCPUを大幅強化した高性能APUであるコードネームStrix Haloこと、Ryzen AI Max 300シリーズを発表しました。このRyzen AI Max 300シリーズではCPU側にはZen 5 CPUを最大16コア搭載するほか、内蔵GPUにはRDNA 3.5アーキテクチャーで構成されるCompute Unitを最大40コア搭載することで、APU単体でディスクリートグラフィックカード並みの性能を実現すると言われています。 AMDはこのRyzen AI Max 300シリーズの性能についてCES 2025では主にCPU性能に焦点を当てたプレゼンテーション資料を展開していましたが、今回グラフィクス性

    Ryzen AI Max+ 395 のゲーミング性能が判明。APUでデスクトップ向けGeForce RTX 4060 Ti相当の性能に








ApplySandwichStrip

pFad - (p)hone/(F)rame/(a)nonymizer/(d)eclutterfier!      Saves Data!


--- a PPN by Garber Painting Akron. With Image Size Reduction included!

Fetched URL: https://b.hatena.ne.jp/bluescreen/20250129#bookmark-4765429776164301536

Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy