Benchmark Deepseek R1 Python

DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1＆o3と比較することで ...

ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...

窓の杜

「DeepSeek-R1は厳格なレッドチームテストと安全性評価を受けている ...

米Microsoftは1月29日（現地時間）、中国のAIスタートアップ DeepSeek社が公開したLLM「DeepSeek-R1」を、自社製品の「Azure AI Foundry」プラットフォームおよび「GitHub」で提供開始すると発表した。1,800を超えるモデルを有するAI開発プラットフォーム「Azure AI Foundry」の ...

窓の杜

NPUで動く「DeepSeek-R1」がもう登場、ローカル環境で動かしてみた

先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU（Neural Processing Unit）で動かせるようにしたという話が飛び込んできた。「マイクロソフトはOpenAIと組んでるんじゃないの？」とか「DeepSeekは問題だらけ ...

nature　asia

人工知能：DeepSeek-R1 AIモデルの背後にある科学

今年初めに公開されたオープン人工知能（AI：artificial intelligence）モデルDeepSeek-R1における大規模推論モデルの訓練手法を報告する論文が、今週のNature にオープンアクセスで掲載される。大規模言語モデル（LLM：large language model）の推論能力は純粋な強化学習 ...

CNET

SambaNova、DeepSeek-R1 671Bを最速・最高効率（注1）で提供開始

SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック（320基のGPU）から1ラック（SambaNova独自のAIアクセラレータであるRDUが16基）に集約し、最新GPUの3倍の速度、5倍の効率を実現 @カリフォルニア州 ...

ITmedia

AI業界に激震、突如公開の中華AI「DeepSeek」“驚きポイント”まとめ ...

1月20日（日本時間）に登場した大規模言語モデル「DeepSeek-R1」に、AI開発者やユーザーたちが驚いている。中国のスタートアップDeepSeekが開発したこのモデルは、分野によっては米OpenAIの「o1」に匹敵するとうたう性能が特徴。モデルは無料でダウンロードも ...

BRIDGE

高度な推論モデルo3-miniとDeepSeek、激しい競争がはじまる

OpenAI はオープンソースのライバル DeepSeek-R1の台頭に対抗するため、新しい独自の AI モデルをリリースした——しかし、これは後者の成功を抑えるのに十分だろうか？本日（訳註：原文掲載日は1月31日）、ソーシャルメディア上で数日間の噂と期待が高まっ ...

PC Watch

DeepSeek-R1がNPU上で動作できるようMicrosoftが移植

Microsoftは29日 (米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」 (VS Code)の拡張機能「AI Toolkit」を介して「DeepSeek-R1-Distill-Qwen-1.5B」を提供し、7Bおよび14Bもまもなく用意するという。

GIGAZINE

サイバーエージェントが「DeepSeek-R1」の派生モデルをベースに ...

日本の大手IT企業であるサイバーエージェントが2025年1月27日、AI開発企業のDeepSeekがリリースしたオープンソースの推論モデル「DeepSeek R1」の蒸留モデルをベースに、日本語データで追加学習を行った大規模言語モデルを公開しました。【モデル公開のお ...

技術評論社

サイトについて

サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM 「DeepSeek-R1」の蒸留モデルに日本語データによる追加学習を行ったLLM 「DeepSeek-R1-Distill-Qwen-14B/ 32B-Japanese」を公開した。【モデル公開のお知らせ】 DeepSeek-R1-Distill-Qwen-14B ...