ディープシーク(DeepSeek)のR1発表から1年、中国企業はトップクラスの性能を持つAIモデルをオープンウェイトで次々と公開してきた。ダウンロード数では米国モデルを逆転し、シリコンバレーのスタートアップでも中国製オープンモデルの採用が進む。この勢 ...
2025年1月20日、中国のAIスタートアップ「DeepSeek」は、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等の性能を持つとされる大規模言語モデル「DeepSeek-R1(以下R1)」を公開した。 R1は、強化学習を中心とした独自の開発手法により高度な推論 ...
中国のAIスタートアップDeepSeekは1月20日、オープンソースの推論型大規模言語モデル(LLM)「DeepSeek-R1」をリリースした。同モデルは、同社が2024年末にリリースした「DeepSeek V3」を基盤としており、OpenAIの推論型LLM「o1」に匹敵する性能を数学、コーディング ...
ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...
中国のAI企業DeepSeekは1月20日(日本時間)までに、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル(LLM)「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。 モデルの性能比較(Hugging Faceから引用) 大規模な強化学習 ...
米Microsoftは1月29日(現地時間)、中国のAIスタートアップ DeepSeek社が公開したLLM「DeepSeek-R1」を、自社製品の「Azure AI Foundry」プラットフォームおよび「GitHub」で提供開始すると発表した。1,800を超えるモデルを有するAI開発プラットフォーム「Azure AI Foundry」の ...
先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU(Neural Processing Unit)で動かせるようにしたという話が飛び込んできた。 「マイクロソフトはOpenAIと組んでるんじゃないの?」とか「DeepSeekは問題だらけ ...
中国のAI企業であるDeepSeekが、第1世代の推論モデルである「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープン ...
Microsoftは29日 (米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」 (VS Code)の拡張機能「AI Toolkit」を介して「DeepSeek-R1-Distill-Qwen-1.5B」を提供し、7Bおよび14Bもまもなく用意するという。
この記事は会員限定です。会員登録すると全てご覧いただけます。 CrowdStrikeは2025年11月28日(現地時間、以下同)、同社のセキュリティ専門チーム(Counter Adversary Operations)が実施した調査により、中国のAI企業DeepSeekが公開した大規模言語モデル(LLM ...
Cerebras Systems は本日(訳註:原文掲載日は1月30日)、DeepSeek の画期的な R1人工知能モデルを米国のサーバーでホストすると発表し、GPU 基盤のソリューションよりも最大57倍高速な速度を実現しながら、機密データを米国内に保持することを約束した。この ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する