中国のAIスタートアップDeepSeekは1月20日、オープンソースの推論型大規模言語モデル(LLM)「DeepSeek-R1」をリリースした。同モデルは、同社が2024年末にリリースした「DeepSeek V3」を基盤としており、OpenAIの推論型LLM「o1」に匹敵する性能を数学、コーディング ...
中国のAI企業であるDeepSeekが、第1世代の推論モデルである「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープン ...
中国のAI企業であるDeepSeekが、与えられた新しい情報から結論を導く「推論」に特化した大規模言語モデル「DeepSeek-R1-Lite-Preview」を発表しました。OpenAIの推論モデル「o1-preview」に匹敵し、場合によっては上回る能力を発揮するとされています。 🚀 DeepSeek-R1 ...
今年1月、中国のほぼ無名の人工知能(AI)のスタートアップDeepSeekが発表したAIモデルは、米国のハイテク大手に匹敵する高度なオープンソースモデルを、競合よりもはるかに少ないリソースで開発したことで世界を驚かせた。OpenAIやAnthropicなどの大手も ...
DeepSeek-R1の予備段階のモデルとして 「DeepSeek-R1-Zero」 があり、これは教師ありファインチューニング (SFT) に頼らず、ベースモデルに大規模な強化学習 (RL) を直接適用することにより、複雑な問題を解決するための思考の連鎖 (CoT) を探索できるように ...
【DeepSeekの衝撃】強力かつ格安なAI/オープンソースで開発/米国企業の反応/エヌビディアの株価/業界の勢力図/米中のAI覇権争い/中国政府と企業の関係【ニュース解説】 ...
DeepSeekショックが収まらない。中国のスタートアップがOpenAIの推論モデルに匹敵する基盤モデルを短期間・低コストで開発したというニュースが、NVIDIA株の暴落を引きおこし、米中AI覇権争いの議論、安全保障問題へと波紋を広げている。だが、DeepSeekの登場 ...
2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が ...
米国のAI企業Perplexityは2月18日(現地時間)、最新の大規模言語モデル「R1 1776」をオープンソースとして公開したと発表した。このモデルは、既存のDeepSeek-R1を基に開発され、偏りなく正確な情報を提供するための後処理トレーニングが施されている。
AIベンダーによる技術のオープンソース化が広がっている。2025年6月、Baiduは同社AI基盤モデル「ERNIE 4.5」のオープンソース提供を始めた。大手AIベンダーが次々に自社技術を無料で公開しているのはなぜなのか。 検索エンジンを手掛ける中国のITベンダーBaidu ...
中国Alibabaが4月29日(現地時間)に発表した、大規模言語モデル「Qwen」の最新版となる「Qwen3」シリーズが話題だ。フラッグシップモデルの「Qwen3-235B-A22B」は「DeepSeek-R1」の半分未満のパラメータ数ながら、OpenAIのo1やo3-mini、GoogleのGemini 2.5 Proなど他のトップ ...