中国のAIスタートアップDeepSeekは1月20日、オープンソースの推論型大規模言語モデル(LLM)「DeepSeek-R1」をリリースした。同モデルは、同社が2024年末にリリースした「DeepSeek V3」を基盤としており、OpenAIの推論型LLM「o1」に匹敵する性能を数学、コーディング ...
中国のAI企業であるDeepSeekが、与えられた新しい情報から結論を導く「推論」に特化した大規模言語モデル「DeepSeek-R1-Lite-Preview」を発表しました。OpenAIの推論モデル「o1-preview」に匹敵し、場合によっては上回る能力を発揮するとされています。 🚀 DeepSeek-R1 ...
ディープシーク(DeepSeek)のR1発表から1年、中国企業はトップクラスの性能を持つAIモデルをオープンウェイトで次々と公開してきた。ダウンロード数では米国モデルを逆転し、シリコンバレーのスタートアップでも中国製オープンモデルの採用が進む。この勢いは続くのか?
中国のAI企業・DeepSeekが2025年1月20日にリリースした推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」は、OpenAIの推論モデル・o1相当の性能でありながらo1と比べてトレーニングコストが非常に低いことや、MITライセンスの下でオープンソース化されていることが ...
今年1月、中国のほぼ無名の人工知能(AI)のスタートアップDeepSeekが発表したAIモデルは、米国のハイテク大手に匹敵する高度なオープンソースモデルを、競合よりもはるかに少ないリソースで開発したことで世界を驚かせた。OpenAIやAnthropicなどの大手も ...
DeepSeek-R1の予備段階のモデルとして 「DeepSeek-R1-Zero」 があり、これは教師ありファインチューニング (SFT) に頼らず、ベースモデルに大規模な強化学習 (RL) を直接適用することにより、複雑な問題を解決するための思考の連鎖 (CoT) を探索できるように ...
DeepSeekショックが収まらない。中国のスタートアップがOpenAIの推論モデルに匹敵する基盤モデルを短期間・低コストで開発したというニュースが、NVIDIA株の暴落を引きおこし、米中AI覇権争いの議論、安全保障問題へと波紋を広げている。だが、DeepSeekの登場 ...
高性能AIとして注目を集めているDeepSeek。優れた言語処理能力と低コストが魅力である一方で、情報漏洩のリスクなどの課題もあり、用途に応じた活用が求められる。 AI技術の進化によって、企業や個人が生成AIを活用するのが当たり前になりつつある。
先進的な企業の取り組み、知見をひろく読者の皆様に紹介するため、寄稿記事を掲載します。 オープンか、クローズドか、再び問われる選択 ChatGPTの登場から2年以上が経過し、AIを取り巻く環境が大きく様変わりする中、世界中でAIテクノロジーと ...
中国Alibabaが4月29日(現地時間)に発表した、大規模言語モデル「Qwen」の最新版となる「Qwen3」シリーズが話題だ。フラッグシップモデルの「Qwen3-235B-A22B」は「DeepSeek-R1」の半分未満のパラメータ数ながら、OpenAIのo1やo3-mini、GoogleのGemini 2.5 Proなど他のトップ ...
中国のAI開発企業であるDeepSeekが推論モデル「DeepSeek-V3.2」と「DeepSeek-V3.2-Speciale」を2025年12月1日に公開しました。両モデルはモデルデータが公開されているオープンモデルでありながらGPT-5やGemini 3と同等のベンチマークスコアを記録しています。 deepseek-ai ...