大規模言語モデル(LLM)の世界で、DeepSeekが注目を集めています。特にそのMixture of Experts (MoE) アーキテクチャは、従来のモデルよりもはるかに効率的な推論を実現しています。今回は、DeepSeekの論文「DeepSeek: Towards Ultimate Flexibility and Cost-Efficiency for LLM Serving」で ...
米Microsoftは1月29日(現地時間)、中国のAIスタートアップ DeepSeek社が公開したLLM「DeepSeek-R1」を、自社製品の「Azure AI Foundry」プラットフォームおよび「GitHub」で提供開始すると発表した。1,800を超えるモデルを有するAI開発プラットフォーム「Azure AI Foundry」の ...
ログインして、InfoQのすべての体験をアンロックしましょう!お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。 クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中に ...
中国アリババは、大規模言語モデル(LLM)「QwQ-32B」を発表しました。32Bパラメータでありながら、DeepSeek-R1(671B)と同等の性能を達成したといいます。 中国テンセントは、自社の動画生成AI「HunyuanVideo」をベースにした画像から映像を生成する特化型 ...
会員(無料)になると、いいね!でマイページに保存できます。 ChatGPTでプログラミングをする「意外な利点」 『#100日チャレンジ 毎日連続100本アプリを作ったら人生が変わった』(大塚あみ著、日経BP、2025年)という書籍が発売され、話題を呼んでいる。
1月20日にリリースされた中国製生成AI『DeepSeek-R1』には様々な危険性があり、その学習にも問題を抱えていると多数のメディアが報じています。 どのような問題を抱えているのか? そして、学習のどこが問題とされているのか? 種類別にまとめてみました。
先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU(Neural Processing Unit)で動かせるようにしたという話が飛び込んできた。 「マイクロソフトはOpenAIと組んでるんじゃないの?」とか「DeepSeekは問題だらけ ...
なぜ生成AI(大規模言語モデル/LLM)をローカルPCで動かしたいのでしょうか。既に、ChatGPT(https://chatgpt.com/)やGoogle Gemini(https ...
お疲れ様です。TOKIです。 最近、NVIDIA DGX Sparkを自前で調達して様々なモデルをサクサク試せるようになったので、いろんなモデルを試してビジネスに実用的なモデルの探索を行っています。 その中で今回OCRまわりで最近DeepSeek-OCRが出たので、こちらを紹介し ...
1月27日に株式市場を襲った「DeepSeekショック」。中国のAI開発企業DeepSeekが、低コストながらも高性能な生成AIモデルを発表し、さらに同社のiPhone向けアプリが、無料アプリランキングでChatGPTをおさえて1位を獲得したことをきっかけに、米国の株式市場におい ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する