2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が ...
HuggingFaceやLMStudioで無料でダウンロードできるローカルLLM「Qwen3.5-9B」Photo:かみやまたくみとりあえずこれでいいやつ(令和最新版)。2026年2月末〜3月上旬にかけてアリババがリリースしたオープンウェイトの大規模 ...
テキストや画像などを自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)の普及が進んでいる。LLMのオープンソース化や、クラウド型AIサービスの普及、ライセンスの多様化などが進み、企業にとってLLMをより活用し ...
筆者のキャリアは日本IBMのエンジニアとして始まった。特許も取った経験もあり、IBMの研究開発はクローズドな環境で守り抜く姿勢があたりまえのことだった。2024年2月、IBMは日本語版基盤モデル (IBM Granite) を発表した。5月にはIBM Graniteをオープンソース ...
1993年の創業以来、つねにオープンソースウェイの先頭に立ち続け、最先端テクノロジとオープンソースの融合を図ってきたRed Hat。同社は現在、世界中の企業にとって重要なイノベーションドライバであるAIとハイブリッドクラウドという技術を、民主的かつ ...
株式会社ナレッジセンスは、オープンソース大規模言語モデル(LLM)をお客様の環境に構築し、セキュアな運用を支援する法人向け「ローカルLLM」サービスの提供を近日中に開始することをお知らせいたします。本サービスにより、セキュリティ要件が ...
下はHugging FaceのLMSYS Chatbot Arenaリーダーボード(1月26日更新)である。 クローズド(プロプリエタリ)なモデルで占められているトップ10に、オープンソースのモデルで唯一、昨年12月にリリースされた「Mixtral 8x7B」が入っている。開発しているのは、Deepmind、Metaに ...
2022年後半、ChatGPTが登場したことでAI企業やハイテク大手の間で競争が始まった。 それぞれが大規模言語モデル(LLM)アプリケーションの急成長市場を支配しようと競い合っている。そしてこの激しい競争の結果もあり、ほとんどの企業は言語モデルを独自 ...
18日の Meta の「LLaMA 2」の商用ライセンスでのリリースは、間違いなくオープンソース AI にとって非の打ちどころはなかった。しかし、LLaMA データセットを複製したデータセット「RedPajama」を4月 […] VentureBeat· 7月21日 Together の CEO Vipul Ved Prakash 氏 18日の Meta ...
東京科学大学(Science Tokyo) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(産総研)は、日本語能力に優れた大規模言語モデル(「Swallow」シリーズの最新版である「Llama 3.1 Swallow」を公開し ...
仏Mistral AIは7月24日(現地時間)、同社のフラッグシップ大規模言語モデル(LLM)の新世代モデル「Mistral Large 2」を公開した。従来モデルと比較して、コード生成・数学・推論の能力が大幅に向上したほか、日本語を含む多言語に対応。先日には米Metaの最新 ...
ロサンゼルス発 - 2024年12月12日 - Teradata(NYSE:TDC)は本日、ハイブリッドクラウド・データ分析プラットフォームTeradata Vantageの高度な分析機能ClearScape Analyticsの新機能BYO-LLM(Bring-your-Own LLM)およびGPU分析クラスタによる推論、ファインチューニングの実行 ...