2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が ...
筆者のキャリアは日本IBMのエンジニアとして始まった。特許も取った経験もあり、IBMの研究開発はクローズドな環境で守り抜く姿勢があたりまえのことだった。2024年2月、IBMは日本語版基盤モデル (IBM Granite) を発表した。5月にはIBM Graniteをオープンソース ...
大規模言語モデル(LLM)が自分の間違いを修正できるように開発されたトレーニング手法の「リフレクションチューニング」を用いてトレーニングされたオープンソースのLLM「Reflection 70B」が発表されました。 HyperWrite debuts Reflection 70B, most powerful open source LLM ...
株式会社ナレッジセンスは、オープンソース大規模言語モデル(LLM)をお客様の環境に構築し、セキュアな運用を支援する法人向け「ローカルLLM」サービスの提供を近日中に開始することをお知らせいたします。本サービスにより、セキュリティ要件が ...
1993年の創業以来、つねにオープンソースウェイの先頭に立ち続け、最先端テクノロジとオープンソースの融合を図ってきたRed Hat。同社は現在、世界中の企業にとって重要なイノベーションドライバであるAIとハイブリッドクラウドという技術を、民主的かつ ...
東京科学大学(Science Tokyo) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(産総研)は、日本語能力に優れた大規模言語モデル(「Swallow」シリーズの最新版である「Llama 3.1 Swallow」を公開し ...
仏Mistral AIは7月24日(現地時間)、同社のフラッグシップ大規模言語モデル(LLM)の新世代モデル「Mistral Large 2」を公開した。従来モデルと比較して、コード生成・数学・推論の能力が大幅に向上したほか、日本語を含む多言語に対応。先日には米Metaの最新 ...
生成AIブームが拡大する中、多くの企業は、大規模言語モデル(LLM)を最大限に活用する方法を模索している。ここで大きなジレンマの1つは、ライセンス料が必要で、厳格な運用ルールに従わなければならないクローズドのLLMを選ぶか、自由にカスタマイズ ...
米Metaは8月29日(現地時間)、“オープンソース”を謳うLLM「Llama」のHugging Faceでの累計ダウンロード数が3億5000万回に迫っていると発表した。前年同時期の10倍以上であり、Llama 3.1をリリースした7月だけでも2000万回ダウンロードされたとしている。 今年の1 ...
ロサンゼルス発 - 2024年12月12日 - Teradata(NYSE:TDC)は本日、ハイブリッドクラウド・データ分析プラットフォームTeradata Vantageの高度な分析機能ClearScape Analyticsの新機能BYO-LLM(Bring-your-Own LLM)およびGPU分析クラスタによる推論、ファインチューニングの実行 ...
写真はラップトップユーザーとバイナリコードのイメージ。2018年3月撮影。REUTERS/Dado Ruvic AJ Vicens [29日ロイター] - 大手人工知能(AI)プラットフォームのような安全対策が講じられていないオープンソースの大規模‍言語モデル(LLM)を動かす ...