2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が ...
Trans-N のメンバー。左から2人目が CEO の Harry Na(那小川)氏、3人目が CTO の Youhan Sun (孫又晗)氏 Image credit: Trans-N Trans-N(トランスエヌ)は25日、オープンソースの大規模言語モデル(LLM)を活用した企業向けシステム開発の提供を開始すると発表した。
テキストや画像などを自動生成するAI(人工知能)技術「生成AI」や、そのベースとなる大規模言語モデル(LLM)の普及が進んでいる。LLMのオープンソース化や、クラウド型AIサービスの普及、ライセンスの多様化などが進み、企業にとってLLMをより活用し ...
株式会社ナレッジセンスは、オープンソース大規模言語モデル(LLM)をお客様の環境に構築し、セキュアな運用を支援する法人向け「ローカルLLM」サービスの提供を近日中に開始することをお知らせいたします。本サービスにより、セキュリティ要件が ...
大規模言語モデル(LLM)が自分の間違いを修正できるように開発されたトレーニング手法の「リフレクションチューニング」を用いてトレーニングされたオープンソースのLLM「Reflection 70B」が発表されました。 HyperWrite debuts Reflection 70B, most powerful open source LLM ...
2022年後半、ChatGPTが登場したことでAI企業やハイテク大手の間で競争が始まった。 それぞれが大規模言語モデル(LLM)アプリケーションの急成長市場を支配しようと競い合っている。そしてこの激しい競争の結果もあり、ほとんどの企業は言語モデルを独自 ...
下はHugging FaceのLMSYS Chatbot Arenaリーダーボード(1月26日更新)である。 クローズド(プロプリエタリ)なモデルで占められているトップ10に、オープンソースのモデルで唯一、昨年12月にリリースされた「Mixtral 8x7B」が入っている。開発しているのは、Deepmind、Metaに ...
東京科学大学(Science Tokyo) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(産総研)は、日本語能力に優れた大規模言語モデル(「Swallow」シリーズの最新版である「Llama 3.1 Swallow」を公開し ...
データセンターにおける総所有コスト (TCO) とエネルギー消費の最小化は、AIを採用する顧客にとって重要な目標であり、特に LLM は計算要件が爆発的に増加するため、その重要性が増している。 顧客は、AI プラットフォームへの支出に関して、単一の ...
仏Mistral AIは7月24日(現地時間)、同社のフラッグシップ大規模言語モデル(LLM)の新世代モデル「Mistral Large 2」を公開した。従来モデルと比較して、コード生成・数学・推論の能力が大幅に向上したほか、日本語を含む多言語に対応。先日には米Metaの最新 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する