世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも ...
ここ最近、大手テクノロジベンダが開催するカンファレンスでは必ずと言っていいほどメインテーマに生成AIが掲げられています。5月6日~9日 (米国時間) にかけて米デンバーで開催されたRed Hatの年次カンファレンス 「Red Hat Summit 2024 (RHS 2024)」も ...
会員(無料)になると、いいね!でマイページに保存できます。 2023年はChatGPTを筆頭にコンシューマー向けの生成アプリケーションが広く普及した年となった。 一方、企業における生成AI利用は大きく2つのアプローチにより進展する見込みだ。1つはOpenAIや ...
スイス連邦工科大学ローザンヌ校(EPFL)、スイス連邦工科大学チューリッヒ校(ETHZ)、スイス国立スーパーコンピューティングセンター(CSCS)が共同で開発した「Apertus」がリリースされました。Apertusは透明性とデジタル主権を重視し、学習データやコードが ...
大規模言語モデル(LLM)が自分の間違いを修正できるように開発されたトレーニング手法の「リフレクションチューニング」を用いてトレーニングされたオープンソースのLLM「Reflection 70B」が発表されました。 HyperWrite debuts Reflection 70B, most powerful open source LLM ...
仏新興AI企業のMistral AIは4月10日、オープンソースLLM(大規模言語モデル)の「Mixtral」の新版「Mixtral 8x22B」をリリースしたとXの公式アカウントでポストした。 このポストはファイルをTorrentでダウンロードできることを示しているが、本稿執筆現在、このLLM ...
Trans-N のメンバー。左から2人目が CEO の Harry Na(那小川)氏、3人目が CTO の Youhan Sun (孫又晗)氏 Image credit: Trans-N Trans-N(トランスエヌ)は25日、オープンソースの大規模言語モデル(LLM)を活用した企業向けシステム開発の提供を開始すると発表した。
米Metaは7月18日(現地時間)、次世代オープンソースの大規模言語モデル「Llama 2」を発表した。研究および商用利用向けに無償で提供される。また、米Microsoftとのパートナーシップを拡大して優先パートナーとし、「Llama 2」がクラウドサービス「Microsoft Azure ...
会員(無料)になると、いいね!でマイページに保存できます。 Llama 3とは何か? その概要 「Llama 3」とは、メタが2023年2月に発表したオープンソースの大規模言語モデル「LLaMA」の最新版で、2024年4月に発表された。 発表時点では80億(8B)パラメータと700億 ...
2025年1月、中国のAI(人工知能)スタートアップDeepSeekが大規模言語モデル(LLM)「DeepSeek-R1」を発表。その性能の高さに加え、開発コストの低さやオープンソースである点が注目を集めた。しかし、これらの主張に対しては懐疑的な見方を示す研究者が ...
大規模言語モデル(LLM)は一般的にクラウド上で運用されますが、Macのローカル環境で動かすこともできます。その際におすすめなのが、米Element Labsが開発した「LM Studio」です。このアプリを使えば、インターネットに接続することなく、また重要なデータを ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する