AIエージェント・生成AI受託開発、プロダクト開発事業と、総合・ITコンサルティング事業を展開するAcrosstudio株式会社(所在地:東京都文京区、代表取締役:保知一也、以下Acrosstudio)は、 2025年7月23日(水)~25日(金)に幕張メッセ7ホール「AI World」内 ...
この資料では、VLM(大規模視覚言語モデル)の基礎から、LLM(大規模言語モデル)とVLMの違い、開発ステップや業界・分野での活用事例など、詳細な情報をわかりやすくまとめています。 特に、画像を用いた検索・解析や、画像処理と言語処理を統合したAI ...
Appleが独自の視覚言語モデル(VLM)となる「FastVLM」を発表しました。従来のVLMは精度が高くなると効率性が低下するという問題を抱えていたのですが、FastVLMは高い精度を保ちながら効率の面でも優れた性能を発揮しており、オンデバイスでのリアルタイム ...
生成AI技術で柔軟性の高い異常監視を実現 「ANOMALY WATCHER」とVLMの連携により新たな検知手法を提供 キヤノンマーケティングジャパングループのキヤノンITソリューションズ株式会社(本社:東京都港区、代表取締役社長:金澤 明、以下キヤノンITS)は、製造 ...
サイバーエージェントは6月13日、同社独自の大規模視覚言語モデル(VLM:Vision Language Model)を公開した。このVMLのパラメータ数は75億で、ベースモデルの一部を米Hugging Faceが運営するWebサイト「Hugging Face Hub」に公開したという。 公開されたモデルは同社独自の ...
- ML実験管理プラットフォームを提供するWeights & Biases Japanと連携 - 完全自動運転車両の開発に取り組むTuring株式会社(東京都品川区、代表取締役:山本 一成、以下、チューリング)は、ML実験管理プラットフォームを提供するWeights & Biases Japan株式会社(以下、W&B ...
前回までは「gpt-oss-20b」を使ってテキストデータを用いたLLMの活用方法を解説してきた。テキストデータだけでも十分活用できるが、欲を言えば画像や動画、音声なども取り扱えるようにしたいところだろう。 そんな方に朗報だ。LM Studioではテキストデータ ...
株式会社サイバーエージェントは、75億パラメーターの日本語VLM(大規模視覚言語モデル)のベースモデルをHugging Face Hubで公開した。Apache-2.0ライセンスで提供されており、商用利用も可能だとしている。 この日本語VLMは、サイバーエージェント独自の ...
サイバーエージェントは6月13日、75億パラメータの日本語VLM(Vision Language Model、大規模視覚言語モデル)を公開した。 近年、OpenAI社が開発した「GPT-4o」を始めとする画像も扱えるLLMが急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用 ...
ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用し ...
AIスタートアップのSakana AI(株)は8月2日、複数の画像について質疑応答できる日本語視覚言語モデル(VLM)「Llama-3-EvoVLM-JP-v2」および、複数の画像に関する日本語での質疑応答能力を評価するためのデータセット「Japanese multi-images visual question answering(JA-Multi ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する