[Visual Bank株式会社]~GENIAC採択企業のVisual Bank、画像・動画・テキストの複合リスクに対応し、基盤モデル開発におけるSafety Alignmentを支援~Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において ...
Googleは10日(米国時間)、マルチモーダル対応の埋め込みモデル「Gemini Embedding 2」を発表し、Gemini APIおよびVertex AIを通じてパブリックプレビューで提供開始した。テキスト、画像、動画、音声、ドキュメントを単一の埋め込み空間にマッピングし、異なる種類のメディアを横断した検索や分類に対応する。
音声・テキスト・画像・音楽など複数の種類のデータを一度に処理できるマルチモーダルな大規模言語モデル(LLM)の「AnyGPT」が発表されました。 既存の大規模言語モデル(LLM)のアーキテクチャやトレーニングパラダイムを変更することなく、安定して ...
Teradata(NYSE: TDC)は本日、ハイブリッド、クラウド、およびオンプレミス環境において、生成AIと自律型エージェントの可能性を最大限に引き出す統合ソリューション「Teradata Enterprise Vector Store」の新しいエージェント機能およびマルチモーダル対応を発表し ...
アクロクエストテクノロジー株式会社(本社:神奈川県横浜市・代表取締役:新免流、以下、アクロクエスト)は、テキストでも画像でも、もしくは、その両方合わせてでも検索可能な、次世代の検索を実現する「マルチモーダル検索ソリューション」の ...
マルチモーダルRAGとは、通常のRAGと何が違うのか? 企業データの90%が非構造化データであり、その80%以上が画像、動画 ...
米Microsoftは2月26日(現地時間)、小規模言語モデル(SLM)である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。 小規模言語モデル(Small Language Model:SLM)は ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する