Multimodal Text Samples

6 日

Qlean Dataset、「日本固有の文脈」と「マルチモーダル」に特化した ...

［Visual Bank株式会社］～GENIAC採択企業のVisual Bank、画像・動画・テキストの複合リスクに対応し、基盤モデル開発におけるSafety Alignmentを支援～Visual Bank株式会社（東京都港区、代表取締役CEO 永井真之）は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset（キュリンデータセット）」において ...

7 日

グーグル、埋め込みモデル「Gemini Embedding 2」マルチモーダル対応

Googleは10日(米国時間)、マルチモーダル対応の埋め込みモデル「Gemini Embedding 2」を発表し、Gemini APIおよびVertex AIを通じてパブリックプレビューで提供開始した。テキスト、画像、動画、音声、ドキュメントを単一の埋め込み空間にマッピングし、異なる種類のメディアを横断した検索や分類に対応する。

GIGAZINE

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大 ...

音声・テキスト・画像・音楽など複数の種類のデータを一度に処理できるマルチモーダルな大規模言語モデル(LLM)の「AnyGPT」が発表されました。既存の大規模言語モデル(LLM)のアーキテクチャやトレーニングパラダイムを変更することなく、安定して ...

PR TIMES

テラデータ、エンタープライズスケールでマルチモーダルデータを ...

Teradata（NYSE: TDC）は本日、ハイブリッド、クラウド、およびオンプレミス環境において、生成AIと自律型エージェントの可能性を最大限に引き出す統合ソリューション「Teradata Enterprise Vector Store」の新しいエージェント機能およびマルチモーダル対応を発表し ...

PR TIMES

テキストでも画像でもすぐに探せる、生成AIを活用した ...

アクロクエストテクノロジー株式会社（本社：神奈川県横浜市・代表取締役：新免流、以下、アクロクエスト）は、テキストでも画像でも、もしくは、その両方合わせてでも検索可能な、次世代の検索を実現する「マルチモーダル検索ソリューション」の ...

Excite エキサイト

テキストだけでなく画像や音声なども処理するマルチモーダルRAG ...

マルチモーダルRAGとは、通常のRAGと何が違うのか？企業データの90%が非構造化データであり、その80%以上が画像、動画 ...

窓の杜

Microsoft、小規模言語モデル「Phi-4-multimodal」「Phi-4-mini」を発表

米Microsoftは2月26日（現地時間）、小規模言語モデル（SLM）である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。小規模言語モデル（Small Language Model：SLM）は ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する