米Microsoftは2月26日(現地時間)、小規模言語モデル(SLM)である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。 小規模言語モデル(Small Language Model:SLM)は ...
AI技術の進化により、テキスト・画像・音声など複数の情報を同時に理解・処理できる「マルチモーダルAI」が急速に普及しています。 ChatGPTやGeminiなどの身近なサービスでも活用されるこの技術は、ビジネスのあり方を根本から変えつつあり、2025年の市場 ...
完全自動運転車両の開発・販売に取り組むTuring株式会社(千葉県柏市、代表取締役:山本 一成、以下「チューリング」)は、日本語を含む複数言語対応の大規模マルチモーダル学習ライブラリ「Heron(ヘロン)」と、それにより学習した最大700億パラメータ ...
AI開発企業のOpenAIが、Moderation APIに新しいマルチモーダルモデレーションモデルを導入しました。このマルチモーダルモデレーションモデルはGPT-4oをベースとしており、テキストと画像の両方の入力をサポート。特に、英語以外の言語で以前のモデルよりも ...
「複数のメディアを同時に扱える」とか「画像の内容を認識できる」とか、そんな曖昧な理解でマルチモーダルAIを語っている人、正直多いと思う。かく言う自分も、最初は「まあ、画像とテキストを一緒に処理できるAIのことでしょ」くらいの認識だった。
Appleの研究者チームが、パフォーマンスの高いマルチモーダル大規模言語モデル(MLLM)を構築する手法「MM1」を発表しました ...
5月といえば、スター・ウォーズとゴールデンウィーク。しかし、今年の5月はSWよりもGWよりも、AIな月となりました。OpenAIとGoogle(グーグル)が、次々と大きなAI関連の発表を行なったからです。 近年、テック大手はAIモデルの開発に注力し、より賢く、より ...
NECは、10月15日~10月18日まで幕張メッセ(千葉市美浜区)で開催される「CEATEC 2024」にて、生体認証入退管理ソフトウェア「Bio-IDiom KAOATO」と連携した顔・虹彩マルチモーダル生体認証を出展します。 CEATEC2024 NECブースイメージ 本サービスは、世界No.1(注1)の ...