Multimodal Example - 検索 News

Microsoft、小規模言語モデル「Phi-4-multimodal」「Phi-4-mini」を発表

米Microsoftは2月26日（現地時間）、小規模言語モデル（SLM）である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。小規模言語モデル（Small Language Model：SLM）は ...

GIGAZINE

OpenAIがGPT-4oベースの有害なテキストや画像を検出できる新しい ...

AI開発企業のOpenAIが、Moderation APIに新しいマルチモーダルモデレーションモデルを導入しました。このマルチモーダルモデレーションモデルはGPT-4oをベースとしており、テキストと画像の両方の入力をサポート。特に、英語以外の言語で以前のモデルよりも ...

ギズモード・ジャパン

AIの｢マルチモーダル｣ってなんだろう？グーグルやOpenAIが大騒ぎ ...

5月といえば、スター・ウォーズとゴールデンウィーク。しかし、今年の5月はSWよりもGWよりも、AIな月となりました。OpenAIとGoogle（グーグル）が、次々と大きなAI関連の発表を行なったからです。近年、テック大手はAIモデルの開発に注力し、より賢く、より ...

ITmedia

「GPT-4o」は何がすごい？なぜLLMは画像や音声も扱えるの ...

──マルチモーダル用のニューラルネットがあるというよりも、テキスト用のニューラルネットに音声や画像も入力しているという感じなんですね。GPT-4oを含む現在のマルチモーダルLLMの限界と、今後の発展の方向性について教えてください椎橋：現在のGPT ...

ITmedia

「GPT-4o」は何がすごい？なぜLLMは画像や音声も扱えるの ...

米OpenAIが5月に発表した生成AIモデル「GPT-4o」。テキストだけでなく音声や画像も扱えるマルチモーダルモデルとして、その特徴が注目を集めている。ChatGPTでは、GPT-4oの性能を生かした「高度な音声モード」も提供予定（6月25日に延期を発表）で、感情や非 ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する

Microsoft、小規模言語モデル「Phi-4-multimodal」「Phi-4-mini」を発表

OpenAIがGPT-4oベースの有害なテキストや画像を検出できる新しい ...

AIの｢マルチモーダル｣ってなんだろう？ グーグルやOpenAIが大騒ぎ ...

「GPT-4o」は何がすごい？ なぜLLMは画像や音声も扱えるの ...

「GPT-4o」は何がすごい？ なぜLLMは画像や音声も扱えるの ...

AIの｢マルチモーダル｣ってなんだろう？グーグルやOpenAIが大騒ぎ ...

「GPT-4o」は何がすごい？なぜLLMは画像や音声も扱えるの ...

「GPT-4o」は何がすごい？なぜLLMは画像や音声も扱えるの ...