画像生成AIのFLUXシリーズで知られるBlack Forest Labsが、生成AIをトレーニングするための新たなアプローチ「Self-Supervised Flow Matching(Self-Flow)」を発表しました。Self-Flowは生成モデルを自己教師あり学習で効率的にトレーニングするための仕組みで、学習効率の大幅な向上や画像生成時のテキスト描画の向上などを実現しています。
米Microsoftは2月26日(現地時間)、小規模言語モデル(SLM)である「Phi」ファミリーに「Phi-4-multimodal」「Phi-4-mini」が加わったと発表した。現在、「Azure AI Foundry」、「HuggingFace」、「NVIDIA API Catalog」で利用可能。 小規模言語モデル(Small Language Model:SLM)は ...
Microsoft has released a new multimodal reasoning model: Phi-4-reasoning-vision-15B. The model combines two existing algorithms using a mid-fusion approach and can analyze images, scientific graphs, ...
AIソリューション事業を手掛ける株式会社ヘッドウォータース(本社:東京都新宿区、代表取締役:篠田 庸介、以下「ヘッドウォータース)」は、日本マイクロソフトの「Azure OpenAI Service」を利用して、音声、画像・映像の複合的な生成AIである ...
生成 AI 分野の競争がマルチモーダルモデルへとシフトする中、Metaは frontier labs が発表したモデルに対する答えとなるプレビューを発表した。Meta の新しいモデルファミリー「Chameleon」は、異なるモダリティのコンポーネントを組み合わせるのではなく ...
Researchers have proposed a multimodal sensor fusion approach to AI-based fault detection in 3D printing, aiming to push AM monitoring closer to reliable, Industry 4.0 operation.
──マルチモーダル用のニューラルネットがあるというよりも、テキスト用のニューラルネットに音声や画像も入力しているという感じなんですね。GPT-4oを含む現在のマルチモーダルLLMの限界と、今後の発展の方向性について教えてください 椎橋:現在のGPT ...