2025年10月7日、Googleがウェブブラウザの操作に特化したAIエージェント「Gemini 2.5 Computer Use」を発表しました。Gemini 2.5 Computer Useはフォームへの入力、ドロップダウンやフィルターなどのインタラクティブな要素の操作、そしてログインの背後での操作を ...
以下の記事が面白かったので、簡単にまとめました。 1. Computer-Using Agent 「Computer-Using Agent」(CUA) は、「GPT-4o」の視覚機能と強化学習による高度な推論機能を組み合わせたモデルです。人間と同じように、画面に表示されるボタン、メニュー、テキスト ...
AIソリューション事業を手がける株式会社ヘッドウォータース(本社:東京都新宿区、代表取締役:篠田庸介、以下「ヘッドウォータース」)は、AIエージェント(※1)がコンピューター操作を代行する「Computer-Using Agentソリューション」の発表に合わせて ...
Pushing the frontiers of computer-use agents with an open-weight, ultra-compact model, optimized for real-world web tasks In 2024, Microsoft introduced small language models (SLMs) to customers, ...
今後数年のうちに、AIエージェントが人間に代わって、コンピューターやスマートフォンの操作を含むさまざまな雑務を担うようになることが期待されている。とはいえ現時点では、エラーが多く実用にはまだほど遠い。 スタートアップ企業Simular AIが開発し ...