Googleは7日(米国時間)、Gemini APIを通じてコンピューターを操作できる「Gemini 2.5 Computer Use model」を開発者向けに提供開始した。Gemini 2.5 Proのビジュアル理解・推論能力を基盤とし、コンピューターのユーザーインターフェース(UI)との対話が可能なエージェント ...
AIチャットサービスのClaudeを展開しているAnthropicが、「Computer use」という機能を10月にリリースしました。ユーザーがテキストなどで指示した内容に従って、AIが自律的に判断し、パソコン画面をマウスカーソルやキーボードで操作するというものです。