Googleは7日(米国時間)、Gemini APIを通じてコンピューターを操作できる「Gemini 2.5 Computer Use model」を開発者向けに提供開始した。Gemini 2.5 Proのビジュアル理解・推論能力を基盤とし、コンピューターのユーザーインターフェース(UI)との対話が可能なエージェント ...
AIチャットサービスのClaudeを展開しているAnthropicが、「Computer use」という機能を10月にリリースしました。ユーザーがテキストなどで指示した内容に従って、AIが自律的に判断し、パソコン画面をマウスカーソルやキーボードで操作するというものです。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する