Gemini 2.5 Computer Use:Googleが実現したブラウザ自動操作の革命的AIモデル Gemini 2.5 Computer Use:Googleが実現したブラウザ自動操作の革命的AIモデル Googleが2025年10月7日に発表した「Gemini 2.5 Computer Use」は、ウェブブラウザの操作に特化したAIエージェントモデルとし ...
Gemini 2.5 Computer Use(以下「Computer Use」)は、ブラウザ画面を「見て・クリックして・入力して」操作できる新モデル。この記事では note.com へのログインから記事公開までを、Playwright と Gemini APIで自動化する最小構成を解説します。モデルの仕組みや提供形態 ...
AIエージェントがウェブサイトやアプリのボタンをクリックしたり、メニューを選択したり、あるいは入力フィールドに文字を入力したりできる機能「computer use」をMicrosoftが発表しました。 Announcing new computer use in Microsoft Copilot Studio for UI automation | Microsoft ...
Anthropicが10月に Claude の「Computer Use」機能をリリースして以来、AI エージェントが人間の操作を模倣できる能力について大きな期待が寄せられている。シンガポール国立大学の Show Labによる新しい研究では、現世代の GUI エージェントに何が期待できるかの ...
Perplexityは、「コンピューター」という言葉の本質は、複雑な作業を分担し、正確に進める仕組みにあるという。現在のAIモデルはすでに非常に高い能力を持っているが、それらをタスクやツール、時間をまたいで連携させ、実際の作業として進めるための仕組み ...
Google DeepMindは米国時間10月7日、人間のようにウェブブラウザーを操作できる新しいAIモデルを一般公開プレビューとして発表した。 このモデルは「Gemini 2.5 Pro」を基盤に構築されており、「Computer Use」と呼ばれる新機能を通じて、ウェブページ上でクリック ...
米Anthropicは、自律型AIエージェントを開発するシアトルのスタートアップ企業Verceptを買収したと発表した。この買収により、自社のAIモデル「Claude」におけるコンピュータ操作機能「Computer Use」のさらなる強化を図る。Verceptの既存製品であるデスクトップアプリ「Vy」は30日以内にサービスを終了し、同社の開発チームはAnthropicに合流する。
Computer useは「まだ初期段階」であり、今後数カ月のうちに、急速な能力向上を見込んでいるという。 同日に公開されたデモ動画では、Webサイトコーディングや友人とのサンフランシスコ観光のためのカレンダー・スケジュール作成などの活用を紹介している。
米Microsoftは10月31日(現地時間)、「Researcher with Computer Use」を発表した。まずはMicrosoftの最新AI機能を先行体験できる「Frontier」プログラムへ参加している「Microsoft 365 Copilot」ユーザーに提供される。 「Researcher」は、専門家のような徹底した調査を行って ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する