Google ใกล้เปิดตัว AI Agent ที่สามารถควบคุมเว็บเบราว์เซอร์เพื่อช่วยให้ผู้ใช้จัดการงานประจำวันโดยอัตโนมัติ

The Information รายงานว่า Google กำลังพัฒนา “ตัวแทน (Agent) ที่สามารถใช้คอมพิวเตอร์” ภายใต้ชื่อรหัส Project Jarvis และอาจพร้อมให้ดูตัวอย่างพรีวิวได้ในเร็วที่สุดในเดือนธันวาคม แหล่งข่าวระบุว่า Jarvis “สามารถตอบสนองต่อคำสั่งของผู้ใช้ด้วยการจับภาพหน้าจอคอมพิวเตอร์บ่อยๆ แล้วทำการตีความภาพเหล่านั้น ก่อนที่จะดำเนินการ เช่น คลิกปุ่มหรือพิมพ์ลงในช่องข้อความ”

มีรายงานว่า Jarvis ถูกสร้างขึ้นมาเพื่อทำงานกับเว็บเบราว์เซอร์เท่านั้น โดยเฉพาะ Chrome เพื่อช่วยเหลือในการทำงานทั่วไป เช่น การค้นหา ช้อปปิ้ง และจองเที่ยวบิน

ทาง Google ยังคงขยายขีดความสามารถของ Gemini AI ซึ่งรุ่นเจเนอเรชั่นถัดไปคาดว่าจะเปิดตัวในเดือนธันวาคม ตามรายงานของ The Verge บอกว่า Gemini Live แชทบอท AI ของ Google ได้รับการสนับสนุนสำหรับภาษาใหม่ๆ หลายสิบภาษาในเดือนนี้ นอกจากนั้นยังนำ Gemini ไปผสานการทำงานกับ Google Meet, Photos และแอปพลิเคชันอื่นๆ เมื่อไม่นานมานี้

ข่าวเกี่ยวกับ Jarvis ถูกปล่อยออกมาไม่กี่วันหลังจากที่ Anthropic เปิดตัวฟีเจอร์ที่คล้ายกันแต่ดูเหมือนจะครอบคลุมมากขึ้นสำหรับ Claude AI โดยบริษัทกล่าวว่าฟีเจอร์ดังกล่าวได้รับการติดตั้งทักษะคอมพิวเตอร์เพื่อให้ “สามารถใช้เครื่องมือมาตรฐานและโปรแกรมซอฟต์แวร์ที่หลากหลายที่ออกแบบมาสำหรับผู้คน” ได้ คุณสมบัติดังกล่าวพร้อมใช้งานในเวอร์ชันเบต้าสาธารณะแล้ว

ที่มา https://www.engadget.com/ai/google-is-reportedly-developing-jarvis-ai-that-could-take-over-your-web-browser-163404705.html?_fsig=CUTE7atQwC4hBdzkUVUltg–%7EA