หนึ่งในไฮไลต์ของ Google I/O ที่ทำให้หลายคนว้าวก็คือ Veo เครื่องมือสร้างวิดีโอจากข้อความ ที่ให้ภาพเหมือนจริง พร้อมใส่เอฟเฟกต์ต่างๆให้ดึงดูดมากยิ่งขึ้น
Veo ใช้พลังของ Gemini สามารถสร้างวิดีโอคุณภาพสูงที่มีความละเอียด 1080p ในรูปแบบภาพยนตร์และสไตล์ภาพที่หลากหลาย ในความยาวที่นานกว่าหนึ่งนาที เพียงแค่พิมพ์บรรยายสิ่งที่เราต้องการเท่านั้น ด้วยความเข้าใจขั้นสูงเกี่ยวกับภาษาธรรมชาติและความหมายของภาพ ทำให้สร้างวิดีโอได้ใกล้เคียงกับสิ่งที่ผู้ใช้จินตนาการไว้อย่างมีความคิดสร้างสรรค์ พร้อมสร้างโทนและรายละเอียดได้อย่างแม่นยำจาก prompts ที่เราป้อนเข้าไป
โมเดล AI นี้เปิดให้เราใช้ความคิดสร้างสรรค์ได้อย่างเต็มที่ แถมยังเข้าใจศัพท์ทางด้านภาพยนตร์ เช่น “timelapse” หรือ “ภาพมุมสูงของพื้นที่” รวมถึงสามารถสร้างวิดีโอที่สน่ำเสมอและสอดคล้องกัน โดยที่คน สัตว์หรือวัตถุต่างๆมีความสมจริงในทุกซีน ทาง Google ได้เชิญครีเอเตอร์และนักสร้างภายนตร์มาทดสอบการใช้งาน เพื่อนำความเห็นไปปรับการทำงานให้ดีขึ้น เช่น Donald Glover จากสตูดิโอ Gilga
เบื้องหลัง Veo คือ generative video model work ที่ผสานการทำงานระหว่าง Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet และ Lumiere รวมกับเทคนิคอื่นๆ เช่น scaling laws เพื่อให้คุณภาพและรายละเอียดสูงสุด โดยเทคนิคส่วนนึงเป็นผลมาจากงานวิจัยด้าน AI
ตอนนี้ Veo เริ่มเปิดให้ใช้งานแล้ว ในกลุ่มครีเอเตอร์ที่ได้รับการคัดเลือกก่อนแบบไพรเวทพรีวิว ใครที่สนใจสามารถลงทะเบียนความสนใจใน waitlist ได้ ส่วนในอนาคตนั้นทาง google จะนำความสามารถบางส่วนของ Veo ไปใส่ใน YouTube Shorts และผลิตภัณฑ์อื่นๆด้วย
ที่มา https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/#Imagen-3