OpenAI ประกาศทดสอบเครื่องมือใหม่ Voice Engine ในกลุ่มตัวอย่างเล็กๆ สามารถโคลนเสียงใครก็ได้ จากการใช้ไฟล์เสียงความยาว 15 วินาทีเท่านั้น ด้วยคำพูดที่เป็นธรรมชาติและสื่ออารมณ์ได้

เทคโนโลยีนี้มีพื้นฐานจาก text-to-speech API ที่เริ่มพัฒนามาตั้งแต่ปี 2022 ซึ่ง OpenAI ได้ใช้ชุดเครื่องมือที่อยู่ในนั้นมาสร้างเสียงจากข้อความคู่กับฟีเจอร์อ่านออกเสียง โดยปล่อยตัวอย่างให้ฟังผ่านบล็อก เมื่อฟังแล้วหลายคนก็น่าจะเห็นภาพการนำไปใช้งานได้ชัดเจนขึ้น

ทาง OpenAI มองว่าเทคโนโลยีสามารถนำมาใช้เรื่องของการช่วยอ่านออกเสียง แปลภาษา และช่วยให้คนที่มีปัญหาการพูดสื่อสารได้ดีขึ้น แน่นอนว่าบางคนอาจจะเอาไปใช้ในทางที่ผิดได้ซึ่งตรงนี้ก็ต้องมาหามาตรการรับมือกัน ซึ่งทาง OpenAI ก็ตระหนักถึงเรื่องนี้ จึงเลือกทดสอบในกลุ่มเล็กๆก่อน พร้อมรับฟังความคิดเห็นจากพันธมิตรอย่างสื่อ หน่วยงานภาครัฐ ภาคการศึกษา ภาคบันเทิง เพื่อให้มั่นใจว่าจะไม่เกิดผลกระทบเมื่อเปิดใช้งานในวงกว้าง ซึ่งคนที่ร่วมทดสอบต้องยอมรับข้อตกลงในการใช้งานก่อน ซึ่งต้องไม่กระทบต่อสิทธิส่วนบุคคลและกฎหมาย

รวมถึงคนที่ใช้เทคโนโลยีนี้ต้องแจ้งให้คนอื่นๆทราบด้วยว่า มีการใช้ AI โคลนเสียงขึ้นมา ซึ่ง OpenAI ก็เพิ่มมาตรการรับมือ เช่น ใส่ลายน้ำเพื่อตามรอยต้นฉบับเสียง รวมถึงสอดส่องว่ามีการนำไปใช้งานอะไรบ้าง

ตอนนี้ OpenAI ยังปิดปากสนิทไม่ยอมบอกว่าจะเปิดให้ใช้งานจริงช่วงไหน แต่ทาง TechCrunch ได้คาดการณ์ค่าบริการซึ่งจะอยู่ที่เดือนละ 15 ดอลลาร์จะสร้างเสียงจากตัวอักษรได้ 1 ล้านตัวอักษรหรือคิดเป็น 162,500 คำ นอกจากนั้นยังมีการอ้างอิงถึงเวอร์ชัน “HD” ด้วยซึ่งค่าบริการอาจจะเพิ่มขึ้นเป็น 2 เท่า จะได้คุณภาพเสียงที่ดีขึ้น

ที่มา https://www.engadget.com/openai-says-it-can-clone-a-voice-from-just-15-seconds-of-audio-190356431.html