Google เปิดตัว Gemini โมเดล AI ที่ใหญ่ที่สุดและมีประสิทธิภาพสูงเท่าที่มีมา หลังได้แรงกดดันว่าจะหารายได้จาก AI อย่างไร
Gemini เป็นโมเดลภาษาขนาดใหญ่ ที่สร้างจาก multimodal นั่นหมายความว่ามันสามารถเข้าใจและทำงานกับข้อมูลที่หลากหลาย ไม่ว่าจะเป็นข้อความ โค้ด เสียง รูปภาพและวิดีโอ มันแยกย่อยเป็น 3 ขนาดที่ต่างกัน คือ
- Gemini Ultra มีขนาดใหญ่สุด มีความสามารถมากที่สุด
- Gemini Pro ที่มีขนาดรองลงมา ตอบโจทย์งานที่หลากหลาย
- Gemini Nano สำหรับใช้งานเฉพาะอย่าง รวมถึงเหมาะกับใช้งานบนอุปกรณ์พกพา สมาร์ตโฟนรุ่นแรกที่ได้ใช้งานคือ Pixel 8 Pro แต่ต้องบอกว่าการใช้งานอาจจะจำกัดอยู่เพราะมือถือมีข้อจำกัดเรื่องการประมวลผลและหน่วยความจำที่อาจจะสู้คอมพิวเตอร์ไม่ได้ ดังนั้นฟีเจอร์ที่ใช้งานได้ในช่วงแรกก็ยังน้อยอยู่ เช่น ช่วยสรุปข้อมูลใน Recorder จากเสียงที่เราบันทึกไว้ ทำงานได้แม้ไม่ต่อเน็ตเพราะใช้การประมวลผลโดยตรงจากในเครื่อง หรือการ ตอบกลับอัตโนมัติในแชท Gboard ซึ่ง AI จะวิเคราะห์ข้อความที่ส่งมาแล้วตอบกลับอย่างเหมาะสม
ทาง Google วางแผนที่จะเปิดให้ใช้ Gemini ผ่าน Google Cloud โดยลูกค้าสามารถนำไปผนวกกับแอปของตัวเองได้
ตั้งแต่ 13 ธันวาคมเป็นต้นไปทั้งนักพัฒนาและลูกค้าองค์กรสามารถเข้าถึง Gemini Pro ผ่าน Gemini API ใน Google AI Studio หรือ Google Cloud Vertex AI ฝั่งนักพัฒนาบน Android ก็สามารถสร้างแอปด้วย Gemini Nano เช่นกัน นั่นหมายความว่า Gemini จะถูกใช้เพื่อเพิ่มศักยภาพผลิตภัณฑ์ของ Google อย่าง Bard และ Search Generative Experience ช่วยให้ตอบคำถามหรือค้นหาข้อมูลในรูปแบบการสนทนาได้ดีขึ้น รวมถึง Gemini ยังสามารถใช้สร้างคอนเทนท์ เขียบนบล็อก แคมเปญการตลาด จนไปถึงสร้างแอปที่ช่วยสรุปการประชุมหรือแอปเขียนโค้ดได้
ทาง Google ได้ยกตัวอย่างการใช้งาน เช่น การจับภาพหน้าจอและวิเคราะห์งานวิจัยจำนวนหลายร้อยหน้าได้ และทำการอัปเดตแผนภูมิในนั้นได้ วิเคาะห์การบ้านคณิตศาตร์และตรวจได้ว่าข้อไหนตอบถูก ข้อไหนตอบผิด พร้อมเฉลยจุดที่ตอบผิดให้
Gemini Ultra นั้นเป็นโมเดล AI ตัวแรกที่ทำงานไห้เหนือกว่ามนุษย์ในด้านของ MMLU (massive multitask language understanding) ซึ่งรวม 57 หัวข้อไว้ เช่น คณิตศาสตร์, ฟิสิกส์, ประวัติศาสตร์, กฎหมาย, การแพทย์และจริยธรรม ซึ่งมันเอาชนะได้ในแง่ขององค์ความรู้และการแก้ปัญหา เพราะมันเข้าใจและมีตรรกะในการคิดวิเคราะห์เรื่องที่ซับซ้อน นอกจากนั้นฝั่งของ Google Bard ก็จะใช้ Gemini Pro มาช่วยในการวิเคราะห์แยกแยะ ให้เหตุผล ทำความเข้าใจ เริ่มตั้งแต่วันนี้เป็นต้นไป

ทาง Google เองก็โชว์ตารางผลทดสอบ Gemini เทียบกับ GPT-4 ของ OpenAI ก็พบว่าสามารถเอาชนะได้ในหลายด้าน ไม่ว่าจะเป็น MMLU ชุดคำถามวิชาต่างๆรวม 57 วิชา, GSM8K ชุดทดสอบคณิตศาสตร์ระดับมัธยม, MATH แบบทดสอบคณิตศาสตร์ 5 ระดับ, HumanEval และ Natural2Code ทดสอบการเขียนโค้ด Python เป็นต้น
ถือว่าเป็นการอัปเดตครั้งใหญ่ หลังจากที่ Bard เปิดตัวไปเมื่อ 8 เดือนที่แล้ว ซึ่งผลการทดสอบหลายๆด้านพบว่า Gemini Ultra สามารถเอาชนะ GPT-4 ของ OpenAI ได้ ส่วนเรื่องการหารายได้นั้นทางผู้บริหารของ Google ยังไม่ได้บอกรายละเอียด ซึ่งมีแนวโน้มที่จะเก็บค่าบริการจากการเข้าถึงฟีเจอร์แบบ Advanced
ที่มา https://www.cnbc.com/2023/12/06/google-launches-its-largest-and-most-capable-ai-model-gemini.html