Google เข้าสู่การแข่งขัน AI Avatar: Veo 3.1 ขับเคลื่อน Avatar ใหม่ใน Google Vids
Google ปรับปรุง Vids ด้วย Avatar ที่ขับเคลื่อนโดย Veo 3.1 สัญญาให้ผู้ใช้ระดับองค์กรชอบมากกว่าคู่แข่งถึงห้าเท่า เปรียบเทียบกับ Synthesia และ HeyGen ได้อย่างไร
Google เพิ่งปรับปรุง AI Avatar ใน Google Vids ด้วย Veo 3.1 ซึ่งเป็นโมเดลการสร้างวิดีโอระดับสูงสุดของพวกเขา การอ้างสิทธิ์นี้ชาญฉลาด: ผู้ใช้ชอบ Avatar เหล่านี้มากกว่าคู่แข่งถึงห้าเท่า สำหรับองค์กรที่อยู่ในระบบนิเวศ Workspace แล้ว สิ่งนี้เปลี่ยนการสนทนาเกี่ยวกับวิดีโอ AI สำหรับการฝึกอบรมและการสื่อสารภายในองค์กร
สิ่งที่เปลี่ยนไป
การปรับปรุงเมื่อวันที่ 18 ธันวาคม เปลี่ยนวิธีที่ Google Vids สร้าง AI Presenter Avatar ก่อนหน้านี้ Avatar ใช้เทคโนโลยีรุ่นเก่า ตอนนี้ทำงานบน Veo 3.1 ซึ่งเป็นโมเดลเดียวกับที่ขับเคลื่อน เครื่องมือแก้ไขสร้างสรรค์ของ Google Flow
การปรับปรุงในทางปฏิบัติ:
การแสดงออกที่ดีขึ้น
Avatar ขณะนี้แสดงการเคลื่อนไหวใบหน้าที่เป็นธรรมชาติและความหลากหลายทางอารมณ์มากขึ้น ความแข็งเกร็งแบบหุ่นยนต์ของเวอร์ชั่นก่อนหน้านี้หายไปเป็นส่วนใหญ่
การซิงโครไนซ์ลิปที่นุ่มนวล
การซิงโครไนซ์ของเสียงจะแน่นกว่าอย่างเห็นได้ชัด ปรากฏการณ์ Uncanny Valley ที่การเคลื่อนไหวของปากล่าช้ากว่าเสียงได้ลดลงเหลือน้อยที่สุด
การจัดกรอบที่เสถียรมากขึ้น
ความเสถียรของกล้องสม่ำเสมอตลอดคลิปที่นานกว่า ไม่มีความสั่นเล็กน้อยหรือการลอยตัวที่รบกวนจากรุ่น Avatar รุ่นก่อนหน้า
การสร้างที่เร็วขึ้น
ราคาเดียวกัน ผลลัพธ์ที่เร็วขึ้น Google เน้นว่าสิ่งนี้ทำงานโดยไม่คิดค่าใช้สอยเพิ่มเติมสำหรับลูกค้า Workspace ที่มีอยู่
ใครสามารถเข้าถึงได้
นี่ไม่ใช่คุณสมบัติของผู้บริโภค การปรับปรุงมีจุดประสงค์เพื่อบัญชี Workspace ระดับองค์กร:
| ระดับ | การเข้าถึง |
|---|---|
| Business Starter, Standard, Plus | เข้าถึงเต็ม |
| Enterprise Starter, Standard, Plus | เข้าถึงเต็ม |
| ตัวแปร Essentials | เข้าถึงเต็ม |
| องค์กรไม่หวังผล | เข้าถึงเต็ม |
| Education Plus | เข้าถึงเต็ม |
| ผู้ติดตามสมาชิก Google AI Pro/Ultra | เข้าถึงเต็ม |
Google กำลังเสนอขีดจำกัดการใช้งานที่สูงขึ้น 30 วันหลังจากการเปิดตัว หลังจากนั้นจะมีข้อจำกัดต่อผู้ใช้ หากคุณต้องการทดสอบขีดจำกัดตอนนี้คือเวลาที่เหมาะสม
ภูมิประเทศ AI Avatar ระดับองค์กร
Google กำลังเข้าสู่ตลาดที่คับแคบ Synthesia และ HeyGen ใช้เวลาหลายปีในการสร้างแพลตฟอร์ม Avatar ระดับองค์กร นี่คือที่ที่ทุกคนอยู่
ผู้นำตลาดปัจจุบัน
Synthesia เป็นผู้บุกเบิก AI Avatar ระดับองค์กร พวกเขาอ้างว่า 90% ของบริษัท Fortune 100 เป็นลูกค้าโดยมีการสอดคล้อง SOC 2 Type II, GDPR และ ISO 42001 จุดแข็งของพวกเขาคือความปลอดภัย การปกครอง และคอนโซลผู้ดูแลระบบที่บ้านสำหรับการปรับใช้ขนาดใหญ่
HeyGen มุ่งเน้นไปที่ความเร็วและความยืดหยุ่น เทคโนโลยี Avatar IV ของพวกเขาให้การเคลื่อนไหวของร่างกายเต็มรูปแบบและการแสดงออกทางอารมณ์ การสร้างไม่จำกัดในแผนที่ชำระเงินดึงดูดทีมที่สร้างเนื้อหาปริมาณสูง
D-ID เก่งในการทำให้ภาพนิ่งมีชีวิต สำหรับคลิปโซเชียลที่รวดเร็วหรือเปลี่ยนรูปภาพให้เป็น Avatar ที่พูดได้ พวกเขายังคงมีการแข่งขัน
Google Vids เปรียบเทียบอย่างไร
| คุณสมบัติ | Google Vids | Synthesia | HeyGen |
|---|---|---|---|
| ไลบรารี Avatar | จำกัด (เติบโต) | 240+ avatar | 1,100+ avatar |
| ภาษา | กำลังขยาย | 120+ | 175+ |
| ระยะเวลาสูงสุด | 60 วินาที | นาที | แตกต่างกันไปตามแผน |
| การโคลนเสียง | ยังไม่ได้ประกาศ | มี | มี |
| การปฏิบัติตาม | ระดับ Workspace | SOC 2, ISO 42001 | SOC 2 |
| การรวมตัว | Workspace ที่กำเนิด | Standalone + API | Standalone + API |
- การรวมตัว Workspace ที่กำเนิด (Docs, Slides, Drive)
- ไม่มีความสัมพันธ์ผู้ขายเพิ่มเติมในการจัดการ
- รวมอยู่ในราคา Workspace ที่มีอยู่
- คุณภาพสายตา Veo 3.1
- อินเทอร์เฟซ Google ที่คุ้นเคยสำหรับพนักงาน
- ไลบรารี Avatar ที่เล็กกว่าผู้เชี่ยวชาญ
- ตัวเลือกภาษาน้อยกว่าในปัจจุบัน
- ยังไม่มีการโคลนเสียง
- ขีดจำกัด 60 วินาทีเทียบกับคลิปคู่แข่งที่นานกว่า
- คุณสมบัติผู้ดูแลระบบองค์กรที่บ้านน้อยกว่า
กรณีการใช้งานที่สมเหตุสมผล
จากความสามารถและข้อจำกัด นี่คือที่ที่ Avatar Google Vids พอดี:
- ✓เนื้อหาการฝึกอบรมภายใน: พัฒนาทักษะพนักงานด้วยวิดีโอสอนที่สม่ำเสมอและสามารถทำซ้ำได้
- ✓ประกาศขององค์กร: การส่งข้อความที่ได้มาตรฐานกับผู้นำเสนอที่สม่ำเสมอ
- ✓เอกสารช่วยเหลือที่รวดเร็ว: ตอบคำถามทั่วไปด้วยวิดีโอที่น่าสนใจแทนข้อความ
- ✓วัสดุการเข้าสู่ระบบ: ต้อนรับพนักงานใหม่ด้วยเนื้อหาวิดีโอที่ปรับปรุงได้
ที่ที่ต้องมองหาเพิ่มเติม:
- ○แคมเปญทั่วโลกหลายภาษา: Synthesia หรือ HeyGen มีการครอบคลุมภาษามากขึ้น
- ○เนื้อหาการตลาดปริมาณสูง: การสร้างไม่จำกัดของ HeyGen สมเหตุสมผลมากขึ้น
- ○วิดีโอที่เผชิญหน้าลูกค้าภายนอก: แพลตฟอร์มผู้เชี่ยวชาญมีการขัดเงาเพิ่มเติม
ข้อดีของการรวมตัว
ข้อเสนอมูลค่าที่แท้จริงไม่ใช่เพียงคุณภาพ Avatar เท่านั้น มันคือการรวมตัว
ลำดับการทำงาน Avatar ดั้งเดิม:
- เข้าสู่แพลตฟอร์ม Avatar แยกต่างหาก
- เขียนสคริปต์หรือวางจากเอกสาร
- เลือก avatar และการตั้งค่า
- สร้างวิดีโอ
- ดาวน์โหลดไปยังที่เก็บข้อมูลในเครื่อง
- อัปโหลดไปยังไดรฟ์บริษัท หรือ LMS
- แบ่งปันลิงก์กับทีม
- ติดตามแยกจากเนื้อหาอื่น
ลำดับการทำงาน Google Vids:
- เปิด Google Vids (อินเทอร์เฟซเดียวกับ Docs/Slides)
- สร้าง avatar โดยตรง
- เนื้อหาอยู่ใน Drive โดยอัตโนมัติ
- แบ่งปันเหมือนไฟล์ Workspace ใดๆ
- วิเคราะห์ภายใน Workspace
สำหรับองค์กรที่ได้มาตรฐานอยู่แล้วใน Google Workspace การขจัดการสลับบริบทมีความสำคัญ แผนกไอทีชื่นชมผู้ขายคนน้อยลงในการประเมิน สัญญา และสนับสนุน
การวิเคราะห์ต้นทุน
โครงสร้างการกำหนดราคาแตกต่างอย่างพื้นฐานจากคู่แข่ง
Synthesia และ HeyGen คิดค่าธรรมเนียมต่อที่นั่งหรือต่อนาทีเพิ่มเติมจากต้นทุนชุดการผลิตประสิทธิผลที่มีอยู่ของคุณ ชั้นเริ่มต้นมีราคาประมาณ 18-30 ดอลลาร์/เดือนต่อผู้ใช้
Google Vids รวมอยู่ในการกำหนดราคา Workspace หากคุณจ่ายสำหรับ Business Standard หรือสูงกว่าแล้ว คุณสมบัติ Avatar จะรวมอยู่ด้วย ไม่มีต้นทุนเพิ่มเติมสำหรับการใช้งานพื้นฐาน
สำหรับองค์กรที่อยู่แล้วใน Workspace ต้นทุนส่วนเพิ่มของ Avatar Google Vids นั้นไม่มีผล แม้ว่า Avatar จะไม่ได้ขัดเงาเท่า Synthesia แต่การคำนวณ ROI ก็เปลี่ยนไปเมื่อไม่มีรายการบรรทัดใหม่
เศรษฐศาสตร์โปรดปรานของ Google สำหรับ:
- องค์กรอยู่แล้วใน Workspace
- วิดีโอสำหรับการใช้งานภายใน (การฝึกอบรม ประกาศ)
- การผลิตปริมาณปานกลาง
เศรษฐศาสตร์โปรดปรานผู้เชี่ยวชาญสำหรับ:
- การตลาดภายนอกในระดับใหญ่
- ความต้องการในการแปลที่ครอบคลุมหลายภาษา
- ข้อกำหนดการปรับแต่งขั้นสูง
การปฏิบัติทางเทคนิค
สำหรับนักพัฒนาและทีม IT นี่คือลักษณะการรวมตัว:
Google Vids ทำงานภายในระบบนิเวศ Workspace เนื้อหาซิงโครไนซ์กับ Drive สิทธิ์ตามนโยบาย Workspace SSO ทำงานโดยอัตโนมัติ ไม่มี API แยกต่างหากในการรวมตัว ไม่มีฐานข้อมูลผู้ใช้แยกต่างหากในการดูแล
// Workspace Admin SDK สามารถจัดการการเข้าถึง Vids
// ตัวอย่าง: ตรวจสอบว่า Vids เปิดใช้งานสำหรับผู้ใช้หรือไม่
const admin = google.admin('directory_v1');
const services = await admin.users.list({
domain: 'yourcompany.com',
projection: 'full'
});
// การเข้าถึง Vids ตามชั้นลิขสิทธิ์ Workspaceสำหรับองค์กรที่มีแอป Workspace Marketplace ที่มีอยู่หรือการรวมตัวที่กำหนดเอง เนื้อหา Vids สามารถเข้าถึงได้ผ่าน API Drive เดียวกับที่คุณใช้อยู่แล้ว
การอ้างสิทธิ์การต้องการ 5 เท่า
Google ระบุว่าผู้ใช้ต้องการ Avatar Vids มากกว่าคู่แข่งถึงห้าเท่า นี่คือการอ้างสิทธิ์ที่อ้อมแอมซึ่งสมควรได้รับการตรวจสอบอย่างระมัดระวัง
Google ไม่ได้เผยแพร่วิธีการ ที่อยู่เบื้องหลังการอ้างสิทธิ์การต้องการ 5 เท่า เราไม่รู้ว่าคู่แข่งตัวใดถูกเปรียบเทียบ เนื้อหาใดที่ถูกทดสอบ หรือขนาดตัวอย่าง ใช้หมายเลขนี้เป็นการตลาดแทนที่จะเป็นการตรวจสอบที่เป็นอิสระ
สิ่งที่เราสามารถสังเกตได้จากการทดสอบ:
- คุณภาพการซิงโครไนซ์ลิปถูกปรับปรุงอย่างแท้จริง
- การแสดงออกของใบหน้าเป็นธรรมชาติมากกว่าเวอร์ชัน Veo 3.1 ก่อนหน้า
- ความเสถียรของเฟรมดีขึ้น
- ความเร็วในการสร้างมีการแข่งขัน
ไม่ว่าสิ่งนี้จะแปลเป็นการต้องการ 5 เท่าขึ้นอยู่กับกรณีการใช้งานและจุดเปรียบเทียบเป็นอย่างมาก ต่อต้านชั้นพื้นฐาน D-ID อาจจะ ต่อต้านประเมิน Avatar Synthesia อาจจะน้อยลง
ความหมายสำหรับผู้ใช้ Lengthen.ai
เนื่องจากเราใช้ Veo 3 สำหรับการสร้างบนแพลตฟอร์มของเรา การปรับปรุง Veo 3.1 นั้นเป็นบริบทที่เกี่ยวข้อง การปรับปรุงโมเดลพื้นฐานเดียวกันที่ขับเคลื่อน Avatar Google Vids มักจะปรากฏในการเข้าถึง API Veo 3.1 เมื่อเวลาผ่านไป
สำหรับ การยอมรับวิดีโอ AI ระดับองค์กร การเข้าของ Google ในพื้นที่ Avatar บ่งชี้ถึงการยอมรับกระแสหลักต่อเนื่อง เมื่อ Google บรรจุความสามารถใน Workspace จะตรวจสอบหมวดหมู่
คำแนะนำการปฏิบัติ
หากคุณประเมินผล AI Avatar สำหรับการใช้งานองค์กร:
เริ่มต้นด้วย Google Vids หาก:
- คุณอยู่บน Workspace Business Standard ขึ้นไปแล้ว
- กรณีการใช้งานคือการสื่อสารภายในหรือการฝึกอบรม
- ไอทีต้องการผู้ขายน้อยลงในการจัดการ
- งบประมาณมี จำกัด
ประเมิน Synthesia หาก:
- ข้อกำหนดการปฏิบัติตามเป็นเนื้อหา (อุตสาหกรรมที่มีการควบคุม)
- คุณต้องการการแปลที่ครอบคลุมหลายภาษา
- เนื้อหาที่เผชิญหน้าลูกค้าเป็นลำดับความสำคัญ
- ปริมาณรองรับการลงทุนแพลตฟอร์มเฉพาะ
พิจารณา HeyGen หาก:
- จำเป็นต้องมีการผลิตปริมาณสูง
- เนื้อหาการตลาดและการขายเป็นการใช้งานหลัก
- ความยืดหยุ่นในสร้างสรรค์มีความสำคัญมากกว่าการปกครอง
สิ่งที่มาต่อไป
คุณลักษณะ Avatar มักจะขยาย คาดว่า:
- ไลบรารี Avatar ที่ใหญ่ขึ้น (ปัจจุบันจำกัดเมื่อเทียบกับผู้เชี่ยวชาญ)
- การสนับสนุนภาษาเพิ่มเติม
- ระยะเวลาคลิปที่นานกว่า
- การรวมตัวกับ Gemini สำหรับการสร้างสคริปต์
- การโคลนเสียงที่เป็นไปได้ (คู่แข่งแล้วเสนอสิ่งนี้)
Google แรลลักษณ์เปิดตัวคุณลักษณะและละทิ้งไว้ใน Workspace ฐาน Veo 3.1 แนะนำการลงทุนต่อเนื่อง
ลองสิ่งนี้
หากคุณมีการเข้าถึง Workspace:
- เปิด Google Vids (vids.google.com)
- สร้างวิดีโอใหม่
- เพิ่มบล็อก AI Avatar
- เขียนสคริปต์ทดสอบ
- สร้างและเปรียบเทียบกับวิธีแก้ปัญหาปัจจุบันของคุณ
ขีดจำกัด 30 วันที่ยกระดับทำให้นี่เป็นการทดลองความเสี่ยงต่ำ กรณีที่เลวร้ายที่สุด คุณตรวจสอบว่าชุดเครื่องมือปัจจุบันของคุณดีกว่า กรณีที่ดีที่สุด คุณขจัดผู้ขายและทำให้สแต็กของคุณง่ายขึ้น
ตลาด AI Avatar เพิ่งได้รับคู่แข่งใหม่ที่มีธนาคารลึก และข้อดีในการจัดจำหน่าย ไม่ว่าจะแปลเป็นผลลัพธ์ที่ดีกว่าสำหรับองค์กรของคุณนั้นขึ้นอยู่กับที่ที่คุณอยู่แล้ว ไม่ใช่ที่ Google ต้องการให้คุณไป
การอ่านที่เกี่ยวข้อง: เรียนรู้เพิ่มเติมเกี่ยวกับ ความสามารถในการแก้ไข Google Flow, เปรียบเทียบ Sora 2 vs Runway vs Veo 3, หรือสำรวจ กรณีธุรกิจสำหรับวิดีโอ AI ระดับองค์กร.
แหล่งข้อมูล
- Google Workspace Updates: Veo 3.1 Powered Avatars (Google)
- Google Vids Upgrade Analysis (Chrome Unboxed)
- Synthesia Enterprise Features (Synthesia)
- HeyGen Comparison (HeyGen)
บทความนี้มีประโยชน์หรือไม่?

Damien
นักพัฒนา AIนักพัฒนา AI จากลียงที่ชอบเปลี่ยนแนวคิด ML ที่ซับซ้อนให้เป็นสูตรง่ายๆ เมื่อไม่ได้แก้ไขบั๊กโมเดล คุณจะพบเขาปั่นจักรยานผ่านหุบเขาโรน
บทความที่เกี่ยวข้อง
สำรวจเนื้อหาต่อกับบทความที่เกี่ยวข้องเหล่านี้

Pika 2.5: ทำให้วิดีโอ AI เข้าถึงได้ง่ายผ่านความเร็ว ราคา และเครื่องมือสร้างสรรค์
Pika Labs เปิดตัวเวอร์ชัน 2.5 ที่รวมการสร้างที่เร็วขึ้น ฟิสิกส์ที่ได้รับการปรับปรุง และเครื่องมือสร้างสรรค์อย่าง Pikaframes และ Pikaffects เพื่อทำให้วิดีโอ AI เข้าถึงได้สำหรับทุกคน

Mirelo ระดมทุน $41M เพื่อแก้ปัญหาความเงียบของ AI Video
Startup จากเบอร์ลิน Mirelo เพิ่งได้รับเงินทุน $41 ล้านดอลลาร์จาก Index Ventures และ a16z เพื่อนำเสียงเอฟเฟกต์ที่สร้างด้วย AI มาสู่วิดีโอ ด้วยการสนับสนุนจากผู้บริหารของ Mistral และ Hugging Face พวกเขากำลังสร้างสิ่งที่อุตสาหกรรมต้องการอย่างมาก: เสียงอัจฉริยะสำหรับการปฏิวัติวิดีโอที่เงียบงัน

คู่มือฉบับสมบูรณ์สำหรับการเขียน Prompt วิดีโอ AI ในปี 2025
เรียนรู้ศิลปะการสร้าง prompt ที่สามารถสร้างวิดีโอ AI ที่สวยงามน่าทึ่ง ด้วยกรอบการทำงาน 6 ชั้น คำศัพท์ทางภาพยนตร์ และเทคนิคเฉพาะแพลตฟอร์ม