SenseTime Seko 2.0: สร้างซีรีส์ 100 ตอนด้วย AI จากคำสั่งเดียว
SenseTime เพิ่งเปิดตัวเอเจนต์วิดีโอ AI แบบหลายตอนรายการแรกในอุตสาหกรรม Seko 2.0 สามารถสร้างซีรีส์แอนิเมชั่นทั้งหมดด้วยตัวละคร เสียง และเนื้อเรื่องที่สอดคล้องกันจากไอเดียสร้างสรรค์เพียงหนึ่งเดียว ยุคของเนื้อหาต่อเนื่องที่สร้างด้วย AI มาถึงแล้ว

จะเป็นอย่างไรถ้าคุณสามารถอธิบายแนวคิดเรื่องราวและให้ AI สร้างซีรีส์แอนิเมชั่น 100 ตอนทั้งหมด ไม่ใช่คลิปที่ขาดความต่อเนื่อง แต่เป็นการเล่าเรื่องที่สอดคล้องกันด้วยตัวละคร เสียง และความต่อเนื่องของเนื้อเรื่อง SenseTime ทำให้เป็นจริงด้วย Seko 2.0
เหนือกว่าคลิปเดี่ยว: ปัญหาการสร้างเนื้อหาต่อเนื่อง
โมเดล AI วิดีโอทุกตัวเผชิญข้อจำกัดเดียวกัน: พวกเขาสร้างช่วงเวลาที่แยกออกจากกัน คลิป 10 วินาทีของตัวละครที่กำลังเดิน อีกคลิปหนึ่งที่พวกเขากำลังพูด อีกคลิปหนึ่งที่พวกเขากำลังตอบสนอง การเชื่อมต่อเหล่านี้ให้เป็นเรื่องราวที่สอดคล้องกัน นั่นคือปัญหาของคุณ
ปัญหาการสร้างเนื้อหาต่อเนื่องไม่ใช่เรื่องของคุณภาพการสร้าง แต่เป็นเรื่องของความจำ AI จะจำได้อย่างไรว่าตัวเอกมีแผลเป็นที่แก้มซ้าย ว่าตัวร้ายเปลี่ยนฝ่ายในตอนที่ 12 ว่าชื่อของคนรักสะกดอย่างไรในคำบรรยาย
นี่คือเหตุผลที่แอนิเมชั่นระดับมืออาชีพยังคงต้องการกองทัพของศิลปินที่ตรวจสอบแผ่น model รักษาคู่มือสไตล์ และรับรองความต่อเนื่องระหว่างตอน AI สามารถสร้างเฟรมแต่ละเฟรมได้ แต่ไม่สามารถรักษาเรื่องราวได้
จนถึงตอนนี้
Seko 2.0 ทำอะไรได้บ้าง
เมื่อวันที่ 15 ธันวาคม 2025 SenseTime ปล่อย Seko 2.0 ซึ่งพวกเขาอธิบายว่าเป็นเอเจนต์สร้างวิดีโอหลายตอนรายการแรกในอุตสาหกรรม คำสำคัญคือ "เอเจนต์" ไม่ใช่ "โมเดล"
นี่คือขั้นตอนการทำงาน:
- คุณให้แนวคิดสร้างสรรค์ในภาษาธรรมชาติ
- Seko 2.0 สร้างโครงเรื่องที่สมบูรณ์
- ระบบสร้างการแบ่งแยกเนื้อเรื่องโดยละเอียดสำหรับตอนสูงสุด 100 ตอน
- แต่ละตอนสร้างขึ้นด้วยการออกแบบตัวละคร เสียง และการสร้างโลกที่สอดคล้องกัน
- ตัวละครจำเหตุการณ์ก่อนหน้าและความสัมพันธ์ที่พัฒนาไป
AI ไม่ได้สร้างคลิปสุ่ม 100 คลิป แต่รักษาสถานะการเล่าเรื่องตลอดทั้งซีรีส์
สถาปัตยกรรมทางเทคนิค
ความจำหลายตอน
- ฐานข้อมูลตัวละครทั่วโลก
- การติดตามสถานะโลก
- ความสอดคล้องของไทม์ไลน์
- กราฟความสัมพันธ์
- เครื่องมือความต่อเนื่องของเนื้อเรื่อง
ไปป์ไลน์การสร้าง
- SekoIDX สำหรับการจำลองภาพ/ตัวละคร
- SekoTalk สำหรับการซิงค์ริมฝีปากด้วยเสียง
- การกลั่น DMD แบบเฟส
- การประมวลผลแบบขนาน 8-GPU
- ลดต้นทุน 25× เทียบกับพื้นฐาน
SekoTalk น่าประทับใจเป็นพิเศษ: เป็นโซลูชันแรกที่รองรับการซิงค์ริมฝีปากสำหรับผู้พูดมากกว่าสองคนพร้อมกัน ฉากบทสนทนาหลายตัวละครที่เคยต้องการแอนิเมชั่นทีละเฟรม ตอนนี้สร้างได้แบบเรียลไทม์
"การกลั่น DMD แบบเฟส" สมควรได้รับความสนใจ เทคนิคนี้บีบอัดต้นทุนการอนุมานอย่างมากในขณะที่รักษาคุณภาพการเคลื่อนไหวและการแสดงออกทางอารมณ์ไว้ SenseTime อ้างว่าลดต้นทุนได้ถึง 25× เมื่อเทียบกับโมเดลพื้นฐานของพวกเขา ทำให้การสร้างต่อเนื่องเป็นไปได้ทางเศรษฐกิจ
ทำไมสิ่งนี้สำคัญสำหรับผู้สร้าง
ให้ผมวาดภาพของสิ่งที่เป็นไปได้:
การผลิตซีรีส์แอนิเมชั่นแบบดั้งเดิม:
- การพัฒนาแนวคิด: 3-6 เดือน
- การเตรียมการก่อนการผลิต: 6-12 เดือน
- การผลิตตอน: 2-4 สัปดาห์ต่อตอน
- การบันทึกเสียง: หลายเซสชันสตูดิโอต่อตอน
- ต้นทุน: $100,000+ ต่อตอน (สำหรับเนื้อหาคุณภาพ)
การผลิต Seko 2.0:
- แนวคิด: หนึ่งย่อหน้า
- การสร้าง: ชั่วโมงต่อตอน
- เสียง: สร้างพร้อมกับภาพ
- ต้นทุน: "แก้วชานมไข่มุก" ตามที่ SenseTime กล่าว
การทำให้เป็นประชาธิปไตยที่นี่น่าทึ่งมาก ผู้สร้างคนเดียวสามารถผลิตสิ่งที่เคยต้องการสตูดิโอได้แล้ว
การผลักดัน AI วิดีโอของจีน
Seko 2.0 เป็นส่วนหนึ่งของรูปแบบที่กว้างขึ้นที่เรากำลังติดตาม บริษัทเทคโนโลยีจีนกำลังส่งมอบความสามารถ AI วิดีโอที่ก้าวร้าวอย่างน่าทึ่ง:
Kuaishou Kling O1
โมเดลวิดีโอมัลติโมดัลแบบรวมตัวแรก
SenseTime Seko 2.0
เอเจนต์สร้างหลายตอนรายการแรก
Alibaba Wan2.6
การอ้างอิงเป็นวิดีโอด้วยการรักษาเอกลักษณ์
Tencent HunyuanVideo 1.5
โอเพนซอร์สที่เป็นมิตรกับ GPU ผู้บริโภค
เหล่านี้ไม่ใช่การอัปเดตแบบค่อยเป็นค่อยไป แต่ละอย่างแสดงถึงความสามารถใหม่ที่ไม่มีอยู่ในภูมิทัศน์ AI วิดีโอเมื่อหนึ่งเดือนก่อน
บริบททางยุทธศาสตร์มีความสำคัญ บริษัทจีนเผชิญกับข้อจำกัดการส่งออกชิปและข้อจำกัดบริการคลาวด์ของสหรัฐอเมริกา คำตอบของพวกเขา? นวัตกรรมด้านสถาปัตยกรรมและประสิทธิภาพซอฟต์แวร์แทนที่จะเป็นพลังการคำนวณแบบดิบ การลดต้นทุน 25× ของ Seko 2.0 เป็นผลโดยตรงของแรงกดดันนี้
ความสอดคล้องของตัวละครในระดับใหญ่
หนึ่งในปัญหาที่ยากที่สุดใน AI วิดีโอคือการรักษาความสอดคล้องของตัวละครระหว่างการสร้าง เราได้สำรวจเรื่องนี้ในการวิเคราะห์เชิงลึกเกี่ยวกับความสอดคล้องของตัวละคร และ Seko 2.0 แสดงถึงความก้าวหน้าที่สำคัญ
ระบบรักษา:
- ✓ลักษณะใบหน้าในทุกตอน
- ✓ความสอดคล้องของเสื้อผ้าและเครื่องประดับ
- ✓เสียงและรูปแบบการพูด
- ✓ความสูงและสัดส่วนของตัวละคร
- ✓พลวัตความสัมพันธ์ระหว่างตัวละคร
สิ่งนี้เกินกว่าความสอดคล้องทางเทคนิค AI เข้าใจว่าตัวละครควร ประพฤติตัว อย่างสอดคล้องกัน ตัวละครที่ขี้อายจะไม่กลายเป็นคนเปิดเผยอย่างกะทันหันในตอนที่ 50 เว้นแต่เนื้อเรื่องจะต้องการ
การตรวจสอบในโลกแห่งความเป็นจริง
SenseTime ไม่ได้แค่ปล่อยเดโม่เทคโนโลยี พวกเขามีการใช้งานจริง:
Wanxinji บน Douyin
ละครสั้นแบบไลฟ์แอคชันที่สร้างโดย Seko ขึ้นอันดับ #1 ในชาร์ตละครสั้น AI บน Douyin (TikTok จีน) นี่ไม่ใช่การแสดงเทคนิค แต่เป็นเนื้อหาที่แข่งขันกับความบันเทิงที่ผลิตโดยมนุษย์
ความร่วมมือ Yuandongli Film
SenseTime ประกาศความร่วมมือเชิงกลยุทธ์กับ Yuandongli Film เพื่อสำรวจ AIGC ในการผลิตภาพยนตร์และโทรทัศน์ พวกเขาวางแผนที่จะเปิดตัวละครสั้นที่สร้างด้วย AI และกำลังบ่มเพาะภาพยนตร์โรงภาพยนตร์สำหรับปีหน้า
การเปลี่ยนแปลงจาก "เดโม่ที่น่าประทับใจ" เป็น "เนื้อหาเชิงพาณิชย์" คือการตรวจสอบที่แท้จริง เมื่อผู้ชมจริงเลือกที่จะดูซีรีส์ที่สร้างด้วย AI แทนทางเลือกอื่น เทคโนโลยีได้ข้ามเกณฑ์แล้ว
การเชื่อมต่อ Cambricon
รายละเอียดที่มักถูกมองข้าม: Seko 2.0 ทำงานบนชิป Cambricon ซึ่งเป็นผู้ผลิตชิป AI ของจีน นี่แสดงถึงการทำให้เป็นท้องถิ่นแบบ full-stack ของความสามารถ AI วิดีโอ
ความสำคัญคือเชิงกลยุทธ์ บริษัท AI จีนกำลังสร้างสแต็กเทคโนโลยีที่สมบูรณ์ที่ไม่ต้องพึ่งพาการส่งออกฮาร์ดแวร์ของสหรัฐอเมริกา ไม่ว่าคุณจะมองว่าสิ่งนี้น่ากังวลหรือน่าชื่นชม ขึ้นอยู่กับมุมมองของคุณ แต่ความสำเร็จทางเทคนิคนั้นปฏิเสธไม่ได้
การเปรียบเทียบ
Seko 2.0 อยู่ตรงไหนในภูมิทัศน์ปัจจุบัน
| โมเดล | คลิปเดี่ยว | หลายตอน | ความจำตัวละคร | เสียงดั้งเดิม |
|---|---|---|---|---|
| Sora 2 | ✅ ยอดเยี่ยม | ❌ | จำกัด | ✅ |
| Runway Gen-4.5 | ✅ คุณภาพสูงสุด | ❌ | จำกัด | ✅ |
| Veo 3.1 | ✅ แข็งแกร่ง | ❌ | จำกัด | ✅ |
| Kling O1 | ✅ แข็งแกร่ง | ❌ | จำกัด | ✅ |
| Seko 2.0 | ✅ ดี | ✅ 100 ตอน | ✅ เต็มรูปแบบ | ✅ |
Seko 2.0 ไม่ได้แข่งขันในเรื่องคุณภาพคลิปเดี่ยว แต่กำลังสร้างหมวดหมู่ใหม่ทั้งหมด: การผลิตวิดีโอ AI แบบต่อเนื่อง
การสร้างหลายตอนด้วยความต่อเนื่องการเล่าเรื่อง ความจำตัวละครตลอดซีรีส์ ประหยัดต้นทุนในระดับใหญ่ การซิงค์ริมฝีปากหลายผู้พูด
อินเทอร์เฟซเป็นภาษาจีนเป็นหลัก เทียบกับทางเลือกตะวันตกสำหรับคลิปเดี่ยวยังไม่โตเท่า ระบบนิเวศยังคงพัฒนาอยู่
ความหมายสำหรับอุตสาหกรรม
ผลกระทบขยายออกไปนอกเหนือจากการสร้างเนื้อหา:
สำหรับผู้สร้าง:
- การผลิตเนื้อหาต่อเนื่องแบบโซโล
- การสร้างต้นแบบแนวคิดเรื่องราวอย่างรวดเร็ว
- เนื้อหาแฟนในระดับที่ไม่เคยมีมาก่อน
- ความบันเทิงส่วนบุคคล
สำหรับสตูดิโอ:
- การจินตนาการล่วงหน้าในระดับซีรีส์
- การลดต้นทุนสำหรับแอนิเมชั่น
- เวิร์กโฟลว์การพัฒนา IP ใหม่
- การแปลเป็นภาษาท้องถิ่นและการดัดแปลง
แรงกดดันการแข่งขันต่อสตูดิโอแอนิเมชั่นแบบดั้งเดิมเพิ่งเพิ่มขึ้นอย่างมีนัยสำคัญ เมื่อคนคนเดียวสามารถผลิตสิ่งที่เคยต้องการทีม 50 คน เศรษฐศาสตร์ของการผลิตเนื้อหาเปลี่ยนแปลงไปโดยพื้นฐาน
ลองด้วยตัวเอง
Seko 2.0 พร้อมให้ทดสอบสาธารณะผ่านแพลตฟอร์ม SenseTime:
- เยี่ยมชม seko.sensetime.com
- ใส่แนวคิดสร้างสรรค์ในภาษาธรรมชาติ
- ปล่อยให้ระบบสร้างโครงเรื่อง
- ตรวจสอบการแบ่งแยกตอน
- สร้างตอนด้วยตัวละครที่สอดคล้องกัน
อินเทอร์เฟซเป็นภาษาจีนเป็นหลัก แต่เทคโนโลยีพูดเอง แม้แต่การดูเดโม่ก็ให้ความรู้สึกว่าการสร้างหลายตอนช่วยให้ทำอะไรได้บ้าง
ภาพรวมที่ใหญ่กว่า
เรากำลังเห็นการเปลี่ยนแปลงหมวดหมู่ใน AI วิดีโอ คำถามไม่ใช่ว่า "AI สามารถสร้างวิดีโอได้หรือไม่" แต่เป็น "AI สามารถเล่าเรื่องได้หรือไม่"
Seko 2.0 ตอบว่าใช่ ไม่สมบูรณ์แบบ ไม่ใช่ทุกกรณีการใช้งาน แต่มีความหมาย ปัญหาการสร้างเนื้อหาต่อเนื่องที่จำกัด AI วิดีโอให้เป็นเพียงคลิปแยกกันกำลังได้รับการแก้ไข
สำหรับบริบทเพิ่มเติมเกี่ยวกับการพัฒนาภูมิทัศน์ AI วิดีโอ:
- Kling O1 สำรวจสถาปัตยกรรมมัลติโมดัลแบบรวม
- การปฏิวัติ AI วิดีโอโอเพนซอร์ส ครอบคลุมทางเลือกที่เข้าถึงได้
- การสร้างวิดีโอและเสียงด้วย AI ตรวจสอบความก้าวหน้าด้านเสียง
ช่องว่างระหว่างแนวคิดและเนื้อหายังคงยุบลง ด้วย Seko 2.0 การยุบนี้ขยายจากคลิปเดี่ยวไปสู่ซีรีส์ทั้งหมด
คำสั่งหนึ่ง หนึ่งร้อยตอน ผู้สร้างหนึ่งคน
อนาคตของความบันเทิงต่อเนื่องเพิ่งมาถึงในเดือนธันวาคม 2025
แหล่งข้อมูล
- SenseTime Seko 2.0 Launch Announcement (AI Base)
- SenseTime Launches Multi-Series Generative AI Agent (AI Base)
- SenseTime's Seko 2.0 and Cambricon Partnership (DigiTimes)
- The Age of AI Micro-Dramas (Pandaily)
- SenseTime Seko Platform (Official)
บทความนี้มีประโยชน์หรือไม่?

Henry
นักเทคโนโลยีสร้างสรรค์นักเทคโนโลยีสร้างสรรค์จากโลซานน์ที่สำรวจจุดบรรจบระหว่าง AI กับศิลปะ ทดลองกับโมเดลเชิงสร้างสรรค์ระหว่างเซสชั่นดนตรีอิเล็กทรอนิกส์
บทความที่เกี่ยวข้อง
สำรวจเนื้อหาต่อกับบทความที่เกี่ยวข้องเหล่านี้

YouTube นำ Veo 3 Fast มาสู่ Shorts: สร้างวิดีโอ AI ฟรีสำหรับผู้ใช้ 2.5 พันล้านคน
Google ผสาน Veo 3 Fast เข้ากับ YouTube Shorts โดยตรง มอบการสร้างวิดีโอจากข้อความพร้อมเสียงให้ครีเอเตอร์ทั่วโลกใช้ฟรี นี่คือความหมายสำหรับแพลตฟอร์มและการเข้าถึงวิดีโอ AI

Kling 2.6: Voice Cloning และ Motion Control นิยามใหม่ของการสร้างวิดีโอ AI
การอัปเดตล่าสุดของ Kuaishou นำเสนอการสร้างภาพและเสียงพร้อมกัน การฝึกเสียงแบบกำหนดเอง และการจับการเคลื่อนไหวที่แม่นยำ ซึ่งอาจเปลี่ยนแปลงวิธีที่ครีเอเตอร์ทำงานกับวิดีโอ AI

Pika 2.5: ทำให้วิดีโอ AI เข้าถึงได้ง่ายผ่านความเร็ว ราคา และเครื่องมือสร้างสรรค์
Pika Labs เปิดตัวเวอร์ชัน 2.5 ที่รวมการสร้างที่เร็วขึ้น ฟิสิกส์ที่ได้รับการปรับปรุง และเครื่องมือสร้างสรรค์อย่าง Pikaframes และ Pikaffects เพื่อทำให้วิดีโอ AI เข้าถึงได้สำหรับทุกคน