Runway GWM-1: โมเดลโลกทั่วไปที่จำลองความเป็นจริงแบบเรียลไทม์
GWM-1 ของ Runway เป็นการเปลี่ยนแปลงกระบวนทัศน์จากการสร้างวิดีโอไปสู่การจำลองโลก สำรวจว่าโมเดลออโตรีเกรสซีฟนี้สร้างสภาพแวดล้อมที่สำรวจได้ อวาตาร์สมจริง และการจำลองการฝึกหุ่นยนต์อย่างไร

นั่นคือสิ่งที่ GWM-1 ของ Runway สัญญาไว้ ซึ่งเป็นโมเดลโลกทั่วไปตัวแรกของพวกเขาที่ประกาศในเดือนธันวาคม 2025 และนี่ไม่ใช่แค่คำพูดทางการตลาด สิ่งนี้แสดงถึงการเปลี่ยนแปลงพื้นฐานในวิธีที่เราคิดเกี่ยวกับเทคโนโลยีวิดีโอ AI
จากการสร้างวิดีโอสู่การจำลองโลก
เครื่องมือสร้างวิดีโอแบบดั้งเดิมสร้างคลิป คุณพิมพ์พรอมต์ รอ และได้รับลำดับเฟรมที่กำหนดไว้ล่วงหน้า GWM-1 ทำงานแตกต่างออกไป มันสร้างการแสดงภายในของสภาพแวดล้อมและใช้มันเพื่อจำลองเหตุการณ์ในอนาคตภายในสภาพแวดล้อมนั้น
GWM-1 เป็นแบบออโตรีเกรสซีฟ สร้างเฟรมต่อเฟรมแบบเรียลไทม์ ไม่เหมือนกับการสร้างวิดีโอแบบแบตช์ มันตอบสนองต่ออินพุตของคุณในขณะที่คุณทำ
ลองคิดถึงผลกระทบ เมื่อคุณสำรวจพื้นที่เสมือนจริงที่สร้างโดย GWM-1 วัตถุต่างๆ จะอยู่ในที่ที่ควรจะเป็นเมื่อคุณหันกลับ ฟิสิกส์ยังคงสอดคล้องกัน แสงสว่างตอบสนองต่อการเคลื่อนไหวของกล้องของคุณ นี่ไม่ใช่วิดีโอที่เรนเดอร์ไว้ล่วงหน้า แต่เป็นการจำลองที่ทำงานแบบทันที
เสาหลักสามประการของ GWM-1
Runway ได้แบ่ง GWM-1 ออกเป็นสามรูปแบบเฉพาะทาง โดยแต่ละรูปแบบมุ่งเป้าไปที่โดเมนที่แตกต่างกัน ปัจจุบันเป็นโมเดลแยกกัน แต่บริษัทวางแผนที่จะรวมพวกมันเข้าเป็นระบบเดียว
GWM Worlds
สภาพแวดล้อมที่สามารถสำรวจได้พร้อมเรขาคณิต แสงสว่าง และฟิสิกส์สำหรับเกม VR และการฝึกเอเจนต์
GWM Avatars
ตัวละครที่ขับเคลื่อนด้วยเสียงพร้อมการซิงค์ริมฝีปาก การเคลื่อนไหวของดวงตา และท่าทางที่ทำงานสำหรับการสนทนาที่ยาวนาน
GWM Robotics
เครื่องมือสร้างข้อมูลการฝึกสังเคราะห์สำหรับนโยบายหุ่นยนต์ ขจัดคอขวดของฮาร์ดแวร์ทางกายภาพ
GWM Worlds: พื้นที่ไม่จำกัดที่คุณสามารถเดินผ่านได้
รูปแบบ Worlds สร้างสภาพแวดล้อมที่คุณสามารถสำรวจแบบอินเทอร์แอคทีฟ นำทางพื้นที่ที่สอดคล้องกันแบบขั้นตอน และโมเดลจะรักษาความสอดคล้องเชิงพื้นที่: หากคุณเดินไปข้างหน้า เลี้ยวซ้าย แล้วหันกลับ คุณจะเห็นสิ่งที่คุณคาดหวัง
สิ่งนี้แก้ปัญหาที่ยากที่สุดข้อหนึ่งในวิดีโอ AI นั่นคือ ความสอดคล้องกันในลำดับที่ยาวนาน แนวทางก่อนหน้านี้ประสบปัญหาในการรักษาตำแหน่งของวัตถุและความสอดคล้องของฉากตลอดเวลา GWM Worlds ปฏิบัติต่อสภาพแวดล้อมเป็นสถานะที่คงอยู่แทนที่จะเป็นลำดับของเฟรมที่ไม่เชื่อมต่อกัน
กรณีการใช้งานครอบคลุมเกม ประสบการณ์ความเป็นจริงเสมือน และการฝึกเอเจนต์ AI ลองจินตนาการให้อัลกอริทึมการเรียนรู้แบบเสริมแรงสำรวจสภาพแวดล้อมที่สร้างขึ้นแบบขั้นตอนหลายพันแบบโดยไม่ต้องสร้างแต่ละแบบด้วยตนเอง
GWM Avatars: ตัวละครสมจริงที่ฟัง
รูปแบบ Avatars สร้างตัวละครที่ขับเคลื่อนด้วยเสียงที่มีรายละเอียดในระดับที่ไม่ธรรมดา นอกเหนือจากการซิงค์ริมฝีปากพื้นฐานแล้ว มันยังเรนเดอร์:
- ✓สีหน้าที่เป็นธรรมชาติ
- ✓การเคลื่อนไหวของดวงตาและทิศทางการจ้องมองที่สมจริง
- ✓การซิงโครไนซ์ริมฝีปากกับคำพูด
- ✓ท่าทางในขณะพูดและฟัง
ส่วน "การฟัง" นั้นสำคัญ ระบบอวาตาร์ส่วนใหญ่จะมีภาพเคลื่อนไหวเฉพาะเมื่อตัวละครพูด GWM Avatars รักษาพฤติกรรมว่างที่เป็นธรรมชาติ การเคลื่อนไหวที่ละเอียดอ่อน และการแสดงออกที่ตอบสนองแม้ว่าตัวละครจะไม่พูด ทำให้การสนทนารู้สึกไม่เหมือนกับการพูดคุยกับการบันทึก
Runway อ้างว่าระบบนี้ทำงานสำหรับ "การสนทนาที่ยาวนานโดยไม่มีการลดคุณภาพ" บ่งชี้ว่าพวกเขาได้จัดการกับปัญหาความสอดคล้องทางเวลาที่รบกวนการสร้างอวาตาร์แบบยาวๆ
GWM Robotics: การทดลองทางความคิดในระดับใหญ่
แอปพลิเคชันที่ใช้งานได้จริงมากที่สุดอาจเป็นการฝึกหุ่นยนต์ หุ่นยนต์ทางกายภาพมีราคาแพง เสียง่าย และสามารถทำการทดลองได้ครั้งละหนึ่งเท่านั้น GWM Robotics สร้างข้อมูลการฝึกสังเคราะห์ ช่วยให้นักพัฒนาทดสอบนโยบายในการจำลองก่อนที่จะแตะฮาร์ดแวร์จริง
โมเดลนี้รองรับการสร้างแบบตรงกันข้าม ดังนั้นคุณจึงสามารถสำรวจสถานการณ์ "จะเป็นอย่างไรถ้าหุ่นยนต์หยิบวัตถุแตกต่างออกไป?" โดยไม่ต้องแทรกแซงทางกายภาพ
แนวทาง SDK มีความสำคัญที่นี่ Runway เสนอ GWM Robotics ผ่านอินเทอร์เฟซ Python วางตำแหน่งให้เป็นโครงสร้างพื้นฐานสำหรับบริษัทหุ่นยนต์มากกว่าผลิตภัณฑ์สำหรับผู้บริโภค พวกเขากำลังอยู่ในระหว่างการพูดคุยกับบริษัทหุ่นยนต์สำหรับการนำไปใช้ในองค์กร
ข้อมูลจำเพาะทางเทคนิค
GWM-1 ถูกสร้างขึ้นบน Gen-4.5 โมเดลวิดีโอของ Runway ที่เพิ่งแซงหน้าทั้ง Google และ OpenAI บนลีดเดอร์บอร์ด Video Arena สถาปัตยกรรมออโตรีเกรสซีฟหมายความว่ามันสร้างเฟรมต่อเฟรมแทนที่จะทำแบตช์ทั้งลำดับ
Action-conditioning รับอินพุตหลายประเภท: การปรับโพสท่าของกล้อง คำสั่งตามเหตุการณ์ พารามิเตอร์โพสท่าของหุ่นยนต์ และอินพุตคำพูด/เสียง สิ่งนี้ทำให้มันเป็นระบบแบบอินเทอร์แอคทีฟที่แท้จริงมากกว่าเครื่องมือสร้างแบบครั้งเดียว
การเปรียบเทียบกับคู่แข่ง
Runway อ้างอย่างชัดเจนว่า GWM-1 มีความ "ทั่วไป" มากกว่า Genie-3 ของ Google และความพยายามโมเดลโลกอื่นๆ ความแตกต่างนั้นสำคัญ: ในขณะที่ Genie-3 มุ่งเน้นไปที่สภาพแวดล้อมแบบเกม Runway กำลังนำเสนอ GWM-1 เป็นโมเดลที่สามารถจำลองข้ามโดเมน ตั้งแต่หุ่นยนต์ไปจนถึงวิทยาศาสตร์ชีวิต
สร้างลำดับที่คงที่ ไม่มีการโต้ตอบ ไม่มีการสำรวจ ไม่มีการตอบสนองแบบเรียลไทม์ต่ออินพุต
จำลองสภาพแวดล้อมที่คงอยู่ ตอบสนองต่อการกระทำแบบเรียลไทม์ รักษาความสอดคล้องเชิงพื้นที่และเวลา
มุมมองด้านหุ่นยนต์นั้นน่าสนใจเป็นพิเศษ ในขณะที่บริษัท AI วิดีโอส่วนใหญ่ไล่ตามผู้เชี่ยวชาญด้านสร้างสรรค์และนักการตลาด Runway กำลังสร้างโครงสร้างพื้นฐานสำหรับแอปพลิเคชันอุตสาหกรรม นี่คือการเดิมพันว่าโมเดลโลกมีความสำคัญนอกเหนือจากความบันเทิง
ความหมายสำหรับผู้สร้างสรรค์
สำหรับพวกเราที่อยู่ในพื้นที่วิดีโอ AI, GWM-1 บ่งบอกถึงการเปลี่ยนแปลงที่กว้างขึ้น เราใช้เวลาหลายปีในการเรียนรู้การสร้างพรอมต์ที่ดีขึ้นและเชื่อมโยงคลิปเข้าด้วยกัน โมเดลโลกแนะนำอนาคตที่เราออกแบบพื้นที่ ตั้งกฎ และปล่อยให้การจำลองทำงาน
สิ่งนี้เชื่อมโยงกับ การสนทนาเรื่องโมเดลโลกที่เราติดตาม วิทยานิพนธ์ที่ว่า AI ควรเข้าใจฟิสิกส์และความเป็นเหตุเป็นผล ไม่ใช่แค่จับคู่รูปแบบพิกเซล กำลังกลายเป็นความจริงของผลิตภัณฑ์
นักพัฒนาเกมควรให้ความสนใจ การสร้างสภาพแวดล้อม 3D ที่สามารถสำรวจได้โดยปกติต้องการศิลปิน นักออกแบบเลเวล และเอ็นจิ้นเช่น Unity หรือ Unreal GWM Worlds บอกใบ้ถึงอนาคตที่คุณอธิบายพื้นที่และปล่อยให้ AI เติมเรขาคณิต
Gen-4.5 ได้รับเสียงด้วย
พร้อมกับการประกาศ GWM-1 Runway ได้อัปเดต Gen-4.5 ด้วยการสร้างเสียงดั้งเดิม ตอนนี้คุณสามารถสร้างวิดีโอพร้อมเสียงที่ซิงโครไนซ์โดยตรงได้ ไม่จำเป็นต้องเพิ่มเสียงในขั้นตอนหลังการผลิต พวกเขายังได้เพิ่มความสามารถในการแก้ไขเสียงและการแก้ไขวิดีโอแบบหลายช็อตสำหรับการสร้างคลิปหนึ่งนาทีด้วยตัวละครที่สอดคล้องกัน
สำหรับการดูอย่างลึกซึ้งว่าเสียงกำลังเปลี่ยนแปลงวิดีโอ AI อย่างไร โปรดดูรายงานของเราเกี่ยวกับ ยุคเงียบของวิดีโอ AI กำลังจะสิ้นสุด
เส้นทางข้างหน้า
สามรูปแบบของ GWM-1 ได้แก่ Worlds, Avatars และ Robotics ในที่สุดจะรวมเป็นโมเดลเดียว เป้าหมายคือระบบแบบรวมที่สามารถจำลองสภาพแวดล้อม ตัวละคร หรือระบบทางกายภาพประเภทใดก็ได้
GWM Avatars และคุณสมบัติ World ที่ปรับปรุงแล้ว "กำลังจะมาเร็วๆ นี้" SDK GWM Robotics มีให้ผ่านการขอ
สิ่งที่ทำให้ผมตื่นเต้นที่สุดไม่ใช่คุณสมบัติใดๆ แต่เป็นกรอบความคิด Runway ไม่ได้ขายคลิปวิดีโออีกต่อไป พวกเขาขายโครงสร้างพื้นฐานการจำลอง นั่นเป็นหมวดหมู่ผลิตภัณฑ์ที่แตกต่างโดยสิ้นเชิง
คำถามไม่ใช่ว่าโมเดลโลกจะแทนที่เครื่องมือสร้างวิดีโอหรือไม่ แต่เป็นว่าความแตกต่างระหว่าง "การสร้างวิดีโอ" และ "การจำลองโลก" จะเลือนหายไปเร็วแค่ไหน จาก GWM-1 Runway กำลังเดิมพันว่าเร็วกว่าช้า
GWM-1 ของ Runway พร้อมให้บริการในรูปแบบตัวอย่างการวิจัย โดยคาดว่าจะมีการเข้าถึงที่กว้างขึ้นในต้นปี 2026 สำหรับการเปรียบเทียบกับเครื่องมือวิดีโอ AI ชั้นนำอื่นๆ โปรดดูการวิเคราะห์ของเราเกี่ยวกับ Sora 2 vs Runway vs Veo 3
บทความนี้มีประโยชน์หรือไม่?

Henry
นักเทคโนโลยีสร้างสรรค์นักเทคโนโลยีสร้างสรรค์จากโลซานน์ที่สำรวจจุดบรรจบระหว่าง AI กับศิลปะ ทดลองกับโมเดลเชิงสร้างสรรค์ระหว่างเซสชั่นดนตรีอิเล็กทรอนิกส์
บทความที่เกี่ยวข้อง
สำรวจเนื้อหาต่อกับบทความที่เกี่ยวข้องเหล่านี้

Video Language Models: พรมแดนใหม่ถัดจาก LLM และ AI Agents
World models กำลังสอนให้ AI เข้าใจความเป็นจริงทางกายภาพ ช่วยให้หุ่นยนต์สามารถวางแผนการกระทำและจำลองผลลัพธ์ก่อนที่จะขยับ actuator แม้เพียงตัวเดียว

World Models: แนวหน้าใหม่ของการสร้าง AI Video
เหตุใดการเปลี่ยนจาก frame generation ไปสู่ world simulation จึงกำลังเปลี่ยนแปลง AI video และ GWM-1 ของ Runway บอกอะไรเราเกี่ยวกับทิศทางที่เทคโนโลยีนี้กำลังมุ่งหน้า

Adobe และ Runway ร่วมมือกัน: ความร่วมมือ Gen-4.5 หมายความว่าอย่างไรสำหรับนักสร้างวิดีโอ
Adobe เพิ่งทำให้ Gen-4.5 ของ Runway กลายเป็นหัวใจหลักของวิดีโอ AI ใน Firefly พันธมิตรเชิงกลยุทธ์นี้กำลังเปลี่ยนแปลงเวิร์กโฟลว์สร้างสรรค์สำหรับมืออาชีพ สตูดิโอ และแบรนด์ทั่วโลก