Meta Pixel
HenryHenry
4 min read
735 คำ

วิดีโอ AI ปี 2025: ปีที่ทุกอย่างเปลี่ยนแปลง

จากการปล่อย Sora 2 มีการสร้างเสียง AI แบบเนทีฟ ไปจนถึงการจัดการข้อมูลของ Disney มูลค่า 1 พันล้านดอลลาร์ ทีมสมาชิก 100 คนเอาชนะบริษัทที่มีมูลค่ารวมหลายล้านล้านดอลลาร์ ปี 2025 คือปีที่วิดีโอ AI กลายมาเป็นความเป็นจริง มาอ่านเรื่องราวที่เกิดขึ้นและความหมายของมันกันเถิด

วิดีโอ AI ปี 2025: ปีที่ทุกอย่างเปลี่ยนแปลง

เมื่อสามปีที่แล้ว วิดีโอ AI เป็นเพียงเรื่องที่นำเสนออย่างมหัศจรรย์ เมื่อสองปีที่แล้ว มันเป็นสัญญา ปีนี้ มันกลายมาเป็นความเป็นจริง ปี 2025 เป็นจุดแปรเปลี่ยนครั้งใหญ่ คือปีที่การสร้างวิดีโอ AI เปลี่ยนจากการแสดงที่น่าประทับใจไปสู่การใช้งานจริงในการทำงานประจำวัน ขอให้ฉันได้สัญจร์นำท่านผ่านช่วงเวลาสำคัญต่างๆ ผู้ชนะ เรื่องประหลาดใจ และความหมายทั้งหมดสำหรับปี 2026

สถิติของปี

$14.8B
มูลค่าตลาดคาดการณ์ ณ ปี 2030
35%
อัตราการเติบโตรายปี
62%
ผู้สร้างสรรค์รายงานการประหยัดเวลา 50% ขึ้นไป

ตัวเลขเหล่านี้มาจากรายงานอุตสาหกรรมโดย Zebracat และนักวิเคราะห์ตลาด บอกเล่าเรื่องหนึ่ง: การสร้างวิดีโอ AI ข้ามจากการทดลองไปสู่ความจำเป็น แต่ตัวเลขไม่บอกเต็มภาพ ขอให้ฉันเล่าให้ท่านฟังอย่างครบถ้วน

ไตรมาส 1: ช่วงเวลา Sora 2

ปีเริ่มต้นด้วยข่าวใหญ่ OpenAI ได้ปล่อย Sora 2 ในที่สุด และชั่วขณะที่เล็กน้อย ดูเหมือนว่าเกมจะจบลง การสร้างเสียงแบบเนทีฟ ฟิสิกส์ที่สมเหตุสมผล แบบจำลองที่เข้าใจสาเหตุและผล ในระดับที่รู้สึกถึงลึกลับ

💡

Sora 2 เป็นแบบจำลองแรกที่สร้างเสียงและวิดีโอที่ซิงค์ในการผ่านครั้งเดียว นั่นฟังดูเป็นเรื่องทางเทคนิค แต่ประสบการณ์การใช้งานมีการเปลี่ยนแปลงโดยพื้นฐาน: ไม่ต้องเพิ่มเสียงหลังจากนั้น ไม่มีปัญหาการซิงค์อีกต่อไป เพียงแค่ฉากที่สมบูรณ์ด้วยเสียงภาพจากข้อความ

อินเทอร์เน็ตตื่นเต้นขึ้นมา "ช่วงเวลา GPT สำหรับวิดีโอ" กลายมาเป็นหัวข้อข่าว สตูดิโอเริ่มทำการตรวจสอบภายใน ผู้สร้างสรรค์เริ่มทำการทดลอง ทุกคนรอดูว่าคุณภาพของการสาธิตจะคงอยู่ในการสร้างจริงหรือไม่

มันคงอยู่ส่วนใหญ่

ไตรมาส 2: การแข่งขันลุกเข้า

จากนั้น สิ่งต่างๆ เริ่มที่จะน่าสนใจขึ้น Google ปล่อย Veo 3 จากนั้น Veo 3.1 ใน Flow Runway ปล่อย Gen-4 จากนั้น Gen-4.5 Pika ยังคงพัฒนา Luma ก้าวเข้าสู่คุณลักษณะการสร้างสรรค์ Kling ปรากฏตัวขึ้นมาจากหมู่คนโดยมีการสร้างหลายรูปแบบแบบรวมศูนย์

กุมภาพันธ์

การปล่อย Sora 2 ต่อสาธารณชน

OpenAI นำเสนอเสียงเนทีฟ-วิดีโอมหาชน

เมษายน

การปล่อย Veo 3

Google ตอบสนองด้วยการเคลื่อนไหวของมนุษย์ที่ดีขึ้น

มิถุนายน

Gen-4 ปล่อยออกมา

Runway มุ่งเน้นไปที่คุณภาพที่สวยงาม

สิงหาคม

ระเบิดโอเพนโซร์ส

LTX-Video และ HunyuanVideo นำวิดีโอ AI มาสู่หน่วยประมวลผลกราฟิก ของผู้บริโภค

ตุลาคม

ความสอดคล้องของอักขระได้รับการแก้ไข

แบบจำลองหลายตัวได้ความเป็นตัวตนของอักขระที่เชื่อถือได้ในทั่วการถ่ายภาพ

ธันวาคม

Gen-4.5 ยึดตำแหน่ง #1

ทีม 100 คน เอาชนะบริษัทเศรษฐีที่มีมูลค่าหลายล้านล้านดอลลาร์

เมื่อครึ่งปี บทความเปรียบเทียบ มีอยู่ทั่วไป แบบจำลองไหนดีที่สุด ขึ้นอยู่กับสิ่งที่ท่านต้องการ นั่นเองเป็นเรื่องที่น่าประหลาดใจ: เราเปลี่ยนจาก "วิดีโอ AI มีอยู่จริง" ไปเป็น "เครื่องมือวิดีโอ AI ใดที่เหมาะกับลำดับการทำงานของฉัน" ภายในเพียงไม่กี่เดือน

ความประหลาดใจโอเพนโซร์ส

บางทีการพัฒนาที่ไม่คาดคิดที่สุด: แบบจำลองโอเพนโซร์สกลายมาเป็นตัวแข่งขันอย่างจริงจัง

1.

LTX-Video

น้ำหนักแบบเปิด ทำงานบนหน่วยประมวลผลกราฟิกสำหรับผู้บริโภค คุณภาพตัวแข่งขัน Lightricks มอบให้สิ่งที่ผู้อื่นเรียกเก็บเงิน

2.

HunyuanVideo

การสนับสนุนของ Tencent 14GB VRAM ผลลัพธ์ที่มีความสามารถในการสร้างสรรค์

3.

ByteDance Vidi2

พารามิเตอร์ 12 พันล้าน ความเข้าใจและความสามารถในการแก้ไข เปิดอย่างเต็มที่

เป็นครั้งแรกที่ท่านสามารถสร้างวิดีโอ AI คุณภาพในการสร้างสรรค์โดยไม่ต้องส่งข้อมูลของท่านไปยังบริการคลาวด์ สำหรับองค์กรที่มีข้อกำหนดความเป็นส่วนตัว สำหรับนักวิจัยที่ต้องการความโปร่งใส สำหรับผู้สร้างสรรค์ที่ต้องการการควบคุมเต็มที่ นี่เปลี่ยนแปลงทั้งหมด

ข้อตกลง Disney: IP เป็นเรื่องจริง

จากนั้น Disney เกิดขึ้น ในเดือนธันวาคม Disney ประกาศ การหุ้นส่วนที่มีความสำคัญทางประวัติศาสตร์กับ OpenAI:

$1B
การลงทุน Disney ใน OpenAI
200+
อักขระที่ได้รับใบอนุญาต
3 Years
ระยะเวลาการจัดการข้อมูล

Disney ให้ใบอนุญาตอักขระ 200+ แก่ Sora เป็นช่วงเวลาที่วิดีโอ AI กลายมาเป็นตัวกลางในการสร้างสรรค์ที่ชอบธรรมสำหรับอุตสาหกรรมความบันเทิง มิกกี้เมาส์ สไปเดอร์แมน เบบี้โยดา ผู้ถือสิทธิ์การใช้สรรพสิ่งที่ปกป้องมากที่สุดบนโลก กล่าวว่า: เทคโนโลยีนี้พร้อมแล้ว

ความหมายยังคงเกิดขึ้นจากมากมาย แต่สัญญาณชัดเจน สตูดิโอไม่สู้วิดีโอ AI อีกต่อไป พวกเขากำลังคิดออกว่าจะเป็นเจ้าของส่วนหนึ่งของมันได้อย่างไร

เรื่องราว David กับ Goliath

💡

เรื่องราวที่ชอบใจของฉันในปี 2025: Runway Gen-4.5 ยึดตำแหน่งที่ 1 บน Video Arena ทีมสมาชิก 100 คนเอาชนะ Google และ OpenAI ในวิดีโอ ในปี 2025

Gen-4.5 อ้างสิทธิ์มงกุฎ ผ่านการประเมินผลของมนุษย์ที่เป็นเป้าหมายบน ตัวอักษรชี้วัด Video Arena ผลักดัน Sora 2 Pro ไปยังตำแหน่งที่เจ็ด ที่เจ็ด! ทีมของประธานบริหาร Cristobal Valenzuela พิสูจน์ว่าความมุ่งมั่นเอาชนะทรัพยากรเมื่อปัญหาได้รับการกำหนดไว้อย่างชัดเจน

นี่มีความสำคัญนอกเหนือตัวอักษรชี้วัด มันหมายความว่าวิดีโอ AI ไม่ใช่ตลาดที่ผู้ชนะคนเดียวเอาชนะคนอื่น มันหมายความว่าการเนรมิตประดิษฐ์สามารถมาจากทุกที่ มันหมายความว่าเครื่องมือจะยังคงเก่าวัยเนื่องจากไม่มีใครสามารถทำให้จุดหยุด

เสียงแบบเนทีฟ: ยุคเงียบสิ้นสุด

จำได้หรือไม่เมื่อวิดีโอ AI เป็นเงียบ เมื่อท่านต้องสร้างคลิป จากนั้นเพิ่มเสียงด้วยมือ จากนั้นแก้ไขปัญหาการซิงค์

ปี 2025 สิ้นสุดนั้นแล้ว ยุคเงียบของวิดีโอ AI สิ้นสุด

ลำดับการทำงาน 2024
  • สร้างวิดีโอเงียบ
  • ส่งออกไปยังโปรแกรมแก้ไขเสียง
  • ค้นหาหรือสร้างเอฟเฟกต์เสียง
  • ซิงค์เสียงด้วยมือ
  • แก้ไขปัญหาการจับเวลา
  • ทำการเรนเดอร์ใหม่
ลำดับการทำงาน 2025
  • อธิบายฉาก
  • สร้างเสียงภาพที่สมบูรณ์
  • เสร็จแล้ว

Sora 2 Veo 3.1 Kling O1 ทั้งหมดจัดส่งพร้อมเสียงแบบเนทีฟ Runway ยังคงเป็นข้อยกเว้น แต่แม้ว่าพวกเขาก็หุ้นส่วนกับ Adobe เพื่อเข้าถึงเครื่องมือเสียงของระบบนิเวศ

นี่ไม่ใช่การปรับปรุงที่ค่อยเป็นค่อยไป มันเป็นการเปลี่ยนแปลงหมวดหมู่

ท่อทำงานการสร้างสรรค์เปลี่ยนแปลง

ความก้าวหน้าทางเทคนิคแปลเป็นการปฏิวัติลำดับการทำงาน

สิ่งที่เปลี่ยนแปลง (ต่อ การวิจัยของ Zebracat):

  • 62% ของผู้บริหารตลาดรายงานการประหยัดเวลา 50% ขึ้นไปในการสร้างสรรค์วิดีโอ
  • 68% ของธุรกิจขนาดเล็กและกลาง นำเครื่องมือวิดีโอ AI มาใช้ อ้างถึงความสามารถในการจ่ายได้
  • เนื้อหาที่ไม่มีใบหน้า กลายมาเป็นกลยุทธ์ผู้สร้างสรรค์ที่มีผลตอบแทนการลงทุนสูงสุด
  • AI จัดการ 80-90% ของงานแก้ไขเบื้องต้น

การนำ Enterprise มาใช้เร่งขึ้น บริษัทต่างๆ หยุดการทำการวิจัยและเริ่มรวม AI เข้าไปในการสร้างสรรค์หลักแกน ทีมตลาดที่ต่อต้านในปี 2024 ไม่มีทางเลือกในปี 2025 เนื่องจากคู่แข่งย้ายเร็วขึ้น

สแต็กเทคโนโลยี成熟

นอกเหนือจากการสร้างสรรค์ ระบบนิเวศการสนับสนุนเติบโต:

  • ความสอดคล้องของอักขระแก้ไขแล้ว: คนคนเดียวกันในทั่วการถ่ายภาพหลายครั้ง
  • ส่วนขยายวิดีโอ: ขยายคลิปเกินขีดจำกัดการสร้างสรรค์
  • ปรับปรุงแบบขยาย: ความละเอียดที่ดีขึ้นโดย AI สำหรับแหล่งใดๆ
  • การสร้างสรรค์ที่ขับเคลื่อนโดยการอ้างอิง: กล่อมอักขระที่มีลักษณะที่ปรากฏในทั่วฉาก
  • การควบคุมเฟรมเริ่มต้น/สิ้นสุด: กำหนดขอบเขต AI เติมเต็มตรงกลาง

เครื่องมือเช่น Luma Ray3 Modify อนุญาตให้ท่านแปลงวัสดุที่ถ่ายภาพในขณะที่รักษาการแสดง ส่วนขยายวิดีโอ และ ปรับปรุงแบบขยาย กลายมาเป็นคุณลักษณะมาตรฐาน โครงสร้างพื้นฐานติดตามความสามารถในการสร้างสรรค์

ผู้ชนะและผู้แพ้

ขอให้ฉันเรียกแบบที่ฉันเห็น:

ผู้ชนะ:

  • Runway (Gen-4.5 การหุ้นส่วน Adobe)
  • Luma Labs (การระดมทุน 900 ล้านดอลลาร์ Ray3)
  • ชุมชนโอเพนโซร์ส (LTX HunyuanVideo)
  • ผู้สร้างสรรค์อิสระ (เครื่องมือประชาธิปไตย)
  • สตูดิโอที่ยอมรับ AI (Disney นำหน้า)

ผู้แพ้:

  • บริษัทสต็อกตัวเอกแบบดั้งเดิม
  • ผู้ยอมรับช้า (ช่องว่างกว้างขึ้น)
  • ระบบนิเวศปิด (โอเพนโซร์สติดตาม)
  • ใครก็ตามที่รอ "สมบูรณ์แบบ" (ดีพอมาถึง)

สิ่งที่เราเข้าใจผิด

มองย้อนกลับการทำนายต้นปี 2025:

⚠️

การทำนาย: Sora 2 จะครองส่วนใหญ่ของปีทั้งหมด ความเป็นจริง: Gen-4.5 ยึดมงกุฎในเดือนธันวาคม การแข่งขันรุนแรงกว่าที่คาดไว้

⚠️

การทำนาย: โอเพนโซร์สจะยังคงอยู่เบื้องหลังหนึ่งรุ่น ความเป็นจริง: แบบจำลอง GPU ของผู้บริโภคบรรลุคุณภาพสร้างสรรค์ภายใน ไตรมาส 3

⚠️

การทำนาย: สตูดิโอจะต่อต้านวิดีโอ AI ความเป็นจริง: Disney ลงทุน 1 พันล้านดอลลาร์ในเดือนมกราคม การต่อต้านพังทลายเร็วกว่าใครๆ คาด

สิ่งที่รออยู่ใน 2026

ตามสิ่งทั้งหมดที่ฉันเห็นปีนี้:

1.

การสร้างสรรค์นานขึ้น

คลิป 10 วินาที คือบรรทัดฐาน สร้างสรรค์อย่างต่อเนื่อง 60 วินาที คือพรมแนว ทีมหลายตัวอยู่ใกล้

2.

การสร้างสรรค์แบบเรียลไทม์

AI ด้านเกมเช่น NVIDIA's NitroGen บอกใจว่าจะเกิดขึ้น การสร้างสรรค์วิดีโอแบบเรียลไทม์สำหรับประสบการณ์ที่ใช้ปฏิสัมพันธ์

3.

ข้อตกลง IP เพิ่มเติม

Disney เปิดประตู Warner Bros Universal Sony และคนอื่นๆ จะติดตาม สงครามการประมูลเริ่มต้นเมื่อการแยกเอกสิทธิ์ของ Disney สิ้นสุด

4.

การรวมเข้าด้วยกันทั่วไปทั้งหมด

Adobe-Runway เป็นแม่แบบ คาดว่าวิดีโอ AI จะฝังตัวในชุดสร้างสรรค์สร้างสรรค์ทุกชุด ทุก CMS ทุกแพลตฟอร์ม

5.

ช่องว่างคุณภาพปิด

แบบจำลองชั้นนำอยู่ระหว่างความยากในการแยกแยะ การสร้างความแตกต่างจะเลื่อนไปสู่ความเร็ว การควบคุม และการรวมลำดับการทำงาน

ภาพที่ใหญ่ขึ้น

ความหมายของปี 2025 จากมุมมองประวัติศาสตร์

💡

ปี 2025 สำหรับวิดีโอ AI คือสิ่งที่ปี 2007 สำหรับสมาร์ตโฟน ไม่ใช่การประดิษฐ์ แต่เป็นช่วงเวลาที่มันกลายมาเป็นไปได้สำหรับทุกคน ช่วงเวลา iPhone ไม่ใช่ช่วงเวลาต้นแบบ

สิบสองเดือนที่แล้ว การกล่าวว่า "AI สร้างวิดีโอนี้" เป็นข้อสงวน ตอนนี้มันคาดหวัง คำถามเลื่อนจาก "AI สามารถทำเช่นนี้ได้หรือไม่" ไปเป็น "เครื่องมือวิดีโอ AI ใดที่ฉันควรใช้"

การเลื่อนที่เกิดขึ้นครั้งต่อครั้งต่อการสร้างสรรค์เทคโนโลยี มันเกิดขึ้นกับภาพถ่ายดิจิทัล กับวิดีโอมือถือ กับสื่อสังคม และในปี 2025 มันเกิดขึ้นกับการสร้างวิดีโอ AI

มองไปข้างหน้า

ฉันเริ่มปี 2025 ด้วยความสงสัย วิดีโอสาธิตนั้นง่าย ลำดับการทำงานการสร้างสรรค์นั้นยาก ฉันคาดว่าสิ่งที่โต้แย้งจะเกินความเป็นจริง

ฉันเข้าใจผิด

เครื่องมือนั้นใช้งานได้จริง ไม่สมบูรณ์ ไม่ใช่สำหรับทุกสิ่ง แต่ดีพอที่ท่านไม่สามารถละเลยได้คือความไม่เหมาะสมในการแข่งขัน ดีพอที่ผู้สร้างสรรค์ที่ดีที่สุดอยู่ในการรวมแล้ว ดีพอที่คำถามไม่ว่าถ้าหาก แต่วิธีใด

💡

หากท่านรอบริเวณชายขอบ รอให้เทคโนโลยี成熟ขึ้น ปี 2025 คือปีที่มันแล้ว 2026 จะเป็นปีของการประยุกต์ใช้ ไม่ใช่การทดลอง

อนาคตของวิดีโอมาถึงในปี 2025 มันโกลาหลมากกว่าการสาธิต แข่งขันมากกว่าที่คาดไว้ และเข้าถึงได้มากกว่าใครๆ ทำนาย สิ่งที่เกิดขึ้นต่อไปขึ้นอยู่กับสิ่งที่เราสร้างด้วยมัน

ปีใหม่สุขสันต์ พบท่านในอนาคต


แหล่งที่มา

บทความนี้มีประโยชน์หรือไม่?

Henry

Henry

นักเทคโนโลยีสร้างสรรค์

นักเทคโนโลยีสร้างสรรค์จากโลซานน์ที่สำรวจจุดบรรจบระหว่าง AI กับศิลปะ ทดลองกับโมเดลเชิงสร้างสรรค์ระหว่างเซสชั่นดนตรีอิเล็กทรอนิกส์

บทความที่เกี่ยวข้อง

สำรวจเนื้อหาต่อกับบทความที่เกี่ยวข้องเหล่านี้

Luma Ray3 Modify: การเดิมพัน $900 ล้านดอลลาร์ที่อาจสั่นคลอนวงการภาพยนตร์
Luma LabsRay3

Luma Ray3 Modify: การเดิมพัน $900 ล้านดอลลาร์ที่อาจสั่นคลอนวงการภาพยนตร์

Luma Labs ได้รับเงินทุน $900 ล้านดอลลาร์ และเปิดตัว Ray3 Modify ซึ่งเป็นเครื่องมือที่แปลงวิดีโอที่บันทึก โดยการเปลี่ยนตัวละคร พร้อมรักษาการแสดงดั้งเดิมไว้ นี่คือจุดเริ่มต้นของการสิ้นสุดของ VFX Pipeline แบบดั้งเดิมหรือไม่

Read
Snapchat Animate It: การสร้างวิดีโอ AI มาสู่โซเชียลมีเดีย
AI วิดีโอSnapchat

Snapchat Animate It: การสร้างวิดีโอ AI มาสู่โซเชียลมีเดีย

Snapchat เพิ่งเปิดตัว Animate It เครื่องมือสร้างวิดีโอ AI แบบ open-prompt เครื่องมือแรกที่ถูกสร้างขึ้นในแพลตฟอร์มโซเชียลใหญ่ ด้วยผู้ใช้ 400 ล้านคนต่อวัน วิดีโอ AI ไม่ได้เป็นเพียงสำหรับครีเอเตอร์อีกต่อไป

Read
ปฏิวัติวิดีโอ AI แบบโอเพนซอร์ส: GPU สำหรับผู้บริโภคจะแข่งกับยักษ์ใหญ่ด้านเทคโนโลยีได้หรือไม่?
วิดีโอ AIโอเพนซอร์ส

ปฏิวัติวิดีโอ AI แบบโอเพนซอร์ส: GPU สำหรับผู้บริโภคจะแข่งกับยักษ์ใหญ่ด้านเทคโนโลยีได้หรือไม่?

ByteDance และ Tencent เพิ่งเปิดตัวโมเดลวิดีโอโอเพนซอร์สที่รันบนฮาร์ดแวร์สำหรับผู้บริโภค สิ่งนี้เปลี่ยนแปลงทุกอย่างสำหรับครีเอเตอร์อิสระ

Read

ชอบบทความนี้ไหม?

ค้นพบข้อมูลเชิงลึกเพิ่มเติมและติดตามเนื้อหาล่าสุดจากเรา

วิดีโอ AI ปี 2025: ปีที่ทุกอย่างเปลี่ยนแปลง