Google Flow và Veo 3.1: Chỉnh sửa video AI bước vào kỷ nguyên mới
Google ra mắt bản cập nhật lớn cho Flow với Veo 3.1, giới thiệu công cụ chỉnh sửa Insert và Remove, âm thanh trên tất cả tính năng, và đưa chỉnh sửa video AI vượt ra ngoài việc tạo đơn giản đến kiểm soát sáng tạo thực sự.

Google vừa phát hành bản cập nhật lớn nhất cho nền tảng video AI của họ kể từ khi ra mắt. Flow được hỗ trợ bởi Veo 3.1 không chỉ là tạo video đẹp hơn. Đây là về việc chỉnh sửa chúng với AI: chèn thêm yếu tố, xóa đối tượng, kéo dài clip, tất cả với âm thanh đồng bộ. Sau 275 triệu video được tạo, Google đang phát tín hiệu rằng tương lai của chỉnh sửa video là tạo sinh.
Vượt xa việc tạo: Cuộc cách mạng chỉnh sửa
Suốt năm qua chúng ta đã ám ảnh về chất lượng tạo. Mô hình nào tạo ra vụ nổ chân thực nhất? Ai xử lý vật lý tốt hơn? AI đã có thể render ngón tay đúng cách chưa?
Những câu hỏi đó vẫn quan trọng. Nhưng Google đang hỏi một câu khác: Điều gì xảy ra sau khi tạo?
Câu trả lời, rõ ràng, là Flow.
Flow đã tạo hơn 275 triệu video kể từ khi ra mắt vào tháng 5 năm 2025. Các bản cập nhật Veo 3.1 mới biến nó từ công cụ tạo thành bộ chỉnh sửa sáng tạo đầy đủ.
Chỉnh sửa video truyền thống mang tính phá hủy. Bạn cắt, ghép, xếp lớp, render. Thay đổi có nghĩa là render lại. Thêm một yếu tố có nghĩa là tìm footage, keying, compositing.
Chỉnh sửa tạo sinh đảo ngược điều này. Muốn thêm một con chim bay qua cảnh của bạn? Mô tả nó. Muốn xóa biển hiệu gây mất tập trung ở nền? Nói với AI. Nó sẽ xử lý bóng, ánh sáng, sự liên tục của cảnh.
Veo 3.1 mang đến gì cho Flow
Hãy để tôi phân tích các khả năng thực tế, vì thông cáo báo chí che giấu một số tính năng thực sự quan trọng.
Insert: Thêm yếu tố vào cảnh hiện có
Đây là tính năng chính. Bạn có thể thêm đối tượng hoặc nhân vật mới vào clip video đã tạo hoặc tải lên.
Đầu vào: Đường mòn rừng yên tĩnh, ánh nắng lốm đốm
Lệnh Insert: "Một con hươu băng qua đường, dừng lại nhìn camera"
Đầu ra: Con hươu xuất hiện tự nhiên, bóng chính xác, ánh sáng nhất quánHệ thống xử lý các phần khó tự động. Hướng bóng phù hợp với ánh sáng của cảnh. Yếu tố được chèn tương tác đúng với các đối tượng hiện có. Đây không phải compositing mà là tái tạo cảnh với phần bổ sung của bạn được tích hợp sẵn.
Remove: Xóa các yếu tố không mong muốn
Sắp có trên Flow, tính năng Remove cho phép bạn xóa đối tượng hoặc nhân vật khỏi cảnh. AI tái tạo những gì nên ở phía sau chúng.
Điều này khó hơn vẻ ngoài. Khi bạn xóa một người khỏi cảnh, bạn cần:
- Hiểu nền nên trông như thế nào
- Xử lý bất kỳ bóng hoặc phản chiếu nào họ tạo ra
- Duy trì tính nhất quán thời gian qua các khung hình
- Làm cho việc xóa không thể nhìn thấy, không có artifact, không có vệt mờ kỳ lạ
Các đội VFX truyền thống mất hàng giờ cho công việc clean plate. Xóa tạo sinh làm điều đó trong vài giây.
Âm thanh trên tất cả tính năng
Đây là bản cập nhật âm thầm: âm thanh giờ hoạt động với các tính năng trước đây im lặng.
| Tính năng | Trước đây | Bây giờ |
|---|---|---|
| Ingredients to Video | Đầu ra im lặng | Âm thanh được tạo |
| Frames to Video | Đầu ra im lặng | Âm thanh được tạo |
| Extend | Âm thanh tùy chọn | Tích hợp âm thanh đầy đủ |
Ingredients to Video cho phép bạn kết hợp nhiều hình ảnh tham chiếu để kiểm soát nhân vật, đối tượng và phong cách. Giờ những video được tạo đi kèm âm thanh đồng bộ: âm thanh môi trường, hội thoại, hiệu ứng.
Frames to Video tạo chuyển tiếp liền mạch giữa khung hình đầu và cuối. Trước đây bạn có morph hình ảnh mượt mà nhưng phải thêm âm thanh sau. Giờ âm thanh xuất hiện tự nhiên cùng hình ảnh.
Extend cho phép bạn kéo dài clip vượt quá độ dài ban đầu. Với tích hợp âm thanh, bạn có thể tạo video dài hơn một phút với soundscape nhất quán xuyên suốt.
Bước nhảy kỹ thuật
Điều làm cho điều này có thể là các cải tiến của Veo 3.1 so với phiên bản trước. Từ những gì tôi có thể nói qua thử nghiệm:
Đặc điểm hiệu suất dựa trên tài liệu và thử nghiệm Veo 3.1
Các đổi mới chính:
Texture chân thực: Veo 3.1 nắm bắt bề mặt chân thực tốt hơn bất kỳ phiên bản nào trước đây. Da, vải, kim loại, kính, texture phản ứng đúng với thay đổi ánh sáng.
Kiểm soát tường thuật nâng cao: Mô hình tuân theo prompt phức tạp chính xác hơn. Bạn có thể chỉ định nhịp cảm xúc, thời gian, chuyển động camera, và nó thực sự lắng nghe.
Độ trung thực Image-to-Video mạnh hơn: Khi chuyển đổi hình ảnh tĩnh sang video, Veo 3.1 duy trì tính nhất quán nhân vật và độ trung thực cảnh tốt hơn Veo 3.
Điều này thay đổi quy trình sáng tạo như thế nào
Tôi đã thử nghiệm Flow cho một series nội dung, và sự thay đổi quy trình là đáng kể.
Quy trình cũ:
- Viết kịch bản
- Tạo các shot riêng lẻ
- Xuất sang phần mềm chỉnh sửa
- Thêm hiệu ứng âm thanh thủ công
- Composite bất kỳ yếu tố bổ sung nào
- Re-render liên tục khi có thay đổi
Quy trình Flow:
- Viết kịch bản
- Tạo shot với âm thanh
- Sử dụng Insert/Remove để tinh chỉnh
- Kéo dài clip khi cần
- Xuất video cuối cùng
Vòng lặp iteration thu gọn. Bạn không chuyển đổi giữa các ứng dụng. Bạn không đồng bộ âm thanh thủ công. Thay đổi xảy ra trong cùng môi trường nơi tạo xảy ra.
So sánh với đối thủ
Không gian video AI đang đông đúc. Flow với Veo 3.1 so sánh thế nào?
Runway Gen-4.5 hiện dẫn đầu về chất lượng tạo thuần túy. Sora 2 xuất sắc ở clip dài hơn, mạch lạc hơn với hiểu biết vật lý tốt hơn.
Nhưng không ai cung cấp khả năng chỉnh sửa mà Flow vừa giới thiệu. Insert và Remove thực sự mới. Tích hợp âm thanh trên tất cả tính năng là không thể sánh được.
Câu hỏi là: bạn cần gì? Nếu bạn tạo shot đơn lẻ cho sản xuất lớn hơn, chất lượng có thể là quan trọng nhất. Nếu bạn tạo video hoàn chỉnh trong một nền tảng, hệ sinh thái của Flow bắt đầu hấp dẫn.
Trường hợp sử dụng thực tế
Điều này thực sự quan trọng ở đâu?
Tạo nội dung mạng xã hội: Tạo video, nhận ra bạn muốn thêm sản phẩm vào cảnh, chèn trực tiếp. Không quay lại, không compositing.
Trực quan hóa prototype: Cho khách hàng xem concept với video AI-tạo, sau đó lặp lại bằng cách thêm hoặc xóa yếu tố theo thời gian thực trong cuộc họp.
Nội dung giáo dục: Tạo video giải thích nơi bạn có thể chèn sơ đồ, nhân vật, hoặc hỗ trợ trực quan sau đó.
Tài sản marketing: Tạo b-roll cho quảng cáo, xóa yếu tố không mong muốn từ stock footage, kéo dài clip để phù hợp với timing nhạc.
Truy cập Flow
Flow có sẵn qua nhiều kênh:
- flow.google: Giao diện web chính
- Gemini API: Cho developer xây dựng trên Veo 3.1
- Vertex AI: Cho khách hàng doanh nghiệp cần quy mô và SLA
- Gemini App: Truy cập người tiêu dùng qua trợ lý AI của Google
Tính năng Insert đang triển khai. Remove sắp có. Tích hợp âm thanh đã hoạt động trên tất cả tính năng được hỗ trợ.
Điều này có ý nghĩa gì cho ngành
Chúng ta đang chứng kiến định nghĩa "chỉnh sửa video" thay đổi theo thời gian thực.
Chỉnh sửa truyền thống giả định bạn có footage. Bạn cắt, sắp xếp, nâng cao. Footage là ràng buộc.
Chỉnh sửa tạo sinh giả định bạn có trí tưởng tượng. Bạn mô tả những gì bạn muốn. AI tạo, sửa đổi, mở rộng. Tầm nhìn sáng tạo của bạn là ràng buộc.
Điều này chưa thay thế biên tập viên truyền thống. Sản xuất phim cao cấp vẫn cần kiểm soát cấp khung hình, hiệu ứng thực tế, diễn viên thật. Nhưng cho phần giữa rộng lớn của nội dung video như mạng xã hội, marketing, giáo dục, prototyping, các công cụ vừa trở nên dễ tiếp cận hơn đáng kể.
275 triệu video được tạo trên Flow chỉ là khởi đầu. Với khả năng chỉnh sửa cạnh tranh với phần mềm VFX chuyên dụng, con số đó sắp bùng nổ.
Thử ngay
Nếu bạn muốn trải nghiệm sự thay đổi này trực tiếp:
- Truy cập flow.google
- Tạo một cảnh đơn giản
- Sử dụng Insert để thêm yếu tố
- Xem AI xử lý bóng và ánh sáng như thế nào
- Kéo dài clip và chú ý âm thanh vẫn mạch lạc
Sau đó thử thứ gì đó phức tạp. Tạo cuộc trò chuyện, chèn yếu tố nền, kéo dài với âm thanh. Cảm nhận điều này khác với chỉnh sửa truyền thống như thế nào.
Tương lai của chỉnh sửa video không phải về công cụ tốt hơn để cắt footage.
Mà là về mô tả những gì bạn muốn và xem nó xuất hiện.
Bài viết này có hữu ích không?

Henry
Chuyên gia Công nghệ Sáng tạoChuyên gia công nghệ sáng tạo đến từ Lausanne, khám phá nơi AI gặp gỡ nghệ thuật. Thử nghiệm với các mô hình sinh tạo giữa những buổi làm nhạc điện tử.
Bài viết liên quan
Tiếp tục khám phá với những bài viết liên quan
Google Tham Gia Cuộc Đua AI Avatar: Veo 3.1 Cung Cấp Sức Mạnh Cho Avatar Mới Trong Google Vids
Google nâng cấp Vids bằng avatar được hỗ trợ bởi Veo 3.1, hứa hẹn người dùng doanh nghiệp ưu tiên tốt gấp năm lần so với các đối thủ cạnh tranh. Điều này so sánh như thế nào với Synthesia và HeyGen?

Luma Ray3 Modify: Khoản đầu tư 900 triệu đô la có thể làm gián đoạn ngành sản xuất phim
Luma Labs thu được 900 triệu đô la tài trợ và ra mắt Ray3 Modify, một công cụ chuyển đổi video quay lại bằng cách trao đổi nhân vật trong khi giữ nguyên hiệu năng ban đầu. Đây có phải là khởi đầu cho sự kết thúc của các pipeline VFX truyền thống?

Runway GWM-1: Mô Hình Thế Giới Tổng Quát Mô Phỏng Hiện Thực Theo Thời Gian Thực
GWM-1 của Runway đánh dấu sự chuyển đổi mô hình từ tạo video sang mô phỏng thế giới. Khám phá cách mô hình tự hồi quy này tạo ra môi trường có thể khám phá, hình đại diện chân thực và mô phỏng huấn luyện robot.