Meta Pixel
HenryHenry
15 min read
1021 단어

Google Flow와 Veo 3.1: AI 영상 편집의 새로운 시대

Google이 Veo 3.1과 함께 Flow의 대규모 업데이트를 발표했습니다. Insert와 Remove 편집 도구, 모든 기능에서의 오디오 지원을 도입하여 AI 영상 편집을 단순 생성에서 진정한 창작 제어로 발전시킵니다.

Google Flow와 Veo 3.1: AI 영상 편집의 새로운 시대

Google이 출시 이후 가장 큰 AI 영상 플랫폼 업데이트를 발표했습니다. Veo 3.1로 구동되는 Flow는 단순히 더 아름다운 영상을 생성하는 것이 아닙니다. AI로 편집하는 것입니다—요소 삽입, 객체 제거, 클립 연장—모두 오디오 동기화를 유지하면서요. 2억 7,500만 개의 영상 생성 이후, Google은 영상 편집의 미래가 생성형임을 알리고 있습니다.

생성을 넘어서: 편집 혁명

지난 1년간 우리는 생성 품질에 집착해 왔습니다. 어떤 모델이 가장 사실적인 폭발을 만들어낼까요? 누가 물리를 더 잘 처리할까요? AI가 드디어 손가락을 제대로 렌더링할 수 있을까요?

이 질문들은 여전히 중요합니다. 하지만 Google은 다른 질문을 던지고 있습니다: 생성 이후에는 무엇이 일어날까요?

답은 분명히 Flow입니다.

💡

Flow는 2025년 5월 출시 이후 2억 7,500만 개 이상의 영상을 생성했습니다. 새로운 Veo 3.1 업데이트는 생성 도구에서 완전한 크리에이티브 편집 스위트로 변환시킵니다.

전통적인 영상 편집은 파괴적입니다. 자르고, 이어붙이고, 레이어를 쌓고, 렌더링합니다. 변경하려면 다시 렌더링해야 합니다. 요소를 추가하려면 영상을 찾고, 키잉하고, 합성해야 합니다.

생성형 편집은 이것을 뒤집습니다. 장면에 날아가는 새를 추가하고 싶으세요? 설명하세요. 배경의 산만한 표지판을 제거하고 싶으세요? AI에게 말하세요. 그림자, 조명, 장면 연속성을 처리해 줍니다.

Veo 3.1이 Flow에 가져오는 것

실제 기능을 자세히 살펴보겠습니다. 보도자료는 정말 중요한 몇 가지 기능을 숨기고 있습니다.

Insert: 기존 장면에 요소 추가

이것이 핵심 기능입니다. 이제 생성하거나 업로드한 비디오 클립에 새로운 객체나 캐릭터를 추가할 수 있습니다.

입력: 조용한 숲길, 얼룩진 햇빛
Insert 명령: "사슴이 길을 건너다 멈춰서 카메라를 바라본다"
출력: 사슴이 자연스럽게 나타나고, 그림자가 정확하고, 조명이 일관됨

시스템이 어려운 부분을 자동으로 처리합니다. 그림자 방향이 장면 조명과 일치합니다. 삽입된 요소가 기존 객체와 올바르게 상호작용합니다. 이것은 합성이 아닙니다—당신의 추가 사항을 통합하여 장면을 재생성하는 것입니다.

Remove: 원치 않는 요소 삭제

곧 Flow에 출시될 Remove 기능으로 장면에서 객체나 캐릭터를 삭제할 수 있습니다. AI가 그 뒤에 있어야 할 것을 재구성합니다.

이것은 보기보다 어렵습니다. 장면에서 사람을 제거할 때:

  1. 배경이 어떻게 보여야 하는지 이해해야 합니다
  2. 그들이 드리운 그림자나 반사를 처리해야 합니다
  3. 프레임 간 시간적 일관성을 유지해야 합니다
  4. 제거를 보이지 않게 해야 합니다—아티팩트 없이, 이상한 블러 없이

전통적인 VFX 팀은 클린 플레이트 작업에 몇 시간을 보냅니다. 생성형 제거는 몇 초 만에 완료합니다.

모든 기능에서 오디오 지원

주목할 만한 업데이트입니다: 이전에 무음이었던 기능에서 이제 오디오가 작동합니다.

기능이전현재
Ingredients to Video무음 출력생성 오디오
Frames to Video무음 출력생성 오디오
Extend오디오 선택사항완전한 오디오 통합

Ingredients to Video는 여러 참조 이미지를 결합하여 캐릭터, 객체, 스타일을 제어할 수 있게 합니다. 이제 이렇게 생성된 영상에는 동기화된 오디오—환경음, 대화, 효과—가 함께 제공됩니다.

Frames to Video는 시작 프레임과 끝 프레임 사이의 매끄러운 전환을 생성합니다. 이전에는 부드러운 비주얼 모프를 얻었지만 나중에 사운드를 추가해야 했습니다. 이제 오디오가 비주얼과 함께 자연스럽게 생성됩니다.

Extend는 클립을 원래 길이 이상으로 연장할 수 있게 합니다. 오디오 통합으로 일관된 사운드스케이프의 1분 이상 영상을 만들 수 있습니다.

기술적 도약

이것을 가능하게 하는 것은 이전 버전 대비 Veo 3.1의 개선입니다. 실험 결과:

~10ms
립싱크 정확도
60초+
일관된 지속시간
네이티브
오디오 생성

Veo 3.1 문서 및 테스트 기반 성능 특성

핵심 혁신:

실감나는 텍스처: Veo 3.1은 이전 어떤 버전보다 실감나는 표면을 포착합니다. 피부, 천, 금속, 유리—텍스처가 조명 변화에 올바르게 반응합니다.

향상된 내러티브 제어: 모델이 복잡한 프롬프트를 더 정확하게 따릅니다. 감정적 비트, 타이밍, 카메라 움직임을 지정할 수 있고, 실제로 따릅니다.

이미지-비디오 충실도 향상: 정지 이미지를 비디오로 변환할 때, Veo 3.1은 Veo 3보다 캐릭터 일관성과 장면 충실도를 더 잘 유지합니다.

크리에이티브 워크플로우의 변화

콘텐츠 시리즈를 위해 Flow를 테스트해 왔는데, 워크플로우 변화가 상당합니다.

기존 워크플로우:

  1. 스크립트 작성
  2. 개별 샷 생성
  3. 편집 소프트웨어로 내보내기
  4. 수동으로 음향 효과 추가
  5. 추가 요소 합성
  6. 변경할 때마다 지속적으로 재렌더링

Flow 워크플로우:

  1. 스크립트 작성
  2. 오디오와 함께 샷 생성
  3. Insert/Remove로 다듬기
  4. 필요에 따라 클립 연장
  5. 최종 영상 내보내기

반복 루프가 무너집니다. 애플리케이션 간 전환이 필요 없습니다. 오디오를 수동으로 동기화할 필요가 없습니다. 변경이 생성이 일어나는 동일한 환경에서 발생합니다.

경쟁사와의 비교

AI 영상 공간은 붐비고 있습니다. Veo 3.1이 탑재된 Flow는 어떻게 비교될까요?

Runway Gen-4.5가 현재 순수 생성 품질에서 선두입니다. Sora 2는 더 나은 물리 이해로 더 길고 일관된 클립에서 뛰어납니다.

하지만 Flow가 방금 도입한 편집 기능을 제공하는 곳은 없습니다. Insert와 Remove는 정말 새로운 것입니다. 모든 기능에서의 오디오 통합은 타의 추종을 불허합니다.

질문은: 무엇이 필요한가요? 더 큰 제작을 위해 개별 샷을 생성한다면, 품질이 최우선일 수 있습니다. 하나의 플랫폼 내에서 완전한 영상을 만든다면, Flow의 생태계가 매력적으로 보이기 시작합니다.

실용적인 사용 사례

이것이 정말 중요한 곳은?

소셜 콘텐츠 제작: 영상을 생성하고, 장면에 제품을 추가하고 싶다는 것을 깨닫고, 직접 삽입합니다. 재촬영 없이, 합성 없이.

프로토타입 시각화: AI 생성 영상으로 클라이언트에게 컨셉을 보여주고, 미팅 중 실시간으로 요소를 추가하거나 제거하며 반복합니다.

교육 콘텐츠: 나중에 다이어그램, 캐릭터, 시각적 보조 자료를 삽입할 수 있는 설명 영상을 만듭니다.

마케팅 자산: 광고용 B-roll 생성, 스톡 영상에서 원치 않는 요소 제거, 음악 타이밍에 맞게 클립 연장.

Flow 접근

Flow는 여러 채널을 통해 이용 가능합니다:

  • flow.google: 메인 웹 인터페이스
  • Gemini API: Veo 3.1 위에 구축하는 개발자용
  • Vertex AI: 규모와 SLA가 필요한 기업 고객용
  • Gemini 앱: Google의 AI 어시스턴트를 통한 소비자 접근

Insert 기능이 현재 출시 중입니다. Remove가 곧 출시됩니다. 오디오 통합은 이미 지원되는 모든 기능에서 사용 가능합니다.

산업에 대한 의미

우리는 "영상 편집"의 정의가 실시간으로 변화하는 것을 보고 있습니다.

전통적인 편집은 영상이 있다고 가정합니다. 자르고, 배열하고, 향상시킵니다. 영상이 제약입니다.

생성형 편집은 상상력이 있다고 가정합니다. 원하는 것을 설명합니다. AI가 생성하고, 수정하고, 연장합니다. 당신의 창의적 비전이 제약입니다.

이것은 아직 전통적인 편집자를 대체하지 않습니다. 고급 영화 제작은 여전히 프레임 수준 제어, 실제 효과, 실제 배우가 필요합니다. 하지만 대부분의 영상 콘텐츠—소셜 미디어, 마케팅, 교육, 프로토타이핑—에서 도구가 급진적으로 더 접근 가능해졌습니다.

Flow에서 생성된 2억 7,500만 개의 영상은 시작에 불과합니다. 전용 VFX 소프트웨어에 필적하는 편집 기능으로, 그 숫자는 폭발할 것입니다.

지금 시도하세요

이 변화를 직접 경험하고 싶다면:

  1. flow.google로 이동
  2. 간단한 장면 생성
  3. Insert를 사용하여 요소 추가
  4. AI가 그림자와 조명을 어떻게 처리하는지 관찰
  5. 클립을 연장하고 오디오가 일관되게 유지되는지 확인

그런 다음 복잡한 것을 시도해 보세요. 대화를 생성하고, 배경 요소를 삽입하고, 오디오와 함께 연장하세요. 전통적인 편집과 얼마나 다른지 느껴보세요.

영상 편집의 미래는 영상을 자르는 더 나은 도구가 아닙니다.

원하는 것을 설명하고 그것이 나타나는 것을 보는 것입니다.

이 글이 도움이 되었나요?

Henry

Henry

크리에이티브 기술자

AI와 예술이 만나는 지점을 탐구하는 로잔 출신 크리에이티브 기술자입니다. 전자 음악 세션 사이사이 생성 모델을 실험합니다.

관련 글

관련 글을 더 살펴보세요

이 글이 마음에 드셨나요?

더 많은 인사이트를 발견하고 최신 콘텐츠 소식을 받아보세요.

Google Flow와 Veo 3.1: AI 영상 편집의 새로운 시대