Meta Pixel
DamienDamien
8 min read
1423 слоў

Нябачныя шчыты: як вадзяныя знакі ШІ-відэа вырашаюць крызіс аўтарскіх правоў у 2025

Па меры таго, як відэа, створаныя ШІ, становяцца неадрознівальнымі ад сапраўдных кадраў, нябачныя вадзяныя знакі з'яўляюцца крытычнай інфраструктурай для абароны аўтарскіх правоў. Мы даследуем новы падыход Meta, SynthID ад Google і тэхнічныя выклікі ўбудовы сігналаў выяўлення ў маштабе.

Нябачныя шчыты: як вадзяныя знакі ШІ-відэа вырашаюць крызіс аўтарскіх правоў у 2025

Ready to create your own AI videos?

Join thousands of creators using Bonega.ai

У мінулым месяцы кліент адправіў мне відэа, якое было перазалітае на тры платформы без крэдыту. Калі мы адсачылі арыгінальную крыніцу, яно было сціснута, абрэзана і перакадавана двойчы. Традыцыйныя вадзяныя знакі? Знікнулі. Метададзеныя? Выдаленыя. Гэта кашмар аўтарскіх правоў, які нябачныя вадзяныя знакі нарэшце вырашаюць.

Праблема з бачнымі вадзянымі знакамі

Мы дадаём лагатыпы на відэа дзесяцігоддзямі. Гэта працуе—пакуль хтосьці не абрэжа іх, не закрые смайлікамі або проста не перакадуе відэа ў іншым суадносінах бакоў. Бачныя вадзяныя знакі як веласіпедныя замкі: яны адпугваюць выпадковую крадзёж, але раскрошваюцца супраць рашучых акцёраў.

Сапраўдная праблема ў 2025 годзе—гэта не проста вадзяныя знакі, гэта вадзяныя знакі, якія перажываюць перчатку сучаснага распаўсюджвання відэа:

Вектар атакіТрадыцыйны вадзяны знакНябачны вадзяны знак
АбрэзкаЛёгка выдаляеццаПеражывае (размеркаваны па кадрах)
ПеракадаваннеЧаста пагаршаеццаСпраектаваны для перажывання сціску
Змены частаты кадраўПарушае тайм інгЧасова збыткоўны
Скрыншот + перазалітваннеЦалкам губляеццаМожа захавацца ў прасторавым дамене
Апскейлінг ШІСкажаеццаУстойлівыя рэалізацыі перажываюць

Падыход Meta: нябачныя вадзяныя знакі на аснове CPU у маштабе

Meta апублікавала свой інжынерны падыход у лістападзе 2025, і архітэктура разумная. Замест цяжкага для GPU кадавання нейронных сетак яны абралі апрацоўку сігналаў на аснове CPU, якая можа працаваць у маштабе па іх відэаінфраструктуры.

# Спрошчаная канцэпцыя канвеера нябачных вадзяных знакаў
class InvisibleWatermarker:
    def __init__(self, key: bytes):
        self.encoder = FrequencyDomainEncoder(key)
        self.decoder = RobustDecoder(key)
 
    def embed(self, video_frames: np.ndarray, payload: bytes) -> np.ndarray:
        # Пераўтварэнне ў частотны дамен (DCT/DWT)
        freq_domain = self.to_frequency(video_frames)
 
        # Убудова карыснага навантажэння ў сярэдначастотныя каэфіцыенты
        # Нізкія частоты = бачныя змены
        # Высокія частоты = знішчаныя сціскам
        # Сярэднія частоты = залаты серадзіна
        watermarked_freq = self.encoder.embed(freq_domain, payload)
 
        return self.to_spatial(watermarked_freq)
 
    def extract(self, video_frames: np.ndarray) -> bytes:
        freq_domain = self.to_frequency(video_frames)
        return self.decoder.extract(freq_domain)

Ключавая ідэя: сярэдначастотныя каэфіцыенты ў дамене DCT (дыскрэтнае касінуснае пераўтварэнне) перажываюць сціск, заставаючыся нябачнымі для чалавечага ўспрымання. Гэта той жа прынцып, які выкарыстоўвае JPEG—за выключэннем таго, што замест адкідання інфармацыі вы яе хаваеце.

Сістэма Meta апрацоўвае тры крытычныя выпадкі выкарыстання:

  • Выяўленне ШІ: ідэнтыфікацыя таго, ці было відэа створана інструментамі ШІ
  • Адсочванне паходжання: вызначэнне таго, хто апублікаваў кантэнт першым
  • Ідэнтыфікацыя крыніцы: адсочванне таго, які інструмент або платформа стварылі кантэнт

SynthID ад Google DeepMind: вадзяныя знакі ў час генерацыі

У той час як Meta засяроджваецца на пост-вадзяных знаках, SynthID ад Google прымае іншы падыход: убудова вадзянога знака падчас генерацыі. Калі Veo 3 або Imagen Video ствараюць кантэнт, SynthID уплятае сігналы выяўлення непасрэдна ў лятэнтную прастору.

# Канцэптуальная інтэграцыя SynthID
class WatermarkedVideoGenerator:
    def __init__(self, base_model, synthid_encoder):
        self.model = base_model
        self.synthid = synthid_encoder
 
    def generate(self, prompt: str, watermark_id: str) -> Video:
        # Генерацыя ў лятэнтнай прасторы
        latent_video = self.model.generate_latent(prompt)
 
        # Убудова вадзянога знака перад дэкадаваннем
        watermarked_latent = self.synthid.embed(
            latent_video,
            payload=watermark_id
        )
 
        # Дэкадаванне ў прастору пікселяў
        return self.model.decode(watermarked_latent)

Перавага тут фундаментальная: вадзяны знак становіцца часткай самога працэсу генерацыі, а не пасляслоўем. Ён размеркаваны па ўсім відэа такімі спосабамі, якія амаль немагчыма выдаліць без знішчэння кантэнту.

Заявы SynthID аб устойлівасці ўражлівыя:

  • Перажывае сціск са стратамі (H.264, H.265, VP9)
  • Устойлівы да канвертацыі частаты кадраў
  • Захоўвае выяўляльнасць пасля разумнай абрэзкі кадра
  • Падтрымлівае выяўляльнасць пасля рэгулявання яркасці/кантрасту

Чатырохбаковая праблема аптымізацыі

Вось што робіць гэта складаным. Кожная сістэма вадзяных знакаў павінна збалансаваць чатыры канкуруючыя мэты:

  1. Латэнтнасць: як хутка вы можаце ўбудаваць/здабыць?
  2. Дакладнасць біт: наколькі надзейна вы можаце аднавіць карыснае навантажэнне?
  3. Візуальная якасць: наколькі нябачны вадзяны знак?
  4. Перажыванне сціску: ці перажывае ён перакадаванне?

Паляпшэнне аднаго часта пагаршае іншыя. Хочаце больш высокую дакладнасць біт? Вам патрэбна больш моцная ўбудова сігналу—што шкодзіць візуальнай якасці. Хочаце дасканалую нябачнасць? Сігнал становіцца занадта слабым, каб перажыць сціск.

# Ландшафт аптымізацыі
def watermark_quality_score(
    latency_ms: float,
    bit_error_rate: float,
    psnr_db: float,
    compression_survival: float
) -> float:
    # Рэальныя сістэмы выкарыстоўваюць узважаныя камбінацыі
    # Гэтыя вагі залежаць ад выпадку выкарыстання
    return (
        0.2 * (1 / latency_ms) +      # Ніжэйшая латэнтнасць = лепш
        0.3 * (1 - bit_error_rate) +   # Ніжэйшы BER = лепш
        0.2 * (psnr_db / 50) +         # Больш высокі PSNR = лепшая якасць
        0.3 * compression_survival      # Больш высокае перажыванне = лепш
    )

Інжынерны допіс Meta адзначае, што яны выдаткавалі значныя высілкі на пошук правільнага балансу для свайго маштабу—мільярды відэа, разнастайныя кодэкі, розныя ўзроўні якасці. Няма універсальнага рашэння; аптымальны кампраміс залежыць ад вашай канкрэтнай інфраструктуры.

GaussianSeal: вадзяныя знакі 3D-генерацыі

Надыходзячы фронт—гэта вадзяныя знакі 3D-кантэнту, створанага мадэлямі Gaussian Splatting. Фрэймворк GaussianSeal (Li і інш., 2025) прадстаўляе першы падыход да вадзяных знакаў біт для кантэнту, створанага 3DGS.

Выклік з 3D палягае ў тым, што карыстальнікі могуць рэндэрыць з любога пункту гледжання. Традыцыйныя 2D-вадзяныя знакі не працуюць, бо яны залежаць ад пункту гледжання. GaussianSeal убудоўвае вадзяны знак у самі Gaussian-прымітывы:

# Канцэптуальны падыход GaussianSeal
class GaussianSealWatermark:
    def embed_in_gaussians(
        self,
        gaussians: List[Gaussian3D],
        payload: bytes
    ) -> List[Gaussian3D]:
        # Змена параметраў Gaussian (пазіцыя, каварыяцыя, непразрыстасць)
        # такімі спосабамі, што:
        # 1. Захоўваюць візуальную якасць з усіх пунктаў гледжання
        # 2. Кадуюць аднаўляльныя бітавыя шаблоны
        # 3. Перажываюць распаўсюджаныя 3D-маніпуляцыі
 
        for i, g in enumerate(gaussians):
            bit = self.get_payload_bit(payload, i)
            g.opacity = self.encode_bit(g.opacity, bit)
 
        return gaussians

Гэта важна, таму што 3D-генерацыя ШІ выбухае. Па меры сталення такіх інструментаў, як Luma AI і растучая экасістэма 3DGS, абарона аўтарскіх правоў для 3D-актываў становіцца крытычнай інфраструктурай.

Рэгулятарны ціск: Акт ЕС аб ШІ і далей

Тэхнічная інавацыя не адбываецца ў вакууме. Рэгулятарныя рамкі патрабуюць вадзяных знакаў:

Акт ЕС аб ШІ: патрабуе, каб кантэнт, створаны ШІ, быў пазначаны як такі. Канкрэтныя тэхнічныя патрабаванні яшчэ вызначаюцца, але нябачныя вадзяныя знакі з'яўляюцца вядучым кандыдатам для адпаведнасці.

Кітайскія рэгуляцыі: з студзеня 2023 года Адміністрацыя кіберпрасторы Кітая патрабуе вадзяныя знакі на ўсіх медыя, створаных ШІ, якія распаўсюджваюцца ўнутры краіны.

Ініцыятывы ЗША: хоць федэральнага мандата яшчэ няма, галіновыя кааліцыі, такія як Coalition for Content Provenance and Authenticity (C2PA) і Content Authenticity Initiative (CAI), устанаўліваюць добраахвотныя стандарты, якія прымаюць асноўныя платформы.

Для распрацоўшчыкаў гэта азначае, што вадзяныя знакі больш не з'яўляюцца апцыянальнымі—гэта становіцца інфраструктурай адпаведнасці. Калі вы будуеце інструменты генерацыі відэа, сігналы выяўлення павінны быць часткай вашай архітэктуры з першага дня.

Практычныя меркаванні па рэалізацыі

Калі вы рэалізуеце вадзяныя знакі ў сваім уласным канвееры, вось ключавыя рашэнні:

Месца ўбудовы: частотны дамен (DCT/DWT) больш устойлівы за прасторавы дамен. Кампраміс—вылічальныя выдаткі.

Памер карыснага навантажэння: больш біт = больш ёмістасці для дадзеных адсочвання, але таксама больш бачных артэфактаў. Большасць сістэм арыентуюцца на 32-256 біт.

Часавая збыткоўнасць: убудоўвайце тое ж карыснае навантажэнне па некалькіх кадрах. Гэта перажывае страты кадраў і паляпшае надзейнасць выяўлення.

Кіраванне ключамі: ваш вадзяны знак толькі настолькі бяспечны, наколькі вашы ключы. Адносіцеся да іх, як да API-сакрэтаў.

# Прыклад: устойлівая часавая ўбудова
def embed_with_redundancy(
    frames: List[np.ndarray],
    payload: bytes,
    redundancy_factor: int = 5
) -> List[np.ndarray]:
    watermarked = []
    for i, frame in enumerate(frames):
        # Убудова таго ж карыснага навантажэння кожныя N кадраў
        if i % redundancy_factor == 0:
            frame = embed_payload(frame, payload)
        watermarked.append(frame)
    return watermarked

Бок выяўлення

Убудова—гэта толькі палова ўраўнення. Сістэмы выяўлення павінны працаваць у маштабе, часта апрацоўваючы мільёны відэа:

class WatermarkDetector:
    def __init__(self, model_path: str):
        self.model = load_detection_model(model_path)
 
    def detect(self, video_path: str) -> DetectionResult:
        frames = extract_key_frames(video_path, n=10)
 
        results = []
        for frame in frames:
            payload = self.model.extract(frame)
            confidence = self.model.confidence(frame)
            results.append((payload, confidence))
 
        # Галасаванне большасці па кадрах
        return self.aggregate_results(results)

Выклік—ілжывыя станоўчыя вынікі. Пры маштабе Meta нават 0,01% паказчык ілжывых станоўчых азначае мільёны няправільных выяўленняў. Іх сістэма выкарыстоўвае некалькі праходаў праверкі і парогі ўпэўненасці для падтрымання дакладнасці.

Што гэта азначае для крэатараў кантэнту

Калі вы ствараеце відэаканцэнт—ці то арыгінальныя кадры, ці створаныя ШІ—нябачныя вадзяныя знакі становяцца неабходнай інфраструктурай:

  1. Доказ уласнасці: калі ваш кантэнт перазаліты без крэдыту, вы маеце крыптаграфічны доказ паходжання.

  2. Аўтаматызаванае прымусовае выкананне: платформы могуць аўтаматычна выяўляць і атрыбутаваць ваш кантэнт, нават пасля маніпуляцый.

  3. Гатоўнасць да адпаведнасці: па меры пасілення рэгуляцый наяўнасць вадзяных знакаў у вашым канвееры азначае, што вы ўжо адпавядаеце.

  4. Сігналы даверу: кантэнт з вадзянымі знакамі можа даказаць, што ён НЕ створаны ШІ (або празрыста заявіць, што ён створаны).

Шлях наперад

Бягучыя сістэмы яшчэ маюць рэальныя абмежаванні—агрэсіўны сціск усё яшчэ можа знішчыць вадзяныя знакі, і змагальныя атакі, спецыяльна распрацаваныя для іх выдалення, з'яўляюцца актыўнай вобласцю даследаванняў. Але траекторыя ясная: нябачныя вадзяныя знакі становяцца стандартным інфраструктурным узроўнем для аўтэнтычнасці відэа.

Наступныя некалькі гадоў, хутчэй за ўсё, прынясуць:

  • Стандартызаваныя пратаколы вадзяных знакаў па платформах
  • Апаратнае паскарэнне для ўбудовы ў рэжыме рэальнага часу
  • Міжплатформенныя сеткі выяўлення
  • Прававыя рамкі, якія прызнаюць вадзяныя знакі як доказ

Для тых з нас, хто будуе відэаінструменты, паведамленне яснае: аўтэнтыфікацыя больш не з'яўляецца апцыянальнай. Гэта падмурак, на якім усё астатняе сядзіць. Час убудаваць гэта ў архітэктуру.

Нябачны шчыт становіцца абавязковым абсталяваннем.

Гэты артыкул быў карысны?

Damien

Damien

Распрацоўнік ШІ

Распрацоўнік ШІ з Ліёна, які любіць ператвараць складаныя канцэпцыі машыннага навучання ў простыя рэцэпты. Калі не адладжвае мадэлі, яго можна знайсці на веласіпедзе ў даліне Роны.

Like what you read?

Turn your ideas into unlimited-length AI videos in minutes.

Звязаныя артыкулы

Працягвайце даследаванне з гэтымі звязанымі допісамі

Спадабаўся гэты артыкул?

Адкрывайце больш ўзнасцаў і будзьце ў курсе нашага апошняга кантэнту

Нябачныя шчыты: як вадзяныя знакі ШІ-відэа вырашаюць крызіс аўтарскіх правоў у 2025