Один инженер сломал «неуязвимый» водяной знак Google — чистой математикой

Разработчик Алош Денни реверс-инжинирил водяной знак SynthID от Google — без взломов и нейросетей, одним спектральным анализом. Разбираюсь, почему это важный сигнал для всей индустрии ИИ-контента.

ИнструментыОбзор

Google вшивает во все картинки, сгенерированные Gemini, невидимый водяной знак SynthID. Он переживает скриншоты, сжатие, обрезку — и по задумке должен навсегда пометить изображение как «сделано ИИ». Звучит надёжно. До тех пор, пока один разработчик не решил проверить это на практике.

Алош Денни (Alosh Denny) попросил Gemini 200 раз нарисовать идеально чёрный и идеально белый квадраты. Логика элегантная: на однотонном фоне водяному знаку негде прятаться. Каждый лишний пиксель — это и есть сам сигнал. Усреднив шум с двух сотен картинок, он вытащил «голый» отпечаток SynthID.

Дальше — Фурье-анализ и датасет из 123 тысяч изображений. Оказалось, «случайный» шум — это строгий узор частот, одинаковый для всех картинок конкретной версии Gemini. Совпадение — 99,99%. Больше всего метка прячется в зелёном канале, меньше — в синем. А её форма зависит только от разрешения.

На базе этих данных Денни собрал инструмент, который срезает больше 90% силы водяного знака. Качество картинки при этом не страдает — разницы невооружённым глазом нет.

Но самое ироничное в другом. Инструмент не удаляет метку полностью. Он просто бьёт по ней так, что родной детектор Google решает: «Чисто». Формально следы на месте — но алгоритм их не видит.

И вот тут начинается настоящий разговор

Это не хакерская забава ради звёзд на GitHub. Это серьёзный сигнал: пиксельные водяные знаки — не та стена, на которую стоит делать ставку. Если один человек с Фурье-анализом обходит систему, которую строила целая команда DeepMind, значит, сам подход уязвим по архитектуре.

Для тех, кто работает с ИИ-контентом и думает о маркировке, верификации и доверии к изображениям — это повод присмотреться к альтернативным подходам: метаданным на уровне инфраструктуры, криптографическим подписям, провенанс-протоколам вроде C2PA.

Проект уже набрал больше 2 000 звёзд на GitHub и активно обсуждается в сообществе.

По теме

Если вы работаете с ИИ-генерацией и хотите разобраться, как устроена маркировка контента и какие подходы к верификации реально работают — давайте обсудим.