Водяные знаки контента с помощью ИИ

wiki_en · Сообщение **wiki_en** » 05 май 2026, 17:13

«Нанесение водяных знаков на контент AI» — это процесс внедрения незаметных, но обнаруживаемых сигналов в контент, создаваемый системами искусственного интеллекта, например текст, изображения, аудио или видео. Этот метод позволяет отслеживать контент и идентифицировать его как созданный компьютером без ущерба для его качества для конечного пользователя.
В отличие от традиционных видимых водяных знаков, используемых в фотографии, водяные знаки контента AI обычно невидимы для людей и могут быть обнаружены только алгоритмически.
== Фон ==

Цифровые водяные знаки использовались на протяжении десятилетий для защиты физических и цифровых носителей информации, от бумажных денег до фотографий. Однако быстрое развитие генеративного искусственного интеллекта в начале 2020-х годов создало новый и срочный спрос на методы нанесения водяных знаков, специально адаптированные к контенту, созданному с помощью ИИ. Большие модели генерации изображений, такие как DALL-E, Stable Diffusion и Midjourney, а также большие языковые модели, такие как ChatGPT, позволили создавать высокореалистичный синтетический текст, изображения, аудио и видео в большом масштабе, что поднимает серьезные проблемы этики и безопасности.
В июле 2023 года администрация Байдена получила добровольные обязательства от ведущих компаний, занимающихся искусственным интеллектом, включая OpenAI, Alphabet Inc.|Alphabet, Meta Platforms|Meta и Amazon (компания)|Amazon, по разработке водяных знаков и других технологий происхождения, которые помогут пользователям идентифицировать контент, созданный ИИ.
== Техники ==

Методы нанесения водяных знаков с использованием искусственного интеллекта существенно различаются в зависимости от типа контента, на который наносится водяной знак. По своей сути этот процесс включает в себя два основных этапа: внедрение (или кодирование) водяного знака и обнаружение. Существует два основных метода внедрения: водяные знаки во время создания контента, который требует доступа к самой модели искусственного интеллекта, но, как правило, более надежен, и водяные знаки после создания, которые можно применять к контенту из любого источника, включая модели с закрытым исходным кодом.

Водяные знаки можно в общих чертах классифицировать как видимые (явные знаки, такие как логотипы или наложения текста) или незаметные (обнаруживаемые только алгоритмами). Их также можно классифицировать по долговечности: «надежные» водяные знаки предназначены для выдерживания обычных преобразований, таких как сжатие, обрезка и перекодирование, тогда как хрупкие водяные знаки легко уничтожаются при любом изменении, что делает их полезными для обнаружения несанкционированного доступа.

=== Текст ===

Текстовые водяные знаки считаются одним из наиболее сложных способов, поскольку естественный язык обеспечивает относительно ограниченную избыточность по сравнению с изображениями или аудио. Современные подходы к большим языковым моделям работают путем тонкого изменения распределения вероятностей следующего токена в процессе генерации текста с использованием криптографического ключа. Это создает статистическую закономерность в выборе слов, незаметную для читателя-человека, но обнаруживаемую обученным алгоритмом.
=== Изображения и видео ===

В визуальные медиа водяные знаки можно вставлять путем изменения определенных пикселей в пространственной области или путем изменения информации в частотной области изображения.
=== Аудио ===

Создание водяных знаков аудио предполагает встраивание сигналов в звуковую волну, обычно на частотах, неощутимых для человеческого уха.
== Отраслевые внедрения ==

=== SynthID ===

SynthID — это набор инструментов для нанесения водяных знаков, разработанный Google DeepMind, предназначенный для нанесения водяных знаков и идентификации изображений, текста, аудио и видео, созданных искусственным интеллектом. Впервые он был запущен в бета-версии в августе 2023 года для нанесения водяных знаков на изображения, созданные Imagen на платформе Vertex AI Google Cloud. Впоследствии инструмент был расширен, чтобы охватить текст, созданный Gemini (чат-бот)|Приложение Gemini, аудио, созданное с помощью музыкальной модели Google Lyria, и видео с помощью модели Veo. К 2025 году SynthID использовался для нанесения водяных знаков на более чем десять миллиардов изображений и видеокадров в сервисах Google.
Для текста SynthID действует как процессор логитов, который увеличивает показатели вероятности токена модели с помощью псевдослучайной функции (g-функции), кодируя информацию о водяных знаках без существенного влияния на качество текста. В октябре 2024 года лежащая в основе технология текстовых водяных знаков была опубликована в журнале Nature (journal)|Nature, а код был открыт с помощью Google Responsible Generative AI. Набор инструментов и обнимающее лицо.
Для изображений SynthID использует апостериорный, независимый от модели подход: нейронный кодер встраивает водяной знак в данные пикселей после генерации, а соответствующий декодер обнаруживает его. Поскольку водяной знак голографически распределен по изображению, даже обрезанные фрагменты могут сохранить обнаруживаемую информацию.

=== OpenAI ===

OpenAI разработала систему текстовых водяных знаков для ChatGPT, которая, как сообщается, достигла точности обнаружения 99,9% в ходе внутреннего тестирования.
Несмотря на то, что технология была готова уже почти год, OpenAI предпочла не выпускать ее, как сообщил The Wall Street Journal в августе 2024 года. Опрос компании показал, что почти 30% пользователей ChatGPT заявили, что стали бы меньше пользоваться службой, если бы были реализованы водяные знаки. OpenAI также выразила обеспокоенность тем, что водяной знак можно обойти с помощью инструментов перевода, перефразировав его с помощью другого Модель искусственного интеллекта или вставка и удаление символов, а также то, что этот инструмент может непропорционально стигматизировать тех, кто не является носителем английского языка и использует искусственный интеллект для помощи в написании. Компания указала, что изучает альтернативные подходы, включая внедрение метаданных.

=== C2PA ===

Коалиция за происхождение и подлинность контента (C2PA) — это межотраслевая инициатива, которая разработала открытый технический стандарт для установления происхождения и истории редактирования цифрового контента с помощью метаданных с криптографической подписью.
Хотя C2PA иногда называют «водяными знаками», его подход принципиально иной: он прикрепляет проверяемые метаданные к контенту, а не изменяет сам контент.
== Ограничения и проблемы ==

=== Надежность ===

Существует фундаментальное противоречие между незаметностью водяного знака и его надежностью. Чтобы сделать водяной знак менее заметным, обычно необходимо встроить его более тонко, но тонкие водяные знаки, как правило, более уязвимы для удаления с помощью обычных операций, таких как сжатие или обрезка. Что касается текста, водяные знаки можно устранить, перефразировав вывод, переведя его на другой язык или используя вторую модель искусственного интеллекта для его переписывания. Исследователи из университета из Мэриленда продемонстрировали, что многие существующие схемы водяных знаков искусственного интеллекта могут быть взломаны, при этом особенно низкая уверенность в живучести (невидимых) водяных знаков с «малым возмущением».
Если доступен доступ к инструменту обнаружения водяных знаков, злоумышленник может итеративно изменять контент до тех пор, пока детектор не вернет низкий показатель достоверности, эффективно удаляя водяной знак. Тем не менее, обход инструментов обнаружения ИИ требует некоторой степени технической сложности, и повышение барьера для создания контента без водяных знаков рассматривается некоторыми экспертами как достойная цель, даже если ни один метод не является надежным.

=== Стандартизация и совместимость ===

В настоящее время не существует универсального стандарта для водяных знаков AI-контента. Водяной знак, созданный системой одной компании, может быть необнаружим с помощью инструментов другой компании, что затрудняет широкую проверку. Такое отсутствие совместимости замедляет внедрение и делает проверку того, создан ли контент искусственным интеллектом, фрагментированным и специальным процессом.

=== Модели с открытым исходным кодом ===

Для моделей искусственного интеллекта с открытым исходным кодом нанесение водяных знаков представляет собой особую проблему. Если код водяных знаков является частью открытого конвейера, пользователю легко удалить этап нанесения водяных знаков перед созданием контента.

== Регулирование ==

=== Европейский Союз ===

Закон об искусственном интеллекте|Закон ЕС об искусственном интеллекте, вступивший в силу 1 августа 2024 года, включает конкретные обязательства по прозрачности контента, созданного искусственным интеллектом, в соответствии со статьей 50. Статья требует, чтобы поставщики систем искусственного интеллекта, генерирующих синтетическое аудио, изображение, видео или текст, гарантировали, что их выходные данные «отмечены в машиночитаемом формате и могут быть обнаружены как искусственно созданные или обработанные».
Обязательства по обеспечению прозрачности в соответствии со статьей 50 должны вступить в полную силу 2 августа 2026 года.
=== США ===

В октябре 2023 года Исполнительный указ (США) | Исполнительный указ 14110 о безопасной, надежной и заслуживающей доверия разработке и использовании искусственного интеллекта поручил Министерству торговли | Министерству торговли США разработать руководство по аутентификации контента и нанесению водяных знаков, чтобы помочь отличать контент, созданный искусственным интеллектом, от подлинного материала.

== См. также ==
* Цифровые водяные знаки
* Коалиция за происхождение и подлинность контента
* Инициатива по обеспечению подлинности контента
* Дипфейк
* Генеративный искусственный интеллект
* Стеганография

* [https://c2pa.org/ Коалиция за происхождение и подлинность контента (C2PA)]
* [https://deepmind.google/models/synthid/ SynthID от Google DeepMind]
* [https://github.com/google-deepmind/synthid-text Текст SynthID на GitHub]
* [https://digital-strategy.ec.europa.eu/e ... ed-content Кодекс практики ЕС в отношении контента, генерируемого ИИ]

Цифровые водяные знаки
Приложения искусственного интеллекта
Компьютерная безопасность
Модерация контента
Дипфейки

Подробнее: https://en.wikipedia.org/wiki/AI_content_watermarking

Водяные знаки контента с помощью ИИ ⇐ Васина Википедия