В Таллине состоялась трехдневная сессия IPTC, в которой Picvario, как член совета по разработке метаданных, приняли участие. Рабочие группы IPTC в очно-заочном формате обсудили ряд “горячих тем” , в том числе:
- генеративные сети,
- факт-чекинг и борьбу с фейками
- встраивание контента в социальные сети и публикации
Не очень просто донести до неподготовленного читателя важность обсуждаемой тематики и суть предлагаемых решений. Отметим несколько моментов, которые находятся в центре внимания команды Picvario.
C краткой презентацией о последних обновлениях стандарта IPTC Photo Metadata Standard, выступили Дэвид Рикс и Майкл Штейдл, соруководители рабочей группы IPTC Photo Metadata Working Group. Они представили разработанные рекомендации по полям метаданных для контента, созданного генеративными сетями. Нас, кстати, часто спрашивают, можно ли нам в архив агентства загружать подобный контент и как его правильно атрибутировать.
Суть рекомендаций:
- В поле описания контента (Caption/Description) добавляется информация: “Иллюстрация создана путем генерации на основе технологии Х” . IPTC рекомендует также добавлять в XMP-метаданные медиаконтента (фото или видео), сгенерированного с помощью обученных алгоритмов искусственного интеллекта, тег «Тип цифрового источника» (Digital Source Type) и вписывать в него значение trainedAlgorithmicMedia. Именно это будет указывать на то, что изображение было создано с использованием модели, полученной из выборочного содержимого.
- Также рекомендуется использовать следующие значения:
- compositeSynthetic – изображение представляет собой композицию, включающую синтетические элементы;
- algorithmicMedia – изображение было создано только с помощью алгоритма, основанного на обучающих данных, например, созданное программным обеспечением с использованием математической формулы.
С полным перечнем типов цифровых источников, их описанием и примерами использования можно ознакомиться здесь: https://www.iptc.org/std/photometadata/documentation/userguide/#_guidance_for_using_digital_source_type
Кроме того, разработаны поля данных, которые указывают программам, собирающим контент в интернете, возможно ли использование контента для обучения нейросетей. Без прямого разрешения правообладателя подобное использования уже незаконно в Европе, США и ряде других стран. В настоящее время мировым сообществом формируются правила, регулирующие подобное использование.
После обсуждения прав и поля метаданных RightsML участники IPTC узнали от стартапов Texta и Storifyme.com о совместно разработанном инструменте, который позволяет СМИ быстро и легко создавать посты в социальных сетях из новостных статей.
В последний день встречи выступил Чарли Хэлфорд (BBC), доложив о последних новостях Project Origin и C2PA . Напомним, что проект разрабатывает новый стандарт метаданных, который позволит отразить историю изменений контента, что особенно важно для распознавания фейковых материалов.
Официальный релиз события от IPTC https://iptc.org/news/iptc-spring-meeting-2023-generative-ai-ai-fact-checking-standards-updates/