Всем привет! Меня зовут Сергей Фомин, я CEO IT-разработчика Picvario. Мы делаем сервис, который систематизирует – читай, наводит порядок в корпоративных фото, видео и аудио. О подводных камнях в работе с медиа материалами я знаю не понаслышке – уже 20 лет я руковожу фотоагентством. Больше 5 тыс. фотографий из нашего архива ежедневно используют российские и зарубежные СМИ.
Сегодня я расскажу, почему в цифровую эпоху не выжить без метаданных, и поделюсь несколькими инсайтами о цифровом будущем работы с контентом. Дипфейки, синтетический контент, инклюзивность в медиа и NFT – уже наша реальность, которая стремительно развивается.
Содержание
- Метаданные: что это и для чего они нужны
- Краткий экскурс в IPTC/XMP
- Системы для чтения и заполнения метаданных
- Развитие цифровой (не)реальности
Метаданные: что это и для чего они нужны
В digital эру мы генерируем гигантское количество контента. Чтобы вы понимали – в среднем человек производит 1,7 мб контента в секунду! И это с учетом, что у 35% человечества еще нет доступа к интернету.
Чтобы как-то ориентироваться во всех производимых цифровых материалах, используются метаданные – они уточняют основную информацию о файле.
Информация записываются внутри самих файлов или в файлах сопровождения: XML, XMP, JSON и др. С помощью метаданных пользователь в прямом смысле «считывает», зачем, когда и где был создан медиафайл, и можно ли его вообще использовать.
Существуют разные типы метаданных, самые распространенные из них – EXIF и IPTC/XMP.
EXIFметаданные содержат в основном техническую информацию о цифровом файле – настройках камеры в момент создания снимка. Стандарт включает информацию о геолокации, модели камеры, режиме вспышки, формате файла, дате и времени его создания и т.д.
Однако, EXIF включает лишь сухие факты о настройках оборудования – этих данных недостаточно для понимания предназначения медиафайла. Лирика спрятана в метаданных формата IPTC/XMP. Стандарт содержит более 200 полей метаданных, тем самым лучше раскрывает саму суть файла: что на нем изображено, его название, описание, назначение, дата создания, ключевые слова – теги, и другую информацию.
Особое внимание уделяется и авторству контента – можно указать, кто создатель, условия лицензии на фото или видео.
Краткий экскурс в IPTC/XMP
Стандарт IPTC/XMP был разработан еще в конце 60-х группой новостных медиа – Международным Советом по Прессе и Телекоммуникациям. В настоящее время в организацию входят более 60 представителей СМИ, включая таких гигантов, как Adobe, Agence France-Presse, Bloomberg, Reuters, Getty Images и др.
Я и сам являюсь представителем Совета Европейских Медиаагентств (CEPIC) в организации IPTC и участвую в разработке стандарта. Само собой, наше ПО Picvario поддерживает стандарты IPTC. В этом смысле это одно из преимуществ нашего IT-решения Picvario, что мы сами участвуем в развитии стандарта метаданных, влияющих на всю индустрию управления цифровыми медиафайлами.
С переходом в цифровой век при пересылке фото или видеоматериалов часто терялись данные о медиафайле: его название, описание, информация об авторстве контента и т.д. Основная цель организации сегодня – развить и распространить в отрасли стандарты для обмена данными об активах.
Кстати, можете на практике посмотреть, какие метаданные содержатся в ваших фотографиях, и при необходимости, отредактировать их через нашу бесплатную программу MetaEditor.
Системы для чтения и заполнения метаданных
Практически все проф ПО умеет работать с метаданными IPTC/XMP, например, Adobe Photoshop, Bridge, ACDSee и др. Это касается и отдельно разработанных DAM-систем – в том числе и Picvario. Мы изначально разрабатывали платформу, поддерживающую уже существующие стандарты.
Приведем пример использования систем управления медиаконтентом. Редактору медиа присылают фотографии и видео с места событий. Далее он должен оперативно транслировать эти материалы в более низком разрешении новостникам для публикаций, а оригиналы поместить в архив. При этом важно обязательно указать копирайтинг и данные о лицензии на использование изображений. Хорошая новость – все эти операции с контентом можно провести через DAM-системы.
Нужно сказать, что DAM давно уже используют за пределами одних только СМИ. Инструменты организации медиаконтента с успехом применяют в учебных заведениях, маркетинговых агентствах, производственных предприятиях и т.д. Все большое распространение набирает практика использования DAM в организациях культурного наследия: галереях, библиотеках, архивах и музеях.
Так, в 2018 году из-за отсутствия системы хранения контента, случилась страшная трагедия в сфере искусства. В Национальном Музее Бразилии случился пожар, в котором сгорели и были безвозвратно утеряны более 20 млн экспонатов. При наличии платформы DAM у музея, удалось бы сохранить цифровые копии предметов искусства.
Развитие цифровой (не)реальности
Члены и специалисты IPTC/XMP активно лоббируют и развивают инклюзивность стандарта метаданных. В последнем релизе IPTC/XMP появилось поле Alt Text и в дополнение к нему Extended Description.
Нововведения касаются слабовидящих и незрячих людей – в мире их больше 320 млн. В Alt Text можно внести описание об изображении – эту информацию программы чтения с экрана трансформируют в аудиальную, и люди с нарушением зрения могут «увидеть» картинку, фотографию или другой визуальный контент. Отмечу, что поле Alt Text интегрировано и в системе Picvario.
Есть и другие темы, которые стоят на повестке дня. Так, этой весной представители IPTC/XMP обсуждали современные вызовы работы с медиаконтентом.
Одна из актуальных тем – роль метаданных для NFT. Для контекста – NFT это цифровой актив, который можно купить и продать. Его цена определяется ценностью объекта: это может быть изображение, картина, видео, первый твит в истории и т.д. И вот чтобы NFT представлял ценность на рынке – нужны метаданные, описывающие характеристики актива.
На IPTC/XMP встрече поднимались и другие острые темы в мире цифровых технологий: например, применение искусственного интеллекта (ИИ) для создания синтетического контента. Сегодня мы можем представить себе что угодно, ИИ способен воссоздать любую нашу фантазию.
Еще одна тема последних лет, о которой не пишет только ленивый – совершенствование производства дипфейков. Если раньше на создание реалистичного дипфейка уходило много времени и тонна видеоматериалов, сегодня создавать его уже можно в прямом эфире. Многим политикам, селебрити и другим медийным личностям уже не до смеха – для борьбы с фейками и аутентификации цифровых изображений была создана коалиция C2PA. Туда вошли медийные гиганты – Microsoft, Adobe, BBC, Intel и др. Ожидается, что производитель контента будет присваивать активам цифровой сертификат, фиксирующий информацию о его первичном формате, объеме, владельце и т.д.
По словам Хани Фарида – специалиста в области компьютерных наук из Калифорнийского университета, он был уверен, что на создание «живых» дипфейков потребуется примерно пять лет. Практика показала – он был неправ, пугающе реалистичные модели стали создавать уже спустя два года.
В любом случае цифровые технологии открывают грандиозные возможности для человечества, главное – смотреть во все глаза и внимать, чтобы ничего не прозевать.
Оригинал статьи опубликован по адресу: https://vc.ru/future/509357-metadannye-imeyut-znachenie-razgrebaem-haos-iz-digital-materialov