Техподдержка
Статьи

Метаданные имеют значение: разгребаем хаос из digital материалов

Всем привет! Меня зовут Сергей Фомин, я CEO IT-разработчика Picvario. Мы делаем сервис, который систематизирует – читай, наводит порядок в корпоративных фото, видео и аудио. О подводных камнях в работе с медиа материалами я знаю не понаслышке – уже 20 лет я руковожу фотоагентством. Больше 5 тыс. фотографий из нашего архива ежедневно используют российские и зарубежные СМИ. 


Сегодня я расскажу, почему в цифровую эпоху не выжить без метаданных, и поделюсь несколькими инсайтами о цифровом будущем работы с контентом. Дипфейки, синтетический контент, инклюзивность в медиа и NFT – уже наша реальность, которая стремительно развивается.

Содержание

  • Метаданные: что это и для чего они нужны
  • Краткий экскурс в IPTC/XMP  
  • Системы для чтения и заполнения метаданных
  • Развитие цифровой (не)реальности

Метаданные: что это и для чего они нужны

В digital эру мы генерируем гигантское количество контента. Чтобы вы понимали – в среднем человек производит 1,7 мб контента в секунду! И это с учетом, что у 35% человечества еще нет доступа к интернету. 

Чтобы как-то ориентироваться во всех производимых цифровых материалах, используются метаданные – они уточняют основную информацию о файле. 
Информация записываются внутри самих файлов или в файлах сопровождения: XML, XMP, JSON и др. С помощью метаданных пользователь в прямом смысле «считывает», зачем, когда и где был создан медиафайл, и можно ли его вообще использовать.

Метаданные имеют значение: разгребаем хаос из digital материалов
Рис.1. Пример заполненных полей метаданных с текстовой информацией о файле

Существуют разные типы метаданных, самые распространенные из них – EXIF и IPTC/XMP. 


EXIFметаданные содержат в основном техническую информацию о цифровом файле – настройках камеры в момент создания снимка. Стандарт включает информацию о геолокации, модели камеры, режиме вспышки, формате файла, дате и времени его создания и т.д.

Метаданные имеют значение: разгребаем хаос из digital материалов
Рис.2. Пример метаданных стандарта EXIF

Однако, EXIF включает лишь сухие факты о настройках оборудования – этих данных недостаточно для понимания предназначения медиафайла. Лирика спрятана в метаданных формата IPTC/XMP. Стандарт содержит более 200 полей метаданных, тем самым лучше раскрывает саму суть файла: что на нем изображено, его название, описание, назначение, дата создания, ключевые слова – теги, и другую информацию. 

Особое внимание уделяется и авторству контента – можно указать, кто создатель, условия лицензии на фото или видео. 

Метаданные имеют значение: разгребаем хаос из digital материалов
Рис.3. Информация, которую содержат IPTC/XMP метаданные изображения.
Источник: iptc.org

Краткий экскурс в IPTC/XMP  

Стандарт IPTC/XMP был разработан еще в конце 60-х группой новостных медиа – Международным Советом по Прессе и Телекоммуникациям. В настоящее время в организацию входят более 60 представителей СМИ, включая таких гигантов, как Adobe, Agence France-Presse, Bloomberg, Reuters, Getty Images и др. 

Я и сам являюсь представителем Совета Европейских Медиаагентств (CEPIC) в организации IPTC и участвую в разработке стандарта. Само собой, наше ПО Picvario поддерживает стандарты IPTC. В этом смысле это одно из преимуществ нашего IT-решения Picvario, что мы сами участвуем в развитии стандарта метаданных, влияющих на всю индустрию управления цифровыми медиафайлами. 

С переходом в цифровой век при пересылке фото или видеоматериалов часто терялись данные о медиафайле: его название, описание, информация об авторстве контента и т.д.  Основная цель организации сегодня – развить и распространить в отрасли стандарты для обмена данными об активах.
Кстати, можете на практике посмотреть, какие метаданные содержатся в ваших фотографиях, и при необходимости, отредактировать их через нашу бесплатную программу MetaEditor.

Метаданные имеют значение: разгребаем хаос из digital материалов
Рис.4. Пример метаданных стандарта IPTC/XMP 

Системы для чтения и заполнения метаданных

Практически все проф ПО умеет работать с метаданными IPTC/XMP, например, Adobe Photoshop, Bridge, ACDSee и др. Это касается и отдельно разработанных DAM-систем – в том числе и Picvario. Мы изначально разрабатывали платформу, поддерживающую уже существующие стандарты. 

Приведем пример использования систем управления медиаконтентом. Редактору медиа присылают фотографии и видео с места событий. Далее он должен оперативно транслировать эти материалы в более низком разрешении новостникам для публикаций, а оригиналы поместить в архив. При этом важно обязательно указать копирайтинг и данные о лицензии на использование изображений. Хорошая новость – все эти операции с контентом можно провести через DAM-системы.

Нужно сказать, что DAM давно уже используют за пределами одних только СМИ. Инструменты организации медиаконтента с успехом применяют в учебных заведениях, маркетинговых агентствах, производственных предприятиях и т.д. Все большое распространение набирает практика использования DAM в организациях культурного наследия: галереях, библиотеках, архивах и музеях. 

Так, в 2018 году из-за отсутствия системы хранения контента, случилась страшная трагедия в сфере искусства. В Национальном Музее Бразилии случился пожар, в котором сгорели и были безвозвратно утеряны более 20 млн экспонатов. При наличии платформы DAM у музея, удалось бы сохранить цифровые копии предметов искусства.

Развитие цифровой (не)реальности

Члены и специалисты IPTC/XMP активно лоббируют и развивают инклюзивность стандарта метаданных. В последнем релизе IPTC/XMP появилось поле Alt Text и в дополнение к нему Extended Description

Нововведения касаются слабовидящих и незрячих людей – в мире их больше 320 млн. В Alt Text можно внести описание об изображении – эту информацию программы чтения с экрана трансформируют в аудиальную, и люди с нарушением зрения могут «увидеть» картинку, фотографию или другой визуальный контент. Отмечу, что поле Alt Text интегрировано и в системе Picvario.

Есть и другие темы, которые стоят на повестке дня. Так, этой весной представители IPTC/XMP обсуждали современные вызовы работы с медиаконтентом. 

Одна из актуальных тем – роль метаданных для NFT. Для контекста – NFT это цифровой актив, который можно купить и продать. Его цена определяется ценностью объекта: это может быть изображение, картина, видео, первый твит в истории и т.д. И вот чтобы NFT представлял ценность на рынке – нужны метаданные, описывающие характеристики актива. 

На IPTC/XMP встрече поднимались и другие острые темы в мире цифровых технологий: например, применение искусственного интеллекта (ИИ) для создания синтетического контента. Сегодня мы можем представить себе что угодно, ИИ способен воссоздать любую нашу фантазию. 

Метаданные имеют значение: разгребаем хаос из digital материалов
Рис.5. Первая виртуальная модель Шуду Грэм, созданная на базе системы ИИ. Источник: instagram.com

Еще одна тема последних лет, о которой не пишет только ленивый – совершенствование производства дипфейков. Если раньше на создание реалистичного дипфейка уходило много времени и тонна видеоматериалов, сегодня создавать его уже можно в прямом эфире. Многим политикам, селебрити и другим медийным личностям уже не до смеха – для борьбы с фейками и аутентификации цифровых изображений была создана коалиция C2PA. Туда вошли медийные гиганты – Microsoft, Adobe, BBC, Intel и др. Ожидается, что производитель контента будет присваивать активам цифровой сертификат, фиксирующий информацию о его первичном формате, объеме, владельце и т.д. 

По словам Хани Фарида – специалиста в области компьютерных наук из Калифорнийского университета, он был уверен, что на создание «живых» дипфейков потребуется примерно пять лет. Практика показала – он был неправ,  пугающе реалистичные модели стали создавать уже спустя два года. 

В любом случае цифровые технологии открывают грандиозные возможности для человечества, главное – смотреть во все глаза и внимать, чтобы ничего не прозевать.

Оригинал статьи опубликован по адресу: https://vc.ru/future/509357-metadannye-imeyut-znachenie-razgrebaem-haos-iz-digital-materialov

Вас заинтересует: