Техподдержка
Новости

EXIF 3.0. Новый выпуск стандарта метаданных изображений

EXIF 3.0. Новый выпуск стандарта метаданных изображений

Ассоциация продуктов для камер и изображений CIPA  (с англ. Camera & Imaging Products Association) анонсировала новую версию стандарта EXIF 3.0. 

EXIF (англ. Exchangeable Image File Format ) позволяет добавлять к изображениям дополнительную информацию или метаданные, описывающие условия и способы создания изображения, авторство, геолокацию, дату и время съемки и т. п. В большинстве своем EXIF предоставляют набор метаданных с упором на данные, передаваемые с камеры. Информация, записанная по этому стандарту, может использоваться как пользователем, так и различными устройствами, например, операционными системами и система управления файлов. Стандарт разрабатывается японской ассоциацией CIPA, которая существует более 20 лет занимается техническими вопросами фотографии. Постоянными членами ассоциации являются Canon, Apple, Nikon, Fujifilm, Sony, Panasonic и другие крупные бренды.

Первая версия стандарта Exif была выпущена в 1995 году, а предыдущий релиз 2.32 — в 2019 году. В новую версию EXIF 3.0 внесены серьезные изменения. Этим выпуском Ассоциация разрешила такие вопросы:

  • мультиязычные текстовые свойства стандарта
  • уникальные идентификаторы изображения
  • в каких случаях значения свойств exif могут быть изменены или удалены

Об этих вопросах и рекомендациях по синхронизации разных стандартов поговорим в этой статье. 

Почему мы считаем это важным?

Я Сергей Фомин, профессиональный фотограф (посмотрите мой авторский проект “Полет над Россией”), генеральный директор экосистемы продуктов Picvario, которая работает с большим объемом изображений: мы более 20 лет предлагаем услуги фото- информационного агентства и стокового ресурса, а с 2019 года занимаемся разработкой системы управления контентом DAM Picvario.

Пользователями и потребителями метаданных являются миллионы человек, иногда даже не осознавая это. Самый простой пример — поисковые системы, которые “считывают”  метаданные изображений и формируют вашу поисковую выдачу. 

EXIF 3.0. Новый выпуск стандарта метаданных изображений

Что касается профессиональной практики, то заполнение метаданных изображений — это обязательное требование для создателей контента, которые хотят распространять свои фотографии на известных стоках. Без них фотографии попросту не пройдут модерацию и не будут опубликованы.

Почему площадки так требовательны? Причина проста — потребители контента не смогут найти нужный файл без метаданных. СМИ, дизайнеры, маркетологи и др. используют для поиска текстовые запросы, при этом поиск осуществляется как раз по соответствию запроса метаданным международных стандартов — Exif, IPTC, xmp. Важность метаданных сложно описать в одном абзаце: ранее мы писали лонгрид, заходите узнать подробнее.

Итак, что изменилось в новом выпуске Exif 3.0

Мультиязычные текстовые свойства стандарта

Проблема: Текстовые поля, такие как «Авторское право» и «Исполнитель», по требованиям стандарта должны были быть в формате ASCII. Из-за этого возникала проблема с текстовыми полями. Если их заполняли не на английском языке, данные не читались при передаче с устройства на устройство. 

На практике это означало, что:

  • пользователи были вынуждены заполнять поля либо только на английском, либо оставлять поля пустыми
  • некоторые программные пакеты игнорировали стандарт и использовали другие наборы символов, нарушая спецификацию. 

Решение: В Exif 3.0 представлен новый тип данных «UTF-8», который позволяет поддерживать мультиязычные наборы символов, от русского и греческого до китайского и арабского.

Уникальные идентификаторы

Проблема: Свойство стандарта ImageUniqueID было неточным: не были описаны требования к размерности поля. Из-за этого у ПО возникали проблемы с обработкой — чтением и записью свойства.  (прим. ImageUniqueID — уникальный идентификатор стандарта EXIF, который устанавливается камерой во время съемки). 

Решение: Предложен алгоритм обработки свойства:

  1. Поле должно быть записано как строка ASCII в шестнадцатеричной системе счисления, эквивалентная 128-битному UUID фиксированной длины в соответствии с ISO/IEC 9834-8.  (прим. ASCII — название кодировки, набора, в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды). 
  2. Универсальный уникальный идентификатор или UUID должен быть версии 1 или версии 4, при этом рекомендуется использовать UUID версии 4. Этот идентификатор присваивается в момент съемки изображения, и записанный идентификатор не обновляется и не стирается при последующем редактировании.

Когда и как значения свойств exif могут быть изменены или удалены

Проблема: В метаданных EXIF автоматически с камеры записывается конфиденциальная информация, например, данные GPS. Чтобы избежать рисков публичного размещения конфиденциальных данных, особенно это касается при съемке с камер смартфонов, пользователи удаляют ВСЮ информацию из метаданных EXIF. Из-за этого программное обеспечение не может осуществлять постобработку изображения. Одной из причин такой потери информации было то, что спецификацией предыдущей версии стандарта не было регламентировано, какие свойства важны для постобработки, а какие могут быть отредактированы или удалены. 

Решение: Новый релиз Exif 3.0 добавляет новое Приложение H. «Руководство по обработке информации свойств при постобработке прикладным программным обеспечением», в котором метаданные группируются по:

  • категориям: метаданные, связанные со структурой изображения;  метаданные, связанные с условиями съемки;  и метаданные, содержащие другую информацию. 
  • по рангу в зависимости от того, когда они должны быть изменены или удалены, если вообще должны.
РангОписаниеПримеры (не полный список)
Update 0Свойства, которые должны обновляться при изменении структуры изображения.
Информация, которая должна обновляться по мере необходимости во время редактирования изображения, например, теги, выражающие структуру изображения (+ структура файла), и теги, выражающие цветовое пространство.
DateTime (должен обновляться при каждом редактировании), ImageWidth, Compression, BitsPerSample
Update 1Свойство может обновляться независимо от изменения структуры изображения. 
Информация обновляется независимо от редактирования изображения, например, разнообразные информационные свойства.
ImageDescription, Software, Artist, Copyright, UserComment, ImageTitle, ImageEditor, ImageEditingSoftware, MetadataEditingSoftware
Freeze 0
Не подлежит удалению/обновлению в любое время
Свойства, не связанные с конфиденциальной информацией, относящейся к отдельным лицам, организациям и т.д. 
ImageUniqueID
Freeze 1Может быть удалена в особых случаях, например, для обеспечения безопасности военных фотографов, защиту частной жизни и т.д.Make, Model, BodySerialNumber
Freeze 2Можно исправить [если неправильно], добавить [если пусто] или удалить [в особых случаях]. 
Информация, которая может быть исправлена в процессе постобработки, если она неточна или осталась пустой; время, местоположение и другие свойства.
DateTimeOriginal, DateTimeDigitized, GPSLatitude, GPSLongitude, LensSpecification, Humidity
Новую спецификацию «CIPA DC-008-Translation-2023 Сменный формат файла изображения для цифровых фотоаппаратов: версия Exif 3.0» можно загрузить с сайта https://www.cipa.jp/std/documents/download_e.html?DC- 008-Перевод-2023-E .

Полный список изменений в Exif 3.0 читайте по ссылке на сайте https://iptc.org/news/exif-3-0-released-featuring-utf-8-support/

Синхронизация свойств из разных стандартов

Как мы упоминали выше, существуют несколько международных стандартов изображений: самые распространенные Exif, IPTC/xmp. Последние два, в отличии от exif с техническими данными о фотографии, представляют описательную информацию: кто и что изображено на фотографии, имя модели и разрешения на распространение файлов, инструкции по использованию и лицензированию и т.д.. 

Однако, назначение некоторых свойств разных стандартов одинаковое. Для сохранения данных, избежания перезаписи и/или дублирования информации разработчиками стандартов было создано Руководство по синхронизации, которое определяет, какие именно свойства должны быть согласованы. 

Руководство поясняет, как синхронизировать четыре словаря метаданных:

  • Метаданные IPTC Photo, в том числе модель обмена информацией IPTC-IIM 
  • Метаданные стандарта XMP (adobe) 
  • Метаданные стандарта Exif 
  • Словарь Schema.org, который предоставляет набор свойств метаданных для структурирования данных в Интернете. Схемы представляют собой теги HTML-кода, в которые интегрируются метаданные.

Таблица с рекомендациями по синхронизации по ссылке.

Заключение

Несмотря на то, что меняется стандарт EXIF, новый релиз затрагивает и другие международные стандарты, в частности IPTC/xmp. Picvario, как представитель IPTC сообщества, в настоящее время работает над согласованием полей синхронизации стандарта. Проект Руководства по сопоставлению полей стандартов и инструкция к нему по ссылке https://docs.google.com/document/d/1HLZtublVflXM4x5hj8LsX8WjjOQqvLAZZXfM7cj0kJA/edit?usp=sharing 

Крупные бренды-производители техники понимают, как важно научить разное ПО “говорить на одном языке”, поэтому мы как разработчики системы для управления контентом постоянно следим за рекомендациями международных ассоциаций. В то время как гайдлайны стандартов метаданных носят рекомендательный характер, на практике это must have для всех, вовлеченных в работу с медиа — фотографов, дизайнеров, СМИ, и, разумеется, разработчиков ПО, таких как наша компания Picvario.

Вас заинтересует: