Ассоциация продуктов для камер и изображений CIPA (с англ. Camera & Imaging Products Association) анонсировала новую версию стандарта EXIF 3.0.
EXIF (англ. Exchangeable Image File Format ) позволяет добавлять к изображениям дополнительную информацию или метаданные, описывающие условия и способы создания изображения, авторство, геолокацию, дату и время съемки и т. п. В большинстве своем EXIF предоставляют набор метаданных с упором на данные, передаваемые с камеры. Информация, записанная по этому стандарту, может использоваться как пользователем, так и различными устройствами, например, операционными системами и система управления файлов. Стандарт разрабатывается японской ассоциацией CIPA, которая существует более 20 лет занимается техническими вопросами фотографии. Постоянными членами ассоциации являются Canon, Apple, Nikon, Fujifilm, Sony, Panasonic и другие крупные бренды.
Первая версия стандарта Exif была выпущена в 1995 году, а предыдущий релиз 2.32 — в 2019 году. В новую версию EXIF 3.0 внесены серьезные изменения. Этим выпуском Ассоциация разрешила такие вопросы:
- мультиязычные текстовые свойства стандарта
- уникальные идентификаторы изображения
- в каких случаях значения свойств exif могут быть изменены или удалены
Об этих вопросах и рекомендациях по синхронизации разных стандартов поговорим в этой статье.
Почему мы считаем это важным?
Я Сергей Фомин, профессиональный фотограф (посмотрите мой авторский проект “Полет над Россией”), генеральный директор экосистемы продуктов Picvario, которая работает с большим объемом изображений: мы более 20 лет предлагаем услуги фото- информационного агентства и стокового ресурса, а с 2019 года занимаемся разработкой системы управления контентом DAM Picvario.
Пользователями и потребителями метаданных являются миллионы человек, иногда даже не осознавая это. Самый простой пример — поисковые системы, которые “считывают” метаданные изображений и формируют вашу поисковую выдачу.
Что касается профессиональной практики, то заполнение метаданных изображений — это обязательное требование для создателей контента, которые хотят распространять свои фотографии на известных стоках. Без них фотографии попросту не пройдут модерацию и не будут опубликованы.
Почему площадки так требовательны? Причина проста — потребители контента не смогут найти нужный файл без метаданных. СМИ, дизайнеры, маркетологи и др. используют для поиска текстовые запросы, при этом поиск осуществляется как раз по соответствию запроса метаданным международных стандартов — Exif, IPTC, xmp. Важность метаданных сложно описать в одном абзаце: ранее мы писали лонгрид, заходите узнать подробнее.
Итак, что изменилось в новом выпуске Exif 3.0
Мультиязычные текстовые свойства стандарта
Проблема: Текстовые поля, такие как «Авторское право» и «Исполнитель», по требованиям стандарта должны были быть в формате ASCII. Из-за этого возникала проблема с текстовыми полями. Если их заполняли не на английском языке, данные не читались при передаче с устройства на устройство.
На практике это означало, что:
- пользователи были вынуждены заполнять поля либо только на английском, либо оставлять поля пустыми
- некоторые программные пакеты игнорировали стандарт и использовали другие наборы символов, нарушая спецификацию.
Решение: В Exif 3.0 представлен новый тип данных «UTF-8», который позволяет поддерживать мультиязычные наборы символов, от русского и греческого до китайского и арабского.
Уникальные идентификаторы
Проблема: Свойство стандарта ImageUniqueID было неточным: не были описаны требования к размерности поля. Из-за этого у ПО возникали проблемы с обработкой — чтением и записью свойства. (прим. ImageUniqueID — уникальный идентификатор стандарта EXIF, который устанавливается камерой во время съемки).
Решение: Предложен алгоритм обработки свойства:
- Поле должно быть записано как строка ASCII в шестнадцатеричной системе счисления, эквивалентная 128-битному UUID фиксированной длины в соответствии с ISO/IEC 9834-8. (прим. ASCII — название кодировки, набора, в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды).
- Универсальный уникальный идентификатор или UUID должен быть версии 1 или версии 4, при этом рекомендуется использовать UUID версии 4. Этот идентификатор присваивается в момент съемки изображения, и записанный идентификатор не обновляется и не стирается при последующем редактировании.
Когда и как значения свойств exif могут быть изменены или удалены
Проблема: В метаданных EXIF автоматически с камеры записывается конфиденциальная информация, например, данные GPS. Чтобы избежать рисков публичного размещения конфиденциальных данных, особенно это касается при съемке с камер смартфонов, пользователи удаляют ВСЮ информацию из метаданных EXIF. Из-за этого программное обеспечение не может осуществлять постобработку изображения. Одной из причин такой потери информации было то, что спецификацией предыдущей версии стандарта не было регламентировано, какие свойства важны для постобработки, а какие могут быть отредактированы или удалены.
Решение: Новый релиз Exif 3.0 добавляет новое Приложение H. «Руководство по обработке информации свойств при постобработке прикладным программным обеспечением», в котором метаданные группируются по:
- категориям: метаданные, связанные со структурой изображения; метаданные, связанные с условиями съемки; и метаданные, содержащие другую информацию.
- по рангу в зависимости от того, когда они должны быть изменены или удалены, если вообще должны.
Ранг | Описание | Примеры (не полный список) |
Update 0 | Свойства, которые должны обновляться при изменении структуры изображения. Информация, которая должна обновляться по мере необходимости во время редактирования изображения, например, теги, выражающие структуру изображения (+ структура файла), и теги, выражающие цветовое пространство. | DateTime (должен обновляться при каждом редактировании), ImageWidth, Compression, BitsPerSample |
Update 1 | Свойство может обновляться независимо от изменения структуры изображения. Информация обновляется независимо от редактирования изображения, например, разнообразные информационные свойства. | ImageDescription, Software, Artist, Copyright, UserComment, ImageTitle, ImageEditor, ImageEditingSoftware, MetadataEditingSoftware |
Freeze 0 | Не подлежит удалению/обновлению в любое время Свойства, не связанные с конфиденциальной информацией, относящейся к отдельным лицам, организациям и т.д. | ImageUniqueID |
Freeze 1 | Может быть удалена в особых случаях, например, для обеспечения безопасности военных фотографов, защиту частной жизни и т.д. | Make, Model, BodySerialNumber |
Freeze 2 | Можно исправить [если неправильно], добавить [если пусто] или удалить [в особых случаях]. Информация, которая может быть исправлена в процессе постобработки, если она неточна или осталась пустой; время, местоположение и другие свойства. | DateTimeOriginal, DateTimeDigitized, GPSLatitude, GPSLongitude, LensSpecification, Humidity |
Полный список изменений в Exif 3.0 читайте по ссылке на сайте https://iptc.org/news/exif-3-0-released-featuring-utf-8-support/
Синхронизация свойств из разных стандартов
Как мы упоминали выше, существуют несколько международных стандартов изображений: самые распространенные Exif, IPTC/xmp. Последние два, в отличии от exif с техническими данными о фотографии, представляют описательную информацию: кто и что изображено на фотографии, имя модели и разрешения на распространение файлов, инструкции по использованию и лицензированию и т.д..
Однако, назначение некоторых свойств разных стандартов одинаковое. Для сохранения данных, избежания перезаписи и/или дублирования информации разработчиками стандартов было создано Руководство по синхронизации, которое определяет, какие именно свойства должны быть согласованы.
Руководство поясняет, как синхронизировать четыре словаря метаданных:
- Метаданные IPTC Photo, в том числе модель обмена информацией IPTC-IIM
- Метаданные стандарта XMP (adobe)
- Метаданные стандарта Exif
- Словарь Schema.org, который предоставляет набор свойств метаданных для структурирования данных в Интернете. Схемы представляют собой теги HTML-кода, в которые интегрируются метаданные.
Таблица с рекомендациями по синхронизации по ссылке.
Заключение
Несмотря на то, что меняется стандарт EXIF, новый релиз затрагивает и другие международные стандарты, в частности IPTC/xmp. Picvario, как представитель IPTC сообщества, в настоящее время работает над согласованием полей синхронизации стандарта. Проект Руководства по сопоставлению полей стандартов и инструкция к нему по ссылке https://docs.google.com/document/d/1HLZtublVflXM4x5hj8LsX8WjjOQqvLAZZXfM7cj0kJA/edit?usp=sharing
Крупные бренды-производители техники понимают, как важно научить разное ПО “говорить на одном языке”, поэтому мы как разработчики системы для управления контентом постоянно следим за рекомендациями международных ассоциаций. В то время как гайдлайны стандартов метаданных носят рекомендательный характер, на практике это must have для всех, вовлеченных в работу с медиа — фотографов, дизайнеров, СМИ, и, разумеется, разработчиков ПО, таких как наша компания Picvario.