Материал предоставлен http://it.rfet.ru

Кодирование видеоинформации

Видеоинформация – наиболее сложный вид для хранения, обработки и воспроизведения.

Впервые движущиеся изображения были сохранены на кинопленке в виде большого количества отдельных кадров изображения, заснятых через небольшие промежутки времени (24 кадра в секунду). Позднее на ту же пленку стала записываться и звуковая дорожка (в последующем несколько дорожек для многоканального звука). Далее появилось телевидение с аналоговой записью движущегося изображения на магнитные ленты (системы телевидения PAL и SECAM используют 25 кадров в секунду, система NTSC – 29,97 кадров в секунду). С появлением компьютеров широкое распространение получили цифровые методы записи и кодирования видеоинформации, которые постоянно совершенствуются.

В настоящее время каждый может записать видео с использованием мобильных телефонов, цифровых фото и видеокамер и выполнить монтаж видеофильма на персональных компьютерах, производительности которых достаточно для перекодирования видео высокого разрешения объемом в несколько гигабайт (но продолжительность кодирования может составлять несколько часов).

Компьютерные цифровые методы кодирования видео могут использовать частоту телевизионных стандартов PAL/SECAM или NTSC, т. к. видеозаписи многих цифровых форматов могут воспроизводиться как специальными компьютерными программами, так и бытовыми DVD плеерами, а также путем подключения телевизора к компьютеру (для передачи видео и звука следует использовать порт HDMI).

Качество видеоизображения в цифровых методах постоянно улучшается. Широкое распространение цифрового видео было связано с появление вначале CD-дисков, затем DVD, далее Blu-Ray дисков, на которых, в основном, и распространялись кинофильмы, и емкостью которых ограничивались качественные возможности. В таблице 1.4 приведены характеристики некоторых видеоформатов.

Стандарты кодирования видео разрабатываются группой экспертов в области цифрового видео MPEG (Moving Picture Experts Group) Международной Организацией по Стандартизации (ISO). Первый стандарт MPEG-1 был представлен в 1992 г., последние стандарты в этой области – MPEG-7 и MPEG-21.

Алгоритмы кодирования видео очень сложны, их описания можно найти в специальной литературе или на сайте http://www.mpeg.org.

Таблица 1.4. Сравнение форматов записи видео на диски

Формат Разрешение, PAL/NTSC Стандарт кодирования (видео/аудио) Совместимость с DVD-плеером
VCD 352×288 352×240 MPEG-1 /MPEG-1 всегда
SVCD 480×576 480×480 MPEG-2 /MPEG-1 иногда
DVD 720×576 720×480 MPEG-2 /MPEG-1, AC3 всегда
XVCD 720×576 720×480 MPEG-1 или MPEG-2 /MPEG-1 иногда
DivX 640×480 MPEG-4 /MP3, WMA иногда
HD 720p 1280×720 MPEG-4 H.264 /MP3, WMA, AC3 или др. BD-плеер
HD 1080i 1920×1080 (i-чересстрочная развертка) MPEG-4 H.264 /MP3, WMA, AC3 или др. BD-плеер
AVCHD 720p 1280×720 (p – прогрессивная развертка) MPEG-4 v.10 (AVC/H.264) /PCM (7.1) или AC3 (5.1) нет
AVCHD 1080i 1920×1080 MPEG-4 v.10 (AVC/H.264) /PCM (7.1) или AC3 (5.1) нет
UHD-1 4K (2160p) 3840×2160 H.264/ H.265 (HEVC) /AC3 (5.1) или стандарт 22.2 нет
UHD-2 8K (4320p) 7680×4320 H.264/ H.265 (HEVC) /AC3 (5.1) или стандарт 22.2 нет

Все форматы сжатия семейства MPEG (MPEG-1, MPEG-2, MPEG-4, MPEG-7) используют высокую избыточность информации в изображениях, разделенных малым интервалом времени.

Между двумя соседними кадрами обычно изменяется только малая часть сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полная информация о сцене сохраняется выборочно – только для опорных кадров. Для остальных кадров достаточно передавать разностную информацию: о положении объекта, направлении и величине его смещения, о новых элементах фона, открывающихся за объектом по мере его движения. Причем эти разности можно формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается ранее скрытая часть фона).

Алгоритмы MPEG сжимают только опорные кадры – I-кадры (Intra frame – внутренний кадр). В промежутки между ними включаются кадры, содержащие только изменения между двумя соседними I-кадрами – P-кадры (Predicted frame – прогнозируемый кадр). Для того чтобы сократить потери информации между I-кадром и P-кадром, используются B-кадры (Bidirectional frame – двунаправленный кадр). В них содержится информация, которая берется из предшествующего и последующего кадров.

MPEG-4 использует технологию фрактального сжатия изображений. Фрактальное (контурно-основанное) сжатие подразумевает выделение из изображения контуров и текстур объектов. Контуры представляются в виде сплайнов (полиномиальных функций) и кодируются опорными точками. Текстуры могут быть представлены в качестве коэффициентов пространственного частотного преобразования (например, дискретного косинусного или вейвлет-преобразования).

Новые версии MPEG-4 – AVC/H.264 (Advanced Video Codec, называемый также H.264) – стандарт, предназначенный для значительного сжатия видеопотока при сохранении высокого качества и AVCHD (Advanced Video Codec High Definition – улучшенный видеокодек для видео высокого разрешения) – цифровой формат записи видеоданных в форматах 720p или 1080i и многоканального звука. Стандарт AVCHD был разработан совместно компаниями Sony и Panasonic в 2006 году. За основу был взят кодек AVC/H.264.

В октябре 1996 года группа MPEG приступила к разработке формата сжатия MPEG-7, призванным определить универсальные механизмы описания аудио и видео информации. Этот формат получил название «Мультимедиа-интерфейс для описания содержимого» (Multimedia Content Description Interface). В отличие от предыдущих форматов сжатия семейства MPEG, MPEG-7 описывает информацию, представленную в любой форме (в том числе в аналоговой) и не зависит от среды передачи данных.

Формат сжатия MPEG-7 использует развитую многоуровневую структуру описаний аудио и видео информации га основе языка этих описаний. Существуют различные типы информации, для которых разработаны схемы описания базовых структур: низкоуровневые аудио-визуальные характеристики, такие как цвет, текстура, движение, уровень звука и т.д.; высокоуровневые семантические объекты, события и абстрактные принципы; описание содержимого, навигации и доступа к аудио-визуальному материалу и т. д. Одной из отличительных особенностей MPEG-7 является его способность к определению типа сжимаемой информации. Если это аудио или видео файл, то он сначала сжимается с помощью алгоритмов MPEG-1, MPEG-2, MPEG-4, а затем описывается при помощи MPEG-7.

Разработка формата MPEG-21 – долговременный проект, который называется «Система мультимедийных средств» (Multimedia Framework). Над разработкой этого формата эксперты начали работать в 2000 г. Задача разработки MPEG-21 может быть сформулирована следующим образом: определение технологии, необходимой для поддержки пользователей при обмене, доступе, продаже и других манипуляциях цифровыми объектами. При этом предполагается обеспечить максимальную эффективность и прозрачность этих операций. Форматы файлов Microsoft AVI и MKV – контейнеры, предназначенные для хранения видеоинформации, синхронизованной с аудиоинформацией. AVI может содержать в себе потоки 4 типов – Video, Audio, MIDI, Text. Причем видеопоток может быть только один, тогда как аудио – несколько.

Контейнер MKV (Matroska, матрёшка) разрабатывался с учётом современных тенденций и возможных тенденций будущего. Он универсален, так как построен на принципе EBML (то же самое, что и XML, но для двоичных данных). В MKV можно поместить любое количество аудио-видеорядов, меню, как на DVD, главы, субтитры, шрифты, постеры, тексты, комментарии, описания, фотоальбомы и проч. Ограничений практически нет. Максимальная совместимость со всеми возможными требованиями к видео-контейнеру на данный момент и на ближайшее будущее. Используется в настоящее время для переноса информации DVD и Blu-Ray дисков в один файл *.mkv с сохранением меню, выбора языка воспроизведения, показа субтитров на выбранном языке, показа сцен-фрагментов основного фильма, рекламных роликов диска и пр.

Кодирование звуковой информацииСжатие (архивация) информации