Материал предоставлен http://it.rfet.ru

Кодирование звуковой информации

Звук можно описать в виде совокупности синусоидальных волн определённых частоты и амплитуды. Частота волны определяет высоту звукового тона, амплитуда – громкость звука. Частота измеряется в герцах (Гц, Hz). Диапазон слышимости для человека составляет от 20 Гц до 17000 Гц (или 17 кГц).

Задача цифрового представления звука сводится измерению интенсивности звука через заданный интервал времени (например, 48 раз за 0,001 секунды).

Принцип такого представления изображён на рис. 1.13.

Рис. 1.13. Диаграмма стереозвука в музыкальном редакторе (верхняя ось – время ~ от 20,854 до 20,856 сек., т. е. 0,002 сек.)

Каждому измерению присваивается числовое значение амплитуды. Количество измерений в секунду называется частотой выборки (sampling rate). Количество возможных значений амплитуды называется точностью выборки (sampling size). Таким образом, звуковая волна представляется в виде ступенчатой кривой. Ширина ступеньки тем меньше, чем больше частота выборки, а высота ступеньки тем меньше, чем больше точность выборки.

Возможности наиболее распространённой современной аппаратуры предусматривают работу с частотой выборки до 48 кГц (48 тысяч раз в секунду!), что позволяет правильно описывать звук частотой до 22,05 кГц.

Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний.

Характеристики качества звука

  1. Точность выборки или глубина кодирования звука – количество бит на одно измерение величины звукового сигнала.

    Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество уровней (градаций амплитуды) можно рассчитать по формуле:

    %% N = 2^I = 2^{16} = 65 536%% уровней сигнала (градаций амплитуды)

  2. Частота выборки или частота дискретизации – это количество измерений уровня звукового сигнала за 1 секунду.

    Одно измерение в 1 секунду соответствует частоте 1 Гц. 1000 измерений в 1 секунду 1 кГц. Количество измерений может лежать в диапазоне от 8000 до 48 000 (8 кГц – 48 кГц). 8 кГц соответствует частоте радиотрансляции, 48 кГц – качеству звучания аудио-CD. Опыт показывает, что точное соответствие цифрового сигнала аналоговому достигается, если частота дискретизации будет вдвое выше максимальной звуковой частоты, то есть составит не менее 40 кГц.

    На практике значения частоты дискретизации, применяемые в звуковых системах, равны 44,1 кГц или 48 кГц.

    Чем больше частота дискретизации, тем качественнее звук.

  3. Для характеристики сжатого звука и видео используется понятие битрейт – количество единиц информации, необходимых для хранения или передачи одной секунды потока данных. Величина измеряется в килобитах в секунду (kbps). Битрейт характеризует как плотность упаковки информации, так и её качество. Например, из двух MP3 файлов сжатых с разным битрейтом, более качественный (близкий к оригиналу) звук будет у файла с большим битрейтом. В тоже время, файл другого формата, при равном битрейте, может дать как лучшее, так и худшее качество звука. Стандартов кодирования двухканальной и многоканальной (5.1 и 7.1) аудиоинформации насчитывается несколько десятков, наименования некоторых из них, используемых в современных методах записи мультимедиаинформации, приведены далее.
Кодирование изображенийКодирование видеоинформации