Detaillook > База знаний > Устройство и принципы кодирования формата mp3

Устройство и принципы кодирования формата mp3


mp3, или полностью MPEG-1, 2 и 2.5 Layer 3, является одним из самых популярных, широко распространенных стандартов, для хранения аудио данных.

В данной статье мы не будем углубляться в историю создания и последующего развития, а рассмотрим основные принципы стандарта и примеры его реализации.

Стандарт mp3, не устанавливает определенный алгоритм сжатия «кодирования» исходных данных, он описывает суть, возможных методов.

Качество полученного результата, зависит от используемой модификации алгоритма, заложенного в какую - либо программу для кодирования «кодек», и качества исходных аудио данных.

Существуют 3 наиболее распространенных модификации формата mp3, отличающихся между собой, параметрами степени сжатия исходных аудио данных.

Наименование
Модификации стандарта

Скорость потока данных в секунду (битрейт)
Возможные частоты дискретизации
MPEG-1 Layer 3
От 32 — до 320 кбит
32000 Гц
44100 Гц
48000 Гц
MPEG-2 Layer 3От 16 — до 160 кбит16000 Гц
22050 Гц
24000 Гц
MPEG-2.5 Layer 3От 8 — до 160 кбит8000 Гц
11025 Гц





Обработка начинается с разбивания исходного звукового сигнала на одинаковые промежутки времени - фреймы, равные к примеру, 0.05 или 0.26 секунды, после этого каждый фрейм, анализируется и сжимается по общим, либо индивидуальным параметрам, основываясь на данных предыдущего и следующего фрейма.

Большинство применяемых, алгоритмов сжатия основаны на особенностях восприятия человеческого слуха. Рассмотрим основные, варианты, которые, как правило, применяются комплексно.

Стоит начать с того, что на слух, среднестатистического человека, способен воспринимать диапазон частот, приблизительно  от 10 Гц до 20000 Гц. С взрослением происходят изменения слухового аппарата, и у большинства, снижается «теряется» чувствительность к верхнему диапазону частот, вследствие чего, в некоторых модификациях mp3, при сжатии, обрезаются все частоты выше 16000 герц, что позволяет существенно сократить объем информации.

Аудиозапись, может быть закодирована, как в стерео (эффект объемного звучания, с использованием раздельных каналов для левого и правого динамика), так и в моно (противоположность стерео). В формате mp3, записывается не различные дорожки для каждого их динамиков, а информация о различиях, между левым и правым каналом.

В акустике, присутствует такое понятие, как «гармоники», это частоты «звуки», звучащие вместе с основным, самым выделяющимся звуком – тоном. Например, при ударе в барабан, самый громкий звук, будет являться тоном, а второстепенные, более слабые, гармониками.  

После подобного громкого звука, наступает так называемый «период глухоты», в период длительности, которого слух человека практически не реагирует на изменения.

Если в интервалах «периода глухоты», убрать все частоты, то погрешности восприятия, практически не позволят заметить их отсутствие, благодаря этому, при сжатии отсекаются более слабые гармоники, располагающиеся вблизи более сильных звуков - тонов.

Применяется метод замены близлежащих пиковых значений сигнала «пиков» (по громкости), одним усредненным значением.

Присутствует такое понятие, как битрейт – это величина, характеризующая количество, передаваемых бит «единиц» информации за промежуток времени, обычно секунду.
Чем выше битрейт, тем лучше детализация звука, при условии высокого качества исходных, не сжатых аудио данных.

Как можно догадаться, цифровые форматы, состоят из определенных последовательностей кода, иначе говоря, из последовательностей 0 и 1.
Для большей экономии места, часто встречающимся комбинациям, в пределах одного файла, присваиваются уникальные индификаторы, замещающие собой, длинные последовательности.

Благодаря подобным комплексам воздействий, удается сжать исходный аудио сигнал, в один из популярных форматов, с потерями качества - формат mp3.

Неоднократно проводились всевозможные эксперименты, с целью выявить, насколько значительными являются различия до и после сжатия в mp3. Как показали тесты, различия, некоторые аналогичные моменты не всегда удавалось, быстро и различить, да же при воспроизведении на оборудовании с повышенной точностью воспроизведения.

Для того, кто никогда ни имел возможности сравнить напрямую оригинальную аудиозапись и сжатую, в большинстве случаев, не сразу или вообще сможет найти явных отличий.  

2 701
Какие варианты раскладок клавиатуры есть, кроме QWERTY и ЙЦУКЕН
Битрейт: что такое и на что он влияет