Обсудить на форуме

Давим с умом

Давим с умом

Медиа-форматы, использующие сжатие аудиоданных, ведут свое победное шествие по планете. Из компьютера - в автомобиль, в домашнюю аудио/видеосистему и мобильные телефоны. Некоторые названия теперь известны даже мшистым старцам из глухих губерний. Например, МР3. Другие известны менее, но все они несут почетную двойственную надпись на своем боку - "души прекрасные порывы".


Что хорошего в МР3 и его коллегах-подельниках? Во-первых, до эпохи интернета слушатель полностью зависел от системы распространения звуконосителей. Если CD или кассеты "нет в киоске у вокзала", то их "нет в принципе": иди в лес и слушай птиц. Сегодня, если, скажем, заинтересовали классики музыкального авангарда ХХ века - Карлхайнц Штокхаузен или Полина Оливерос - пожалуйста, от Берлина до Калифорнии - все в твоем распоряжении. На культурном фронте интернет-файлы потеснили посредников, фарцовщиков, пиратов, которые вполне сознательно и узколобо фильтровали музкультуру. Конечно, это чисто метафизическая сторона вопроса, существует еще и техническая, о которой мы, в силу специфики нашего ресурса, поговорим подробнее.

Музыкальная информация в сжатых форматах при некоторых потерях качества может занимать объем более чем в 10 раз меньший по сравнению со стандартным CD (как известно, всего лишь одна секунда фонограммы на CD занимает 172 Кб). Вот здесь хорошее, увы, потихоньку заканчивается. И далее начинаются компромиссы, неопределенности и даже неразбериха.

Компрессия осуществляется за счет устранения из аудиосигнала всех тонких деталей звучания оригинала, якобы лежащих вне пределов возможностей человеческого слуха. Чем глубже действует этот иезуитский принцип, (т.е. уменьшается битрейт, обозначает общую ширину потока в Кбит/c (kbs), тем более компактной и менее достоверной становится фонограмма.

Различные кодеры предлагают свой способ обмана слушателя, т.е. психоакустическую модель аудиосигнала, выявляющую и удаляющую "замаскированные" частоты (т.е. те, которые должны не восприниматься слухом ввиду их приглушения другими частотами). Один из способов сжатия основан на так называемом "принципе совмещенного стерео" (Joint Stereo). Считается, что слуховой аппарат человека может достоверно определить направление лишь средних частот. Поэтому верхние и нижние частоты отделяются и кодируются в моносигнал, который затем "синтезируется" в соответствующем канале путем умножения общего сигнала на известные (сохраненные при кодировании) значения мощностей частотных участков.

За последнее десятилетие, кроме МР3, появилось большое количество новых форматов сжатия (AAC, WMA, Ogg Vorbis и др.), разобраться в преимуществах и недостатках которых вот так - "за один присест" - практически невозможно. Анархия крепчает, благодаря так называемым сетевым "независимым тестированиям" и фанатизму отдельных групп пользователей, продвигающих какой-то один дорогой их сердцу формат. Итак, что же происходит на цифровом уровне? Одно дело - слушать готовые треки. А если перед пользователем стоит задача создать собственную музыкальную коллекцию? Что значит на практике "некоторые потери качества"? Как достичь компромисса и кто преуспел в этом искусстве?

MP3 (MPEG audio layer III)

Мы неспроста начинаем обзор с самого известного бытового формата хранения музыки на компьютере. Ныне ему подвластно и музыкальные центры, и DVD плееры, и портативное аудио, и КПК, и мобильные телефоны.

История началась в 1988 году, когда Международная организация стандартов ISO сформировала комитет MPEG (Moving Pictures Expert Group). За более чем десятилетнее существование он выработал ряд форматов кодирования видеоизображений, звука и их комбинаций. В настоящее время существует три стандарта хранения видеоданных: MPEG-1, MPEG-2 и MPEG-4. В рамках MPEG1 и MPEG-2 существуют также форматы хранения звуковой информации, которые носят названия Layer-I, Layer-II и Layer-III. Самый верхний уровень - Layer-III (это и есть MP3) обеспечивает наибольшую степень компрессии.

Вообще-то, на сегодняшний день MP3 не является самым совершенным форматом сжатия аудиоданных (и это можно будет увидеть при сравнении графиков ниже), однако этот недостаток с лихвой перекрывается подавляющей популярностью среди пользователей - так уж сложилось исторически. Возиться же с остальными альтернативными кодеками имеет смысл лишь в том случае, если слушатель не планирует иного источника, кроме компьютера или портативного жесткого диска.

Параметр 128 Кбит/с является водораздельным для MPEG audio layer III. Ниже этого значения качество звука резко падает, что делает MPEG audio layer III малоэффективным для тех случаев, когда требуются минимальные размеры файла при сносных звуковых характеристиках. Для кодирования MP3 наиболее часто используются постоянные значения битрейта (CBR). Предложенная разработчиком (институт Fraunhofer IIS) возможность кодирования с переменным битрейтом (VBR, где ширина потока менялась динамически в зависимости от сложности композиции), в исходном виде оказалась не очень хорошо освоенной рядовыми пользователями. Причина - большое количество изменяемых параметров. Хорошее, но несколько тяжеловесное начинание поддержала группа аудиоэнтузиастов, потратившая немало сил, прежде чем были выработаны несколько оптимальных совокупностей параметров, получивших воплощение в виде готовых пресетов в кодере LAME, имеющих хорошее соотношение качество/размер. Вместе с Fraunhofer, LAME относится к самым качественным кодерам. Также присутствует в пресетах, но в виду успешного развития алгоритмов VBR, так и не получивший широкого распространения переходный способ ABR (Average Bit Rate - средний битрейт).

WMA (Windows Media Audio).

Как заявляет руководство WMA-совместимых бытовых аппаратов (а за ним повторяют эти благоглупости неразборчивые журналисты, не удосужившиеся лично проверить подлинность подобных заявлений), этот формат позволяет превзойти качество МР3, да еще, вдобавок, проявить подобную доблесть при относительно меньших размерах файла. Как показывает практика, единственное преимущество WMA 7/8 исчерпывается этой самой совместимостью с бытовой техникой. И то, исключительно благодаря усилиям и влиянию мегакорпорации Microsoft. В дальнейшем был предложен более качественный кодек WMA 9 pro, однако у него пока наблюдаются проблемы с аппаратной поддержкой.

Ogg Vorbis.

Кодек Vorbis относится к "демократичным" форматам. Разработчик Xiph.org не берет деньги с создателей софта и плееров под OGG Vorbis, как это происходит с MP3 или WMA, где приходится отслюнивать определенные суммы денег на безбедную жизнь держателей патентов. У Vorbis все распространяется абсолютно бесплатно, что и является основным залогом его популярности. Поэтому, как скаредные старухи, создатели современных игр предпочитают кодировать свои звуковые сопровождения в OGG Vorbis. Также поддержку OGG Vorbis иногда можно встретить в портативной технике.

Несмотря на определенную популярность, OGG Vorbis не демонстрирует супервысоких результатов. Бесплатность продукта негативно сказалась на усилиях по дальнейшему усовершенствованию формата. Преимущество Vorbis перед МР становится действительно очевидным лишь на низких битрейтах, да и ресурсы аппаратного декодера Vorbis отличаются отнюдь не демократической скромностью.

Real Audio.

В интернете часто можно встретить демо - небольшие музыкальные фрагменты в формате Real Audio, которые можно прослушать в режиме реального времени даже через допотопный телефонный модем. Этот способ был предложен компанией Real Networks специально для онлайн-трансляций. Отличительная особенность Real Audio - файлы терпимого качества на битрейтах уровня 20 Кбит/с. Если перед пользователем стоит подобная задача, с Real Audio лучше не связываться из-за жесткой привязки кодека к фирменному медиплееру Real One Player. Добиться сносного звучания на миниатюрных битрейтах можно при помощи других современных кодеков.

ATRAC (Adaptive Transform Acoustic Coding).

ATRAC - детище корпорации Sony, изначально разработанный для использования в минидисках MD емкостью 74 минуты. Как всякий глобалистский феодал, Sony очень мучается из-за анархии потребителей (в частности, широкое распространение свободного файлообмена в интернете повергло империю в ужас), а потому навязывает им решения, все достоинства которых успешно перехлестываются ограничениями и неудобствами. Не будем подробно рассказывать о становлении формата, ограничимся лишь данными по последней версии ATRAC-4.5, позволяющей сжимать музыку примерно в 5 раз при приемлемом качестве.

Будучи почетным князем глобализма, Sony имеет собственный круг рабов, высоко ценящих звук своих цепей. В частности, рабы утверждают, что компрессированные в ATRAC файлы звучат-де "приятнее" чем МР3. Если не думать о цепях, накладывающих существенные ограничения по передаче и транскодированию данных, то старые версии ATRAC действительно были неплохи на низких битрейтах, где МР3 уже невыносимо "булькает".

16 июня 2004 года Sony анонсировала новую технологию Hi-MD, позволяющую записать до 1 Гб любой информации на диск Hi-MD. Также под Hi-MD можно было отформатировать старые мини-диски, давая возможность вместить туда 310 Мб информации вместо прежних 170. В рамках Hi-MD появилась новая функция - хранение CD в "родственном" формате Linear PCM, не использующим сжатие. Кстати, Linear PCM часто применяется в DVD c музыкальными программами, поскольку Dolby Digital 5.1 и DTS все-таки используют компрессию данных. А на новый мини-диск Hi-MD теперь можно записать 104 минуты в формате Linear PCM. Также появилось новое поколение формата сжатия - ATRAC 3 Plus, который позволяет уместить до 45 часов музыки на один MD (режим LP - примерно эквивалентный MP3 на 128 Кбит/с) или 8 часов в режиме SP (максимальное качество).

Впрочем, в секторе Car Audio, традиционно отстающему по новациям, о Hi-MD по-прежнему никто слыхать не слыхивал, хотя поддержка файлов ATRAC 3 Plus в головных устройствах Sony имеется. И Sony не была бы Sony, если бы максимально не усложнила жизнь своим клиентам.

"Привязка" MD-плеера к конкретному ПК заключается в том, что пользователь может сколько угодно копировать музыку с него на MD, но не может проделать то же самое с другим компьютером. MD-плееры подключаются в режиме дискового накопителя под Windows, однако в таком режиме можно копировать только данные. Музыка же переносится в плеер по-прежнему только через фирменную программу SonicStage, которая конвертирует в ATRAC даже исходные MP3. Кроме того, Hi-MD не поддерживается прежними MD-плеерами Sony.

AAC (MPEG-2/4 advanced audio coding)

AAC относится к перспективным форматам, поскольку в нем реализована поддержка многоканального звука и увеличена эффективность компрессии по сравнению с МР3. AAC имеет несколько режимов создания файлов, наиболее известным из которых является LC (low complexity, низкая сложность), используемый Apple в своем сервисе iTunes (Apple Quick Time). Кроме того, воспроизведение AAC LC файлов возможно при помощи аппаратных AAC плееров (например, в культовом iPod или телефонах Nokia). Количество существующих AAC кодеков и соответствующих параметров компрессии достаточно велико. Среди них почетное место занимает Nero AAC, отличающийся хорошей реализацией алгоритмов кодирования с переменным битрейтом, результаты которого будут выложены в конце материала вместе с остальными спектрограммами.

Loseless кодеки.

Для гуманистов, не выносящих вида файлов, истерзанных иезуитскими психоакустичскими пыточными инструментами, существует так называемые loseless (без потерь) кодеки. Принцип действия подобных программ очень схож с привычными архиваторами ZIP или RAR, с той лишь разницей, что они изначально затачивались под сжатие аудиоданных и воспроизведение в медиаплеерах. В результате удается сжать исходный музыкальный файл примерно вполовину в зависимости от специфики фонограммы. В нашем случае на тестовом треке этот показатель составил 66% (один из наиболее популярных и совершенных кодеков Monkeys Audio). Также известны loseless кодеки FLAC, WavPack, Optimfrog и даже в рядах WMA 9 можно обнаружить сжатие без потерь.

Что говорят графики?

Исходный wav-файл. Качество CD-audio. Объем - 49,1 Мб
увеличитьИсходный wav-файл. Качество CD-audio. Объем - 49,1 Мб

Для того, чтобы примерно оценить степень деградации сигнала CD-audio при конвертации, было изготовлено 12 вариантов сжатия тестового трека (в его роли выступила композиция Sunday группы Sonic Youth). В качестве кодировщиков выступили программы Lame 3.96.1 и Nero Wave Lab. Результаты, сделанные в звуковом редакторе Sound Forge, можно увидеть на нижеприведенных графиках спектрального анализа. Спектр был замерен в одной из точек композиции, относящихся к "трудным". На низких битрейтах в этом месте отчетливо слышны типичные артефакты компрессии - характерный "дребезг".

Как показывают спектрограммы, картина далека от идеала: все сжатые файлы имеют срез на ВЧ, который может несколько снижаться с повышением битрейта. Даже на самых высоких битрейтах о полной идентичности с wav-файлом не может быть и речи. Полученные величины среза не следует обобщать на весь трек. Даже на постоянных битрейтах, величина среза динамически изменяется. Также величина среза (и степень сжатия) при одних и тех же параметрах сжатия будет изменяться в зависимости от сложности конкретной фонограммы.

Полученные 12 файлов были разбиты на 3 качественные таблицы. К первой относятся наиболее востребованные большинством пользователей варианты сжатия, обеспечивающие приемлемое качество при небольших объемах. Несомненным лидером здесь является кодер AAC-Nero, который при незначительном превышении объема относительно конкурентов по качеству сопоставим уже с МР3 192 Кбит/с, находящимся в следующей качественной группе.

МР3 CBR - 128 Кбит/с. Объем 4,46 Мб
увеличитьМР3 CBR - 128 Кбит/с. Объем 4,46 Мб
OGG Vorbis - VBR 128 Кбит/с. Объем 4,5 Мб
увеличитьOGG Vorbis - VBR 128 Кбит/с. Объем 4,5 Мб
WMA - CBR 128 Кбит/с. Объем 4,5 Мб
увеличитьWMA - CBR 128 Кбит/с. Объем 4,5 Мб
AAC-Nero CBR - 128 Кбит/с. Объем 4,51 Мб
увеличитьAAC-Nero CBR - 128 Кбит/с. Объем 4,51 Мб

Формат Параметры сжатия Объем, Мб
МР3 CBR - 128 Кбит/с 4,46
OGG Vorbis VBR - 128 Кбит/с 4,5
WMA CBR - 128 Кбит/с 4,5
AAC-Nero CBR - 128 Кбит/с 4,51 Мб

Вторая таблица адресована для более требовательных слушателей. Здесь пальму первенства поделили между собой способы с переменным битрейтом - Extreme от ААС и Standard от МР3.

МР3 CBR - 192 Кбит/с. Объем 6,96 Мб
увеличитьМР3 CBR - 192 Кбит/с. Объем 6,96 Мб
МР3 CBR 224 Кбит/с. Объем 7,8 Мб
увеличитьМР3 CBR 224 Кбит/с. Объем 7,8 Мб
AAC-Nero VBR Extreme. Объем 8,03 Мб
увеличитьAAC-Nero VBR Extreme. Объем 8,03 Мб
МР3 VBR Standard. Объем 8,16 Мб
увеличитьМР3 VBR Standard. Объем 8,16 Мб

Формат Параметры сжатия Объем, Мб
МР3 CBR - 192 Кбит/с 6,96
МР3 CBR- 224 Кбит/с 7,8
AAC-Nero VBR Extreme 8,03
МР3 VBR Standard 8,16

Третья таблица предназначена для пользователей, всерьез озабоченных максимальным сохранением всего полезного, что есть в аудиосигнале. Здесь размер файлов уже вдвое превышает конкурсантов первой группы. Лидер по качеству - VBR- Ultra (AAC-Nero). Максимально возможное для МР3 кодирование битрейтом 320 Кбит/с не оправдывает себя с точки зрения экономии дискового пространства. Если же нужен гибкий вариант с оптимальным соотношением качество/размер и максимально совместимый с бытовой электроникой, лучше всего будет остановиться на МР3 VBR Extreme.

МР3 CBR - 256 Кбит/с. Объем 8,92 Мб
увеличитьМР3 CBR - 256 Кбит/с. Объем 8,92 Мб
МР3 VBR Extreme. Объем 9,03 Мб
увеличитьМР3 VBR Extreme. Объем 9,03 Мб
AAC-Nero VBR Ultra. Объем 10,9 Мб
увеличитьAAC-Nero VBR Ultra. Объем 10,9 Мб
МР3 CBR 320 Кбит/с. Объем 11,1 Мб
увеличитьМР3 CBR 320 Кбит/с. Объем 11,1 Мб

Формат Параметры сжатия Объем, Мб
МР3 CBR - 256 Кбит/с 8,92
МР3 VBR Extreme 9,03
AAC-Nero VBR Ultra 10,9
МР3 CBR 320 Кбит/с 11,1

Евгений Домрачев



Оставить комментарий

Имя
Комментарий




||