Что лучше dsd или wav
MP3, AAC, WAV, FLAC: рассказываем обо всех форматах аудиофайлов
Сохранить и прочитать потом —
Организуя свою коллекцию цифровой музыки, можно утонуть в разнообразии форматов аудиофайлов. Почти каждый слышал об MP3, но что такое OGG, AIFF или MQA?
Если по прочтении списка у вас возникло подозрение, что все эти форматы для получения таких шикарных аббревиатур учились в разных университетах, мы поможем развеять его. В этом материале будет прояснена суть некоторых популярных музыкальных форматов, разница между ними и то, почему это важно знать.
Что бы вы ни слушали – MP3-файлы с низким битрейтом, чуть более качественные треки в AAC или Hi-Res-аудио во FLAC или WAV – настало время разобраться в том, что именно вы получаете в каждом случае и как выбрать оптимальный формат.
Давайте оценим плюсы и минусы каждого из них.
Краткий обзор форматов файлов и кодеков
Чтобы не ходить вокруг да около, вначале мы приведем краткую памятку по всем форматам файлов и различиям между ними. Если захотите узнать больше, ниже вы найдете более подробное описание различий в размерах, качестве звука и совместимости.
AAC (не является форматом Hi-Res-аудио). Ставшая популярной благодаря Apple альтернатива формату MP3. Со сжатием и потерями, но с более высоким качеством звука. Используется для скачивания с iTunes и трансляции с Apple Music.
AIFF (Hi-Res). Альтернатива WAV от Apple с более полными метаданными. Не особенно популярный формат без сжатия и потерь с файлами большого размера.
DSD (Hi-Res). Однобитный формат, применяемый в Super Audio CD. Существует в вариантах с частотой дискретизации 2,8 МГц, 5,6 МГц и 11,2 МГц. Из-за использования кодека высокого качества в настоящее время не применяется для стриминга. Формат без сжатия.
FLAC (Hi-Res). Формат со сжатием без потерь с поддержкой частот дискретизации, совместимых с Hi-Res, и хранением метаданных; размер файлов вдвое меньше, чем у WAV. Благодаря отсутствию лицензионных отчислений считается лучшим форматом для скачивания и хранения альбомов в Hi-Res-аудио. Его главный недостаток – отсутствие поддержки устройствами Apple (и, следовательно, несовместимость с iTunes).
MP3 (не является форматом Hi-Res-аудио). Популярный формат со сжатием и потерями с малым размером файла и далеко не самым высоким качеством звучания. Удобен для хранения музыки на смартфонах и плеерах iPod.
MQA (Hi-Res). Формат со сжатием для хранения Hi-Res-файлов в более удобной для стриминга форме. Используется сервисом Tidal Masters для трансляций Hi-Res-аудио.
OGG (не является форматом Hi-Res-аудио). Иногда называется полным именем – Ogg Vorbis. Альтернатива MP3 и AAC с открытым кодом, не подпадающая под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.
WAV (Hi-Res). Стандартный формат, в котором записаны все CD. Отличное качество звука, но огромный размер файлов из-за отсутствия сжатия. Слабая поддержка метаданных (обложек, названий песен и исполнителей).
WMA Lossless (Hi-Res). Версия Windows Media Audio без сжатия, поддержку которой уже не часто можно встретить в смартфонах и планшетах.
Аудиофайлы со сжатием и без него
Вначале рассмотрим три категории, в которые можно сгруппировать все форматы аудиофайлов. Они определяются степенью сжатия данных и связанным с ним уровнем потерь качества звучания.
Если для сжатия аудио в вашем файле не применялся специальный алгоритм (или кодек), это приведет к двойному результату: во-первых, потерь качества звучания не будет, во-вторых, место на вашем жестком диске скоро закончится.
По своей сути запись в формате без сжатия полностью соответствует оригинальному аудиофайлу, в котором зафиксированы в цифровом представлении реальные звуковые сигналы.
WAV и AIFF можно назвать самыми популярными форматами аудиофайлов без сжатия. Оба они основаны на PCM (Pulse Code Modulation, импульсно-кодовой модуляции), широко известном механизме непосредственного преобразования аудиосигнала в цифровую форму. В WAV и в AIFF применяются схожие технологии, но методы хранения данных несколько различаются. В этих форматах можно записывать как файлы CD-качества, так и более высокого разрешения.
Формат WAV был разработан Microsoft и IBM, в силу чего применяется на платформах на базе Windows; он является стандартным форматом записи компакт-дисков.
Формат AIFF создан компанией Apple как альтернатива WAV; и хотя AIFF-файлы менее распространены, они обеспечивают более полную поддержку метаданных, позволяя хранить обложки альбомов, названия песен и тому подобную информацию.
Недостаток этих форматов – требование гигантских объемов памяти. Файлы CD-качества (16 бит, 44,1 кГц) занимают около 10 МБ дискового пространства на минуту звучания.
ALAC, FLAC, WMA Lossless: аудиоформаты без потерь
Все мы любим FLAC. Формат без потерь, файлы во FLAC (Free Lossless Audio Codec, бесплатный аудиокодек без потерь) по размеру почти вдвое меньше, чем в WAV или AIFF без сжатия с эквивалентной частотой дискретизации, однако в плане звучания никаких потерь качества не заметно. FLAC также поддерживает более высокое разрешение по сравнению с CD-качеством – до 32 бит и 192 кГц.
Помимо FLAC, есть и другие форматы без потерь – ALAC (Apple Lossless) и WMA Lossless (Windows Media Audio). Первый представляет собой отличную альтернативу для iOS и iTunes, хотя размер файлов чуть выше, чем у FLAC. Не все смартфоны и планшеты поддерживают его.
AAC и MP3: аудиоформаты с потерями
Кто не слышал про MP3? Все про него слышали. Этот самый распространенный аудиоформат удобен для хранения музыки на плеерах iPod или планшетах и поддерживается практически любыми устройствами. Однако для этого приходится жертвовать значительным объемом информации. Для того чтобы уменьшить размеры файлов на порядок по сравнению с записями в CD-качестве, необходимо отбросить значительный процент исходных данных, что приводит к потере качества звучания.
Битрейт, с которым записан MP3-файл, тоже влияет на качество звука. MP3 с битрейтом 128 кбит/с теряют больше информации, чем файлы с 320 кбит/с (это расшифровывается как «килобит в секунду», где каждый «бит», в сущности, представляет собой крохотный кусочек песни). Учитывая резкое снижение стоимости памяти, в наше время нет никаких причин слушать файлы с битрейтом 128 кбит/с; MP3 с 320 кбит/с имеют смысл при ограниченном объеме памяти, они также остаются стандартным форматом для скачивания файлов Интернет-магазинов.
Еще один формат с потерями, AAC (Advanced Audio Coding, усовершенствованное кодирование звука), также предполагает сжатие, как и MP3, но благодаря несколько более эффективным алгоритмам обеспечивает более качественный звук. AAC используется для скачивания с iTunes и трансляций с Apple Music (с битрейтом 256 кбит/с), а также в передачах с YouTube.
Формат Vorbis, нередко называемый Ogg Vorbis, чтобы подчеркнуть использование контейнера Ogg, представляет собой альтернативу MP3 и AAC с открытым кодом, не подпадающую под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.
Если вы планируете использовать форматы с потерей информации, учитывайте следующий факт: повышение числа «бит» обычно ведет к росту качества звучания, однако оно во многом зависит от эффективности кодека, с помощью которого выполняется преобразование файла. Если большая часть музыки в вашей коллекции закодирована с битрейтом 128 Кбит/с, то вы могли заметить, что, несмотря на принципиальное сходство звучания, из-за низкой эффективности кодека MP3-файлы, скорее всего, будут слушаться несколько хуже AAC или Ogg Vorbis.
Как насчет музыки в высоком разрешении?
В отличие от HD-видео, для аудио высокого разрешения пока не разработано универсального стандарта.
Если не вдаваться в подробности, под этим термином обычно понимаются записи с более высокой частотой дискретизации и/или разрядностью, чем у CD (т.е. 16 бит/44,1 кГц). Примерами Hi-Res-аудио могут служить файлы с параметрами 16 бит/96 кГц или 24 бит/192 кГц.
Благодаря наличию дополнительной аудиоинформации Hi-Res-файлы звучат намного лучше в сравнении с компрессированными файлами, теряющими эту информацию в процессе сжатия. Эти форматы требуют больше места на диске, но их качество определенно стоит таких затрат.
К Hi-Res-аудио относятся форматы без сжатия, такие как AIFF и WAV, а также без потерь – FLAC и ALAC. DSD (отчасти нишевый формат, применявшийся в Super Audio CD) также входит в категорию Hi-Res-аудио, но его поддерживает гораздо меньшее число устройств. Если говорить о стриминге, то такие сервисы, как Tidal Masters, используют упаковщик MQA, позволяющий передавать по сетям файлы в высоком разрешении с использованием минимально возможной полосы пропускания сигнала.
Что касается воспроизведения форматов Hi-Res-аудио, то сегодня его поддерживает уже немало устройств. 24-разрядные файлы способны проигрывать беспроводные колонки Denon HEOS, а также портативные музыкальные плееры премиум-класса – такие как Cowon Plenue D2 и Astell & Kern A&norma SR15.
Кроме того, с Hi-Res-аудио совместимы большинство флагманских моделей смартфонов под Android – например, удостоенный высших оценок Samsung Galaxy S10+ – однако прослушать их на новеньком iPhone вам сходу не удастся. Мы нашли способы обойти это ограничение, но нельзя забывать о том, что файлы Hi-Res-аудио пока еще не настолько компактны, как их аналоги в форматах с потерями.
Какой аудиоформат будет лучшим для вас?
Выбор формата зависит от того, что вас больше волнует – объем памяти или качество звучания – а также от того, с каким устройством вы намерены его использовать.
Популярность MP3 сложилась в эпоху, когда стоимость дискового пространства была очень высока. Сегодня смартфоны, музыкальные плееры и ноутбуки оснащаются памятью внушительного объема, так что есть смысл обратить внимание на форматы с качеством выше, чем у CD.
Если же вы решили архивировать свои аудиофайлы, FLAC или другой формат без потерь может стать неплохим вариантом. Они представляют собой удачный компромисс между уровнем сжатия и качеством звучания, позволяя слушать высококачественную цифровую музыку и сэкономить дисковое пространство. Только не забудьте проверить совместимость выбранного формата и имеющихся устройств.
Подготовлено по материалам портала «What Hi-Fi?», март 2020 г.
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
Помогите разобраться и определиться: FLAC или DSD (и стоит ли из-за DSD менять плеер)?
Приветсвую всех, мучают меня пара вопросов по форматам музыки.
Есть ресивер Marantz M-CR610. Увы, это первая модель и поддерживает он FLAC HD 192/24 / ALAC 96/24 / WAV 192/24. И все бы ничего, есть полочники к нему Bowers & Wilkins 686 S2 и сабвуфер REL T/Zero.
Конечно это не система за миллионы, но звучит лучше моего муз. центра в юности Sony W550, особенно когда я подключил колонки биампингом.
Но вот на ресурсе, где пополняю свою фонотеку FLAC-ами наткнулся на несколько залежей оцифровок винила, причем либо в формате wav 192/32, либо еще больше всего в DSD.
Сначала конвертировал wav в FLAC 192/24. Но внутренний зверь (жаба) душил, что я теряю в качестве. Там же было 32 бит, а у меня теперь 24.
Но потом и вовсе, когда увидел кучу всего в DSD, а у меня мой ресивер не поддерживает этот формат стал даже задумываться — а не махнуть его на такой же, но M-CR612 — там есть поддержка DSD, ну или на Marantz NR1200, хотя там много всего, что не нужно — дружба с телеком, с игровыми приставками и т.д.
Вот отсюда к вам вопросы
1. Что все-таки лучше звучит и «сохраняет» исходник, тот же винил — FLAC или DSD?
Я понимаю, что FLAC это грубо архиватор, т.е. им только сжали. Типа нет потери. Но там же внутри получается wav 192/32, а у меня на выходе архиватор с 192/24, или все же это конвертация, и тогда мы опять же теряем в переходе с 32 на 24?
2. Стоит ли менять ресивер, где чуть удобнее стала поддержка технологии Heos и появился формат DSD, а остальное все тоже? Пытался поискать что-то еще, в этой ценовой группе — там либо вообще ресиверы видео, либо нет биампинга (мне реально понравилась разница в звучании), либо нет сетевой поддержки и т.д.
Я понимаю, сейчас будут говорить — мол фигней страдаешь, слушай в флаке и не рыпайся, не отличишь же ничего, но блин, завелся не по детски ))) Растолкуйте пожалуйста все по полочкам — стоит заморачиваться этим или оставить как есть? Есть ли потери в качестве? Чем отличаются эти два формата — вернее как сильно и по разному звук и т.д.
DSD или FLAC [Сравнение, Инфографика, Объяснение]
DSD и FLAC (реализация PCM) на первый взгляд являются альтернативными форматами. Но разница между ними меньше чем принято считать (читайте подробности здесь и здесь). Прочтите и посмотрите видео о ключевых характеристиках и сравнении DSD vs FLAC.
Конвертация HD аудио файлов
Сравнение DSD vs FLAC
1. Что такое DSD и FLAC
DSD может быть сохранен в DoP формате (DSD over PCM) внутри файла-контейнера lossless PCM (FLAC, WAV, AIFF и пр.).
DSD имеет реализации: DSF, DFF, SACD оптический диск, SACD ISO файл (образ оптического диска SACD), DoP.
2. Модуляция
3. Битовое разрешение
Битовое разрешение DSD, как правило, сокращено до 1 бит. Но это может прривести к очень значительным шумам квантования и низкому соотношению сигнал/шум (качество звука). Для улучшения соотношения сигнал/шум, энергия шума выталкивается за слышимый диапазон частот.
Берется часть площади спектра внизу и добавляется к площади верхних частот.
Это похоже на запакованный пакет с водой, лежащий на земле. Если надавить на него с одной стороны, то уровень воды понизится в месте надавливания. А противоположная сторона увеличится в высоту, потому, что вода, не меняя общего объема, выдавится в свободную сторону.
4. Частота дискретизации
При сокращении битового разрешения шум квантования.
Выталкивание шум за звуковой диапазон требует резерва общего частотного диапазона (общей полосы частот). Запас общей полосы может быть увеличен за счет более высокой частоты дискретизации.
5. Полезная полоса аудио
PCM использует всю полосу [sample rate]/2 для передачи полезного сигнала. Некоторая ее часть может быть израсходована на переходную полосу фильтра при ресемплинге или преобразовании из цифровой в аналоговую форму.
Вышеописанный резерв полосы DSD сокращает долю полезной полосы в общей.
6. Сжатие размера файла
DST (Direct Stream Transfer) это метод сжатия размера аудио данных в DSD формате. Он реализован в DFF и SACD ISO файлах. В DSF сжатие размера не предусмотрено.
FLAC формат изначально был создан для уменьшения размера. Существует мнение (без объективных доказательств, известных автору), что вычисления компьютера при расжатии FLAC приводят к дополнительным электрическим помехам, которые ухудшают звук. Для того, чтобы избежать распаковки используется несжатый (uncompressed) FLAC. FLAC используется по причине поддержки метаданных, совместимых со многими устройствами и программами.
FLAC файл-контейнер может содержать MQA-сжатые аудио данные. Такой FLAC может быть проигран без декодирования MQA.
FLAC файл-контейнер содержащий DSD в формате DoP (DSD over PCM), должен быть декодирован соответствующим образом с помощью ЦАП или программного обеспечения или музыкального проигрывателя.
7. Устройство ЦАП (DAC)
Как правило, PCM ЦАП (PCM DAC), предназначенный для проигрывания PCM аудио форматов, включая FLAC, базируется на сигма-дельта модуляторе и демодуляторе. Демодулятором является фильтр низких частот.
DSD ЦАП (DSD DAC) может содержать только этот фильтр.
8. Текстовые метаданные
Текстовые метаданные (исполнитель, альбом, название трека и пр.) содержатся в SACD ISO, DSF, FLAC файлах стандартным образом и достаточно широко поддерживаются. DFF не имеет широко поддерживаемого способа хранения метаданных.
9. Графические метаданные
SACD ISO и DFF не поддерживают графические метаданные (обложка альбома, фото группы и пр.) стандартным образом. FLAC и DSF оба могут содержать по несколько изображений.
10. Разница звучания DSD vs FLAC
Сравнение DSD с FLAC по качеству звука является сложным вопросом. Потому, что на результат влияет множество переменных: запись, программный или аппаратный проигрыватель. И большинство из этих переменных определяются реализацией аппаратуры и программного обеспечения. Поэтому невозможно сказать для любого случая, что будет звучать лучше DSD или FLAC. Необходимо изучать каждый случай отдельно.
Юрий Корзунов Google+ (основатель Audiophile Inventory), 2018