Есть ли математические преимущества для более высокой частоты дискретизации?


18

Учитывая, что большинство людей не могут слышать так много частот выше 20 кГц, я никогда не понимал точных аргументов в пользу использования частот дискретизации выше 48 кГц. На частоте 48 кГц я понимаю, что проще создать фильтр нижних частот с чуть более высокой пропускной способностью для удаления псевдонимов, но я не понимаю, почему кто-то захочет записывать на частоте 96 кГц.

Для проектов, которые являются строго цифровыми, то есть с использованием чисто цифрового синтеза и без записи какого-либо материала, который будет преобразован из аналогового в цифровой, есть ли преимущество в использовании частот дискретизации выше 44,1 кГц?

Для всего остального, есть ли польза от использования 96 кГц? Является ли это полезным при применении какого-то определенного типа операции DSP позже? Или это чисто плацебо-эффект для уха?

Примечание: здесь есть и другие вопросы, спрашивающие о том, какую частоту дискретизации использовать для различных типов проектов записи, но здесь я спрашиваю реальные, неопровержимые факты по любым математическим причинам или причинам, связанным с DSP, поддерживающим использование более высокой частоты дискретизации.

Ответы:


19

Я всегда использую двойную частоту дискретизации, если это возможно, по двум важным причинам.

Первая причина: избавиться от характеристик антиизображающего фильтра при работе с аналоговыми источниками звука. Что такое антиизображающий фильтр?

Допустим, я записываю на 44100 Гц.
Если бы я записал синусоидальную волну менее 10 кГц, вы могли бы четко увидеть синусоидальную волну при построении значений выборки на графике.
Если я сэмплирую синусоидальную волну 0 дБ FS с частотой 22,5 кГц, то выборки поочередно показывают 1 и -1.

Теперь вот проблема. Если я записываю синусоидальную волну 0 дБ FS с частотой 30 кГц и строю графики выборок, каждая выборка занимает более половины синусоидального периода, и - если вы воспроизведете выборки - она ​​вернет синусоиду 11 кГц. (Если вы мне не верите, просто сделайте простой рисунок.) Это поведение называется «эффектом изображения».

Это означает, что перед дискретизацией сигнала мы должны быть уверены, что НЕТ частот присутствует выше так называемой «частоты Найквиста» (которая составляет половину частоты дискретизации). При использовании цифровых источников звука, которые уже воспроизводят свои звуки, это не так уж и сложно, поскольку их иногда можно просто запрограммировать так, чтобы они никогда не генерировали сигнал, превышающий половину частоты дискретизации, или же они могут отфильтровать все, используя линейную фазу Фильтр BrickWall, который не влияет на остальные.

Но если вы производите выборку сигнала из аналогового источника, эта фильтрация выполняется до того, как сигнал будет выбран. Единственный способ фильтрации аналогового звука - использование электронной схемы. А поскольку предполагается, что фильтр имеет очень крутой изгиб, он будет влиять на частоты в пределах слышимого диапазона , даже если фильтр не предназначен для этого. Теперь в аналого-цифровых преобразователях есть несколько хороших фильтров, поэтому проблема минимальна, но слушать ее становится несколько раздражающе, когда вы несколько дней работаете над звуком с частотой 44,1 кГц, по сравнению с использованием 96 кГц. Фильтр, который будет применен, когда вы уменьшите выборку 96 до 44.1, конечно, является цифровым фильтром и, вероятно, имеет гораздо лучшее качество. И он применяется только тогда, когда вы полностью выполнили всю работу, поэтому он не будет беспокоить вас.

Вторая причина: избавиться от характеристик сглаживания сигнала.

Когда вы записываете с разрешением 24 бита и планируете использовать мастер в 16 битах, вам потребуется сигнал сглаживания, чтобы скрыть ошибки округления. Теперь шум не очень приятен в вашей записи, и хотя широкополосный шум лучше всего подходит для маскировки ошибок округления, формирование шума может быть большим улучшением, применяемым к сглаживающему сигналу, чтобы сделать его менее тревожным. Теперь, если запись была сделана с использованием 96 кГц, вы можете формировать шум от большей части сглаживающего сигнала до частот выше 24 кГц, поэтому никто не услышит их. В конце записи сглаживающий шум окончательно отфильтровывается, в тот момент, когда вы понижаете частоту своего проекта до 44,1 кГц.

Итак, суть: это полезно при записи аналогового материала:

  • Да, безусловно. У вас меньше помех от фильтра анти-изображений и меньше помех от сигнала сглаживания при использовании с надлежащим формированием шума.

Это полезно при работе с цифровыми вещами, которые пришли прямо из моего софтина?

  • Да, все еще полезно, если вы планируете работать с 24 битами, а мастеринг до 16 бит. Вы можете получить большую выгоду от шума, формирующего сглаживающий сигнал.

« так как они иногда могут быть просто запрограммированы никогда не генерировать сигнал выше половины частоты дискретизации» Определенно верно, однако: «или они могут фильтровать все с использованием BrickWall фильтра с линейной ФЧХ , который не имеет никакого влияния на остальных» Я не уверен, что это возможно. Для того чтобы отфильтровать ультразвук от волны, генерируемой цифровым способом, вам, в первую очередь, необходимо генерировать его с более высокой частотой дискретизации (который по-прежнему будет псевдонимом, но не так сильно в звуковом диапазоне). Вы не можете фильтровать частоты, которые уже являются псевдонимами.
эндолит

3
«Теперь, если запись была сделана с использованием 96 кГц, вы можете формировать шум большей части сигнала дизеринга на частотах выше 24 кГц, чтобы их никто не услышал. Шум дизеринга в конце записи окончательно отфильтровывается, в тот момент, когда вы уменьшаете частоту дискретизации. ваш проект обратно на 44,1 кГц. " Я тоже не думаю, что это правильно. Если вы отфильтровываете все дизеринг, то ваш вывод больше не будет дизеринг? Это вернется к искажению квантования?
эндолит

Re первый комментарий: Вы абсолютно правы. Я думаю, что я хотел сказать, что когда вы используете цифровой эффект, вы можете ожидать, что позаботится о частотном диапазоне его выхода. Скажем так: если выход выходит с псевдонимом, повышение частоты дискретизации не изменит этого. Что касается вашего второго комментария: интересно; это полностью зависит от фильтров, использованных перед понижающей дискретизацией. Если бы шум воспроизводился обратно, он, очевидно, маскировал бы шум квантования, но он не звучал бы точно так же. Я думаю, что я бы сформировал свой шум вокруг последней частоты Найквиста.
Pellmeister

1
Определенные виды операций могут превращать частотные компоненты выше 24 кГц в частотные компоненты ниже 20 кГц и наоборот. Если между первой и последней такими операциями звук не поддерживается с более высокой частотой дискретизации, потеря информации на промежуточных ступенях может иметь слышимый эффект на конечном выходе.
суперкат

12

Для проектов, которые являются строго цифровыми, то есть с использованием чисто цифрового синтеза и без записи какого-либо материала, который будет преобразован из аналогового в цифровой, есть ли преимущество в использовании частот дискретизации выше 44,1 кГц?

Да. Несколько примеров:

Создание частот, которые вы не хотите

Псевдоним из цифрового синтеза

Многие квадратные / пилообразные / треугольные волновые генераторы написаны наивно, так как они генерируют бесконечное количество гармоник, которые имеют псевдонимы и звучат явно плохо . ( ..., +1, +1, +1, +1, −1, −1, −1, −1, ...Это не правильный меандр, и Гармоника будет производить радио звуков настройки в фоновом режиме во время портаменто.)

Если частота сэмплирования выше, этот эффект уменьшается, потому что частота алиасинга находится дальше от звукового диапазона.

Конечно, было бы лучше, если бы генератор был написан так, чтобы полностью исключить псевдонимы , но вы не всегда можете контролировать это как пользователь. Даже хорошо написанные из них, как правило, являются компромиссами с «уменьшенным» псевдонимом , не полностью ограниченным по полосе, поэтому более высокая частота дискретизации все же помогает.

Псевдоним от цифрового искажения

Точно так же, когда вы используете любой вид цифровых нелинейных искажений, он производит бесконечное число гармоник или продуктов интермодуляции . Те, которые были бы произведены выше частоты Найквиста, фактически возвращаются в звуковой диапазон.

Хотя теоретически возможно искажать в ограниченном диапазоне , для плагин-кодеров это не принято. Каждый плагин искажения гитары, который я тестировал, имеет псевдонимы, даже обработку на 96 кГц.

Я не уверен, насколько большая проблема это практически. Многие вещи вызывают небольшие искажения, такие как компрессор или уменьшение объема, но их количество уже ничтожно мало, поэтому значение псевдонима еще более незначительно. Для сильных искажений, частоты с псевдонимами также могут быть незаметны, потому что они погружены в шум. Несмотря на это, более высокая частота дискретизации поможет минимизировать любые вредные воздействия.

Недостаток частот, которые вы хотите

Другая возможная проблема заключается в том, что синтезированные ультразвуковые частоты могут оказаться полезными позже при обработке, даже если вы не можете услышать их непосредственно в записи:

Сдвиг частоты от временных изменений

Если вы повторно сэмплируете волну, чтобы замедлить ее, например, в проигрывателе звуковых шрифтов, эти ультразвуковые частоты станут слышимыми частотами. Если бы вы отфильтровали их, чтобы избежать наложения на более низкую частоту дискретизации, в замедленном звуке отсутствовал бы верхний предел.

Искажение / Modulation

Как было сказано ранее, искажение создаст новые частоты интермодуляции в точках сумм и различий от частот в исходной записи. На этот раз мы обеспокоены желаемыми слышимыми частотами, создаваемыми искажением / модуляцией ультразвуковых частот (не связанных с наложением). Если эти ультразвуковые частоты отсутствуют в записи до искажения, на выходе будут отсутствовать слышимые частоты, которые они производят, и он не будет точно имитировать эквивалентный аналоговый эффект.

Опять же, я не уверен, что это практически проблема, но это, по крайней мере, правдоподобно, и более высокие частоты дискретизации, которые включают ультразвук, улучшат это.

В целом, работа с более высокой частотой дискретизации дает «запас» для предотвращения проблем с эффектами и тому подобным, что может быть неправильно реализовано. Как и фотокопирование фотокопии, чем лучше качество каждой копии, тем меньше будет ухудшение качества конечного продукта.

Бесполезно для воспроизведения

Это не означает, что более высокие частоты дискретизации являются хорошей идеей для воспроизведения готового микса. Они не. Как описано выше, искажение ультразвука может создавать слышимый звук, а громкоговорители - наименее линейная вещь в звуковой цепочке, поэтому вы хотите исключить любой ультразвук из окончательного микса, чтобы предотвратить его искажение динамиком.

Там нет никакой выгоды для более высокой частоты дискретизации для воспроизведения музыки; они должны использоваться только на этапах записи и обработки. Смотрите 24/192 Music Downloads ... и почему они не имеют смысла .


1
+1 за упоминание неправильных генераторов прямоугольных волн. Также то же самое можно сказать и о волнах пилообразных и треугольных ...
Отображаемое имя

Цифровое повышение частоты дискретизации до 96 кГц или выше часто помогает при воспроизведении, поскольку выходной аудиосигнал может быть легко освобожден от любого нежелательного контента в диапазоне от 22 кГц до 48 кГц. Построить аналоговый фильтр, чтобы убить что-то около 48 кГц, не повредив что-либо ниже 22 кГц, гораздо проще, чем построить один, пока все не убьет свыше 26 кГц, не повредив что-либо ниже 22 кГц. Если аудио будет преобразовано в 96 кГц для воспроизведения, а у одного - 96 кГц, можно также сохранить его на 96 кГц, а не преобразовывать с понижением частоты и повышающим преобразованием.
суперкат

@supercat Это для записи, а не для воспроизведения. Легко сделать супер крутой цифровой фильтр, чтобы удалить все выше 20 кГц перед воспроизведением. Создание аналогового фильтра для удаления ультразвука перед сэмплированием сложно / дорого, поэтому АЦП используют передискретизацию с гораздо более высокими частотами (МГц), а затем используют цифровые фильтры для удаления ультразвука и преобразования обратно в нормальную частоту, такую ​​как 96 кГц.
эндолит

5

Наличие запаса для эффектов является теоретически (и практически) обоснованной причиной для того, чтобы иметь более высокую частоту дискретизации, чем в два раза больше предела слуха человека.

Причину этого легко визуализировать, сравнивая с редактированием изображения - если у вас есть, скажем, изображение размером 800x600 пикселей с общим кадром из высококонтрастной кирпичной стены, ажурной сетки, полосатой ткани или другой тонко расположенной высококонтрастной текстуры, вы можете повернуть только в 45 ° кратно, не вызывая эффекта муара и не размывая детали. В случае звука искажения, возникающие при редактировании, имеют разные термины, но применяются те же принципы теоремы выборки Найквиста-Шеннона. Псевдоним - более часто используемый термин, чем «эффект изображения», для случая, когда дискретизированный звук имеет частотное содержание, превышающее половину частоты дискретизации (называемой частотой Найквиста).

На практике, как уже объяснял Pelle ten Cate, фильтр нижних частот кирпичной стены недостижим, но всегда есть некоторый градиент (наклон) на обрезанном участке.

Другой хорошей причиной для записи с более высокой частотой дискретизации является достижение более точного стереоизображения, поскольку человеческий слух в значительной степени зависит от небольших временных различий (около 5-20 мс, и физически это разность фаз) между ушами для локализации источников звука. Головы "тень" и другие аспекты также играют роль.

При частоте дискретизации аудио CD 44100 Гц каждая выборка представляет 22,6 микросекунды, и, например, один период с частотой 882 Гц имеет 50 выборок. Кроме того, довольно длительная задержка в 20 мс длится 50 выборок. Таким образом, только 25 сэмплов на этой средней частоте означают фазовое подавление на 180 °.

Таким образом, частота дискретизации 44,1 кГц достаточно хороша, но не имеет большого запаса для редактирования.

Еще одна вещь, которую следует иметь в виду, это использовать дизеринг (как при редактировании изображений), чтобы предотвратить шум квантования. И затем вы спросите, должен ли я использовать 24-битное квантование вместо 16-битных ...?


Было ли показано, что ультразвук все еще влияет на наше стерео восприятие, даже если мы не можем его сознательно слышать?
эндолит

1
Нет, влияние межстраничных временных различий на стереоизображение больше всего влияет на низкие частоты (ниже 1500 Гц), где расстояние между ушами меньше длины волны, поэтому существует разность фаз. На более высоких частотах разница в уровне звука оказывает большее влияние на локализацию звука. См .: en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil

4

Еще одна веская причина использовать более высокую частоту дискретизации - это обойти недостатки реализации плагинов. Многие разработчики плагинов не учитывают должным образом эффекты расширения полосы пропускания нелинейных сигнальных операций, и в результате вы можете получить эффекты сглаживания, прежде чем покинуть окно.

Например, компрессор - это в основном усилитель, управляемый напряжением ... он умножает один сигнал (аудиосигнал) на другой сигнал (усиление). Умножение 2 сигналов также известно как кольцевая модуляция или гетеродинирование; он производит сигналы суммы и разности двух входов. Если вы умножите синус 15 кГц на синус 10 кГц, вы получите выходной сигнал с компонентами 5 кГц и 25 кГц. Если усиление вашего компрессора имеет очень быструю атаку, а входной сигнал имеет широкую полосу пропускания, компонентный сигнал «сумма» может легко превысить предел Fs / 2 на временной основе, что приведет к ложному низкочастотному нежелательному мусору на вашем выходе сигнал.

Реальное исправление для этого заключается в том, чтобы плагин был реализован с использованием внутренней передискретизации, но если вы не можете этого добиться, следующая лучшая вещь - это запустить систему с максимально высоким Fs, как вы можете. У вас не будет никакого реального аудиосодержимого в стратосфере, но вы защищены от того, что какой-то плагин вылетит за границу.


2

Что бы это ни стоило, математическое обоснование, по крайней мере, для потребностей звукового мира, обычно описывается теоремой отсчетов Найквиста-Шеннона , которую иногда называют теоремой Найквиста, которая в базовом языке просто утверждает, что для полного воспроизведения Осциллограмма с максимальной частотой n Гц, вам нужно 2n выборок в секунду.


1
Да, но Найквист-Шеннон использует фильтры из кирпичной стены, которые физически невозможны.
эндолит

1

Я считаю, что при записи с несколькими дорожками глубина в битах важнее частоты дискретизации.

Так, например, 24 бит будет лучше, чем 16 бит. Это связано с тем, как ваши треки смешиваются вместе, и с тем, что называется «ошибками округления», когда недостаточно битов.

Большинство аппаратного и программного обеспечения теперь могут легко поддерживать 96k и 24-битные, так что нет реальной необходимости соглашаться на меньшее.

Тем не менее, очевидно, что вы можете сделать высококачественную запись, используя старое оборудование 16 / 44.1.

Это больше о таланте, чем об оборудовании.


2
Хотя это не так, работа с 24 битами создает недостаток, заключающийся в том, что вы должны использовать дизеринг, если хотите вернуться к 16 битам. Сглаживающий шум может быть значительно уменьшен при применении к сигналу 96 кГц при использовании формирования шума. (подробности см. в другом ответе)
Pellmeister

1
Все профессиональное аудио программное обеспечение работает с 32- или 64-битной плавающей запятой внутри во время микширования, независимо от битовой глубины, используемой во время записи.
оставил около

3
@PelletenCate, если вы работаете с 16 битами, вы уже ввернуты, потому что вы добавляете шум квантования на каждом нетривиальном этапе редактирования. Это очень неправильно, подразумевать, что работа с 24 или более битами имеет такой недостаток.
Отображаемое имя

Я добавил +1 Я не должен описывать это как недостаток, потому что это не так. Тем не менее, я должен сказать, что на миксе 44/16 слышны как квантованный шум, так и несформированный шум размывания. Моя точка зрения заключается в том, что, переключаясь на 24 бита, вы даете себе возможность заменить одну проблему (шум квантования) на другую (шум размывания), который можно эффективно уменьшить путем записи с более высокой частотой дискретизации.
Pellmeister

0

«... реальные, неопровержимые факты по любым математическим или цифровым причинам, поддерживающим использование более высоких частот дискретизации».

Так называемые реальные факты исходят от настоящих аудиоинженеров, здесь есть возможность найти несколько фактов, но, скорее всего, поиск в Интернете статей, написанных настоящими инженерами, будет быстрее. Запрашиваемая здесь означает, что вы согласны с нами, я не аудио инженер, но я могу использовать инструменты поиска.

Что-то, чтобы рассмотреть, является Вашим уровнем шума. В других ответах упоминается, как вы можете добавить шум, и упоминается сглаживание и ошибка квантования, но самым близким к любому другому ответу было упоминание минимального уровня: «... псевдонимы могут также быть незаметны, поскольку они погружены в шум. ».

Если вы записываете на строительной площадке, на вокзале или на верфи, вы можете быть дешевыми и записывать на 44.1, если вы не стремитесь к совершенству - в противном случае, например, видео - 4: 2: 2, а не 4: 2: 0, поэтому Аудио больше битов, но не более 32 (для ВАС, для внутреннего использования в Программном обеспечении более 32) и с более высокой частотой дискретизации, но не более 96 кГц (опять же, для вас, для внутреннего использования используется Программное и аппаратное обеспечение, которое работает с более высокой частотой дискретизации).

Попробуйте эти статьи, чтобы начать поиск совета инженера - вы не посетите юридическую консультацию. stackexchange для критической информации, так что учитесь учиться, в конечном итоге это то, насколько вы заботитесь, сколько заботит ваша аудитория, ваш уровень квалификации и что вы можете себе позволить.

Почему 88,2 - http://www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

Почему 24/96? - http://www.premiersoundfactory.com/modules/pico/content0035.html

Много мест в Интернете, в том числе бесплатные онлайн-курсы.

Короткая версия - да, есть причина, и это сложный факт - не бросайте ошибки в начале и надейтесь на их устранение позже, вы не захотите, чтобы кто-то говорил, пока вы пытаетесь записать, или незнакомых людей, проходящих через Shot - все же есть видео, в которых есть и то, и другое.

Хак, который нужно запомнить, - записывать громко, не стесняясь, с такими высокими показателями, которые вы можете себе позволить (время, место для хранения, навык, деньги и тип ввода (IE: Construction Site), аудитория), и отбирайте самые тихие нюансы с помощью Noise Removal, чтобы избавиться от паршивое квантование и смутный шум (который вы, возможно, никогда не замечали, пока мы не упомянули об этом).

[Написано с намерением быть простым ответом без фактических ошибок и не предназначено для оскорбления поклонников аудио или профессиональных аудиоинженеров]

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.