Почему активные наушники не сбалансированы с плоской частотной характеристикой?

Некоторые наушники являются «активными», с усилителями, встроенными в чашки, и требуют источника питания (обычно батарейки типа ААА).

Затем я вижу, как многие аудиофилы обсуждают частотную характеристику как показатель того, насколько хороши наушники, и они категорически отвергают самые «активные» наушники, такие как Dre Beats Studio.

Однако, с некоторыми операционными усилителями, казалось бы, было бы довольно легко выровнять входной сигнал, предварительно усиленный так, чтобы он мог полностью корректировать частотную характеристику драйвера и, таким образом, производить очень плоский частотный отклик при желании (или нет, такой как басы) повысить или сократить).

Есть ли что-то особенно сложное в этом?

График частотных характеристик http://graphs.headphone.com/graphCompare.php?graphType=0&graphID[]=1383&graphID[]=193&graphID[]=1263&graphID[]=853&scale=20

Например, для Dre Beats Studio (синяя линия), возможно, схема эквалайзера может обеспечить + 3 дБ при 750 Гц, -5 дБ при 1100 Гц, +6,5 дБ @ 1300 Гц, + 5 дБ при 1550 Гц, -4,5 дБ при 8,5 кГц и + 14 дБ @ 15 кГц, с наклонами, настроенными для наилучшего выравнивания частотной характеристики по 0 дБ от 500 Гц до 20 кГц.

audio frequency-response headphones

— Ehryk
источник

Ответы:

Когда вы прикладываете что-то к своему уху, воспроизводя стандартные стереофонические записи, вам не нужна плоская частотная характеристика, потому что связанная с головой функция передачи, которая обычно включается для источника звука намного дальше, выглядит совсем иначе, когда источник находится напротив вашего уха. ,

Позвольте мне процитировать вам пару абзацев из книги :

Из всех компонентов в цепи электроакустической передачи наушники являются самыми противоречивыми. Высокая точность в истинном смысле этого слова, включающая не только тембр, но и пространственную локализацию, больше связана со стереофонией громкоговорителей благодаря хорошо известной локализации наушников внутри наушников. И все же бинауральные записи с фиктивной головкой, которые являются наиболее перспективными для реалистичной высокой точности, предназначены для воспроизведения в наушниках. Даже в период своего расцвета они не нашли места в повседневной записи и вещании. В то время причинами были ненадежная фронтальная локализация, несовместимость с воспроизведением громкоговорителей, а также их склонность к неэстетичности. Поскольку цифровая обработка сигналов (DSP) может регулярно фильтровать с использованием бинауральных передаточных функций, связанных с головкой, HRTF, вспомогательные головки больше не нужны.

Тем не менее, наиболее распространенным применением наушников является подача на них стереосигналов, изначально предназначенных для громкоговорителей. Это поднимает вопрос об идеальной частотной характеристике. Для других устройств в цепи передачи (рис. 14.1), таких как микрофоны, усилители и громкоговорители, обычно целью проекта является плоский отклик с легко определяемыми отклонениями от этого отклика в особых случаях. Громкоговоритель необходим для получения плоского отклика SPL на расстоянии обычно 1 м. SPL в свободном поле в этот момент воспроизводит SPL в месте расположения микрофона в звуковом поле, скажем, записываемого концерта. Прослушивая запись перед LS, голова слушателя искажает SPL линейно с помощью дифракции. Его ушные сигналы больше не показывают плоский ответ. Однако, это не должно касаться производителя громкоговорителей, поскольку это также произошло бы, если бы слушатель присутствовал на живом выступлении. С другой стороны, производитель наушников напрямую занимается производством этих ушных сигналов. Требования, изложенные в стандартах, привели к тому, что наушники с калибровкой в свободном поле, частотная характеристика которых повторяет ушные сигналы для громкоговорителя спереди, а также калибровка диффузного поля, в которой цель состоит в том, чтобы воспроизвести SPL в ухе слушатель звука со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоский отклик напряжения. производитель наушников непосредственно занимается производством этих ушных сигналов. Требования, изложенные в стандартах, привели к тому, что наушники с калибровкой в свободном поле, частотная характеристика которых повторяет ушные сигналы для громкоговорителя спереди, а также калибровка диффузного поля, в которой цель состоит в том, чтобы воспроизвести SPL в ухе слушатель звука со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоский отклик напряжения. производитель наушников непосредственно занимается производством этих ушных сигналов. Требования, изложенные в стандартах, привели к тому, что наушники с калибровкой в свободном поле, частотная характеристика которых повторяет ушные сигналы для громкоговорителя спереди, а также калибровка диффузного поля, в которой цель состоит в том, чтобы воспроизвести SPL в ухе слушатель звука со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоский отклик напряжения. в котором цель состоит в том, чтобы воспроизвести SPL в ухе слушателя для звука, падающего со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоский отклик напряжения. в котором цель состоит в том, чтобы воспроизвести SPL в ухе слушателя для звука, падающего со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоский отклик напряжения.

(a) Реакция в свободном поле. В отсутствие лучшего справочного материала различные международные и другие стандарты установили следующее требование к высококачественным наушникам: частотная характеристика и воспринимаемая громкость для входного моносигнала с постоянным напряжением должны быть примерно такими, чтобы громкоговорителя с плоским откликом перед слушателем в безэховых условиях. Передаточная функция в свободном поле (FF) наушников на заданной частоте (1000 Гц, выбранная в качестве эталона 0 дБ) равна величине в дБ, на которую должен быть усилен сигнал наушников для обеспечения равной громкости. Требуется усреднение по минимальному количеству предметов (обычно восемь). [...] На рисунке 14.76 показано типичное поле допуска.

(b) Реакция на рассеянное поле: в течение 1980-х годов началось движение, которое заменило стандартные требования для свободного поля на другие, где диффузное поле (DF) является эталоном. Как оказалось, он попал в стандарты, но без замены старого. Теперь двое стоят рядом. Неудовлетворенность эталоном FF возникла главным образом из-за величины пика 2 кГц. Он считался ответственным за окраску изображения, поскольку фронтальная локализация не достигается даже для моносигнала. То, как слуховой механизм воспринимает окраску, описывается ассоциативной моделью Тейла (рис. 14.62). Сравнение откликов уха для диффузного поля и свободного поля показано на рис. 14.77. [...] Поскольку субъективный тест на слух - это тот, который имеет значение, Наушники FF до сих пор были скорее исключением, чем правилом. Доступны различные частотные характеристики для удовлетворения индивидуальных предпочтений, и у каждого производителя есть своя философия для наушников с частотными характеристиками, варьирующимися от плоского до свободного поля и выше.

Эта проблема с HRTF также заключается в том, что угловые драйверы (в наушниках) звучат лучше для тех людей, которые продают такие компании, как Sennheiser. Угловые драйверы не полностью делают наушники звучать как динамики, хотя.

На заводе или в лаборатории при измерении частотной характеристики используется искусственное ухо. Нижеследующее является лабораторным уровнем; на заводском уровне немного проще.

Я также нашел методологию, используемую этим сайтом HeadRoom :

Как мы тестируем частотную характеристику: чтобы выполнить этот тест, мы подключаем наушники с последовательностью 200 тонов при том же напряжении и постоянно увеличивающейся частоте. Затем мы измеряем выход на каждой частоте через уши высокоспециализированного (и дорогого!) Микрофона Head Acoustics. После этого мы применяем кривую коррекции звука, которая удаляет передаточную функцию, связанную с головой, и точно выводит данные для отображения.

Используется, вероятно, этот микрофон . Кажется, что они фактически инвертируют передаточную функцию фиктивной головы / ушей с помощью программного обеспечения, потому что прямо перед этим они говорят: «Теоретически, этот график должен быть плоской линией при 0 дБ.» ... но я не совсем уверен, что они делают ... потому что после этого они говорят: «Наушники с« естественным звучанием »должны быть немного выше в низких частотах (около 3 или 4 дБ) между 40 Гц и 500 Гц». и «Наушники также должны быть спущены на высоких частотах, чтобы компенсировать то, что драйверы находятся так близко к уху; плавная наклонная плоская линия от 1 кГц до 8-10 дБ вниз при 20 кГц - это примерно то, что нужно». Который не совсем компилируется для меня в связи с их предыдущим утверждением об инвертировании / удалении HRTF.

Глядя на некоторые сертификаты , полученные от производителя (Sennheiser) для модели наушников (HD800), использованной в этом примере HeadRoom, кажется, что HeadRoom отображает данные без какой-либо предполагаемой модели коррекции для самих наушников (что объясняет, почему они дают последующие предложения по интерпретации, поэтому их первоначальное «плоское» предложение вводит в заблуждение), тогда как Sennheiser использует коррекцию DF (диффузное поле), поэтому их графики выглядят почти плоскими.

Хотя это только предположение, различия в измерительном оборудовании (и / или между образцами наушников) вполне могут объяснить эти различия, поскольку они не так велики.

В любом случае, это область активных и постоянных исследований (как вы, вероятно, догадались из последних цитат, приведенных выше о DF). Некоторые исследователи HK сделали довольно много этого; У меня нет (бесплатного) доступа к их документам AES, но некоторые довольно обширные резюме можно прочитать в блоге innerfidelity 2013 , 2014, а также по ссылкам из основного блога автора HK, Sean Olive ; в качестве ярлыка, вот несколько бесплатных слайдов из их последней (ноябрь 2015 г.) презентации, найденной там. Это довольно много материала ... Я только кратко расскажу об этом, но, похоже, тема в том, что DF недостаточно хорош.

Вот пара интересных слайдов из одной из их предыдущих презентаций . Во-первых, полная частотная характеристика (не усеченная до 12 кГц) HD800 и на более четко раскрытом оборудовании:

И, возможно, наибольший интерес для OP, звучание басов Beats не так уж и привлекательно, по сравнению с наушниками, которые стоят в четыре-шесть раз дороже.

— шипение
источник

Я не согласен с вашей книгой, в которой говорится: «И все же бинауральные записи с фиктивной головкой, которые являются наиболее многообещающими для реалистичной высокой точности, предназначены для воспроизведения в наушниках. Даже в период своего расцвета они не нашли места в обычной записи и вещания «. Каждое живое телевизионное спортивное мероприятие, над которым я работал, использует микрофонный массив «голофон» для захвата окружающего звука для использования в микшировании объемного звука. www.holophone.com

— Дуэйн Рид

@DwayneReid: интересно. Конечная цель этих записывающих наушников, хотя, или это 5.1 или 7.1 с динамиками? Существует также технология, позволяющая микшировать 5.1 / 7.1 на наушники, но я не стал вдаваться в подробности.

— Fizz

Что ж, продукт, рекламируемый на их главной странице, говорит, что «это единственный запатентованный микрофон, специально разработанный для захвата дискретных 7.1 каналов объемного звука», поэтому «невероятно реалистичное воспроизведение трехмерного звука через динамики или стереонаушники», вероятно, использует метод понижающего микширования ( из 7.1) для наушников.

— Fizz

Спасибо, этот ответ был действительно информативным. Правильно ли я резюмирую, чтобы сказать: частотная характеристика наушников пытается эмулировать искажение, которое будет создаваться от фронтального аудиоисточника, распространяющегося вокруг вашего лица и в ваши ушные каналы, и идеально ровная частотная характеристика будет звучать «неестественно»?

— Эрик

Все еще немного неясно, что если они применяют обратное преобразование, то целью снова будет плоская линия 0 дБ по всему частотному спектру, которая в теории может быть вставлена через эквалайзер (в идеале, с предварительным усилением). Любые мысли о том, почему активные производители наушников не делают этого, чтобы иметь кривую пост-искажения на уровне 0 дБ, или, возможно, продают с ними специальные усилители для наушников, которые применяют этот эквалайзер, как Sennheiser Orpheus, но, возможно, менее чем за 30 тысяч долларов ? Они , казалось бы , быть идеальные наушники тогда ...

— Ehryk

Простой ответ заключается в том, что система с плоской частотной характеристикой, построенная с операционными усилителями для коррекции реакции драйвера, обязательно будет иметь очень неплоскую фазовую характеристику в полосе пропускания. Эта неплоскостность означает, что частотные составляющие переходных звуков становятся неравномерно задержанными, что приводит к тонким переходным искажениям, которые мешают правильному распознаванию звуковых компонентов, что означает, что можно различить меньшее количество отдельных звуков.

Следовательно, это звучит ужасно. Как будто весь звук исходит от нечеткого шара, сосредоточенного точно между ушами.

Проблема HRTF в ответе выше - только часть этого - другая в том, что реализуемая схема аналоговой области может иметь только каузальную временную характеристику, и для правильного исправления драйвера нужен акаузальный фильтр.

Это может быть аппроксимировано в цифровом виде с помощью фильтра Finite Impulse Response с согласованным драйвером, но для этого требуется небольшая задержка по времени, которая достаточна для того, чтобы фильмы были очень несинхронными.

И по-прежнему звучит так, будто он исходит из вашей головы, если только HRTF также не добавлен обратно.

Так что все не так просто.

Чтобы создать «прозрачную» систему, вам не нужна просто полоса пропускания в диапазоне человеческого слуха, вам также нужна линейная фаза - график задержки плоской группы - и есть некоторые свидетельства того, что эта линейная фаза нуждается продолжать до удивительно высокой частоты, чтобы сигналы направления не терялись.

Это легко проверить экспериментально: откройте файл .wav с какой-либо музыкой, с которой вы знакомы, в редакторе звуковых файлов, например Audacity или snd, и удалите один сэмпл 44100 Гц только из одного канала, а затем перенастройте другой канал так, чтобы первый сэмпл теперь происходит со вторым отредактированным каналом и воспроизводит его.

Вы услышите очень заметную разницу, даже если разница составляет всего 1/4100 секунды.

Примите во внимание следующее: звук идет со скоростью 340 мм / мс, поэтому при 20 кГц это временная ошибка плюс минус одна задержка выборки или 50 микросекунд. Это 17 мм прохождения звука, но вы можете услышать разницу с отсутствующими 22,67 микросекундами, что составляет всего 7,7 мм прохождения звука.

Абсолютное ограничение человеческого слуха обычно считается около 20 кГц, так что же происходит?

Ответ заключается в том, что тесты слуха проводятся с тестовыми сигналами, которые в основном состоят только из одной частоты за раз, в течение достаточно длительного времени в каждой части теста. Но наши внутренние уши состоят из физической структуры, которая выполняет своего рода БПФ, воздействуя на нейроны, так что нейроны в разных положениях соотносятся с разными частотами.

Отдельные нейроны могут перезапускать только так быстро, поэтому в некоторых случаях некоторые из них используются один за другим, чтобы не отставать ... но это работает только примерно до 4 кГц или около того ... Что именно там, где наши Восприятие тона заканчивается. И все же в мозгу нет ничего, что могло бы остановить запуск нейрона в любое время, когда он чувствовал себя таким склонным, так какая же самая высокая частота имеет значение?

Дело в том, что крошечная разность фаз между ушами ощутима, но вместо того, чтобы изменить способ идентификации звуков (по их спектрографической структуре), он влияет на то, как мы воспринимаем их направление. (что и HRTF тоже меняет!) Даже если кажется, что его нужно «выкатить» из нашего диапазона слуха.

Ответ заключается в том, что точка -3 дБ или даже -10 дБ все еще слишком низка - вам нужно приблизиться к точке -80 дБ, чтобы получить все это. И если вы хотите обрабатывать как громкий, так и тихий звук, то вам нужно быть на хорошем уровне до уровня -100 дБ. Который тест на прослушивание одного тона вряд ли когда-либо увидит, в основном потому, что такие частоты «считаются» только тогда, когда они входят в фазу с другими гармониками как часть резкого переходного звука - их энергия в этом случае складывается вместе, достигая достаточной концентрации вызвать нейронный отклик, даже если отдельные частотные компоненты в отдельности могут быть слишком малы для подсчета.

Другая проблема заключается в том, что мы постоянно подвергаемся бомбардировке многими источниками ультразвукового шума, вероятно, большей частью из-за сломанных нейронов в наших собственных внутренних ушах, поврежденных чрезмерным уровнем звука в какой-то предшествующий момент в нашей жизни. Было бы трудно различить изолированный выходной тон теста прослушивания по такому громкому «локальному» шуму!

Поэтому для этого требуется, чтобы «прозрачная» конструкция системы использовала гораздо более высокую частоту нижних частот, чтобы у системы было пространство для затухания нижних частот (со своей собственной фазовой модуляцией, к которой ваш мозг уже «откалиброван») перед системой фазовая модуляция начинает изменять форму переходных процессов и перемещать их во времени так, чтобы мозг больше не мог распознать, к какому звуку они принадлежат.

С наушниками гораздо проще просто сконструировать их так, чтобы они имели единый широкополосный драйвер с достаточной пропускной способностью и полагались на очень высокую частоту собственных частот «нескорректированного» драйвера для предотвращения временных искажений. Это намного лучше работает с наушниками, так как небольшая масса водителя хорошо подходит для этого условия.

Причина необходимости фазовой линейности глубоко укоренена в дуальности частотной области во временной области, а также является причиной того, что вы не можете создать фильтр с нулевой задержкой, который может «идеально исправить» любую реальную физическую систему.

Причина в том, что важна «линейность фаз», а не «плоскостность фаз», потому что общий наклон фазовой кривой не имеет значения - по дуальности любой наклон фазы просто эквивалентен постоянной временной задержке.

Внешнее ухо каждого человека имеет различную форму и, следовательно, другую передаточную функцию, возникающую на немного разных частотах. Ваш мозг привык к тому, что он имеет, со своими собственными отчетливыми резонансами. Если вы используете неправильный, на самом деле он будет звучать только хуже, так как исправления, которые использует ваш мозг, больше не будут соответствовать исправлениям в передаточной функции наушников, и у вас будет что-то хуже, чем отсутствие подавления резонанса - у вас будет вдвое больше несбалансированных полюсов / нулей, которые загромождают вашу фазовую задержку, и полностью искажают ваши групповые задержки и время прибытия компонентов.

Это будет звучать очень неясно, и вы не сможете разобрать пространственное изображение, закодированное в записи.

Если вы проводите слепое тестирование на прослушивание A / B, каждый выберет неисправленные наушники, которые, по крайней мере, не влияют на задержку группы так сильно, чтобы их мозг мог перенастроить себя на них.

И именно поэтому активные наушники не пытаются выровнять. Это слишком сложно, чтобы получить право.

Именно поэтому цифровая коррекция помещений является нишей, в которой она находится: потому что ее правильное использование требует частых измерений, которые трудно / невозможно провести вживую и о которых потребители обычно не хотят знать.

Главным образом потому, что акустические резонансы в исправляемой комнате, которые в основном являются частью низкочастотного отклика, продолжают слегка изменяться, когда давление воздуха, температура и влажность все меняются, таким образом слегка изменяя скорость звука, тем самым изменяя резонансы по сравнению с тем, что они были, когда измерение было сделано.

— RGD2
источник

Фильтрация в F domian действительно вызывает искажение фазы. Для компенсации этого можно использовать выравнивание фазы всех проходов. В теории цифровой или аналоговый могут иметь хорошую фазу. Цифровая технология в наши дни обеспечивает лучшую гибкость.

— Аутист

Ах, спасибо. Это дает понять, почему это не делается в активных наушниках, которые передают аналоговый сигнал (проводные наушники). Это, по-видимому, оставляет открытой возможность для регулировки уровней в реальном времени без фазовых искажений ни в цифровой форме на источнике (например, на компьютере или телефоне), ни в цифровой форме на беспроводных наушниках без какой-либо задержки; это все еще открыто как возможность для «абсолютно плоского» (после HRTF) ответа?

— Эрик

Должна быть некоторая задержка. В противном случае вам буквально понадобится машина времени, поскольку единственный способ исправить фазу реальной (причинной) системы без добавления задержки - это использовать фильтр с точно обращенным антикаузальным временным откликом. И это означает, что ему обязательно нужно знать «будущее» сигнала, прежде чем он приземлится в момент времени = 0.

— RGD2

-1

Интересная статья и обсуждение. Мы склонны думать, что теорема Найквиста - это правило, которое применяется везде, и затем мы обнаруживаем, что это не так. Вы измеряете предел человеческого слуха до 20 кГц, используя синусоидальные волны, а затем производите выборку на частоте 44,1 или 48 кГц с уверенностью, что вы захватили все, что слышит ухо. Тем не менее, смещение одного канала на одну выборку вызывает существенные изменения, хотя разница во времени превышает 20 кГц.

В движущихся изображениях мы думаем, что глаз объединяет изображения с частотой кадров выше 20 кадров в секунду. Таким образом, фильм снимается со скоростью 24 кадра в секунду и воспроизводится с 2-кратным затвором для уменьшения мерцания (48 кадров в секунду); Частота кадров 50 или 60 Гц в зависимости от региона. Некоторые из нас могут видеть частоту кадров 50 Гц, особенно если мы выросли на 60 Гц. Но вот где это интересно. В течение последних нескольких лет на конференциях Tech Retreat и SMPTE в Голливудской профессиональной ассоциации было показано, что среднестатистический зритель видит значительное улучшение качества при увеличении исходного кадра с 60 до 120 Гц. Еще более удивительно, что те же зрители увидели аналогичное улучшение при увеличении частоты кадров со 120 до 240 Гц. Найквист сказал бы нам, что если мы не можем видеть частоту кадров в 24, нам нужно только удвоить частоту кадров, чтобы гарантировать захват всего, что может разрешить глаз; все же здесь мы находимся в 10x частоте кадров и все еще наблюдаем заметные различия.

Очевидно, что здесь происходит больше. В случае визуализации движения движение на изображении влияет на требуемую частоту кадров. А в аудио я бы ожидал, что сложность и плотность звукового ландшафта определяют необходимое разрешение звука. Все эти звуки зависят в большей степени от их фазовой когерентности, чем от частотной характеристики, чтобы обеспечить артикуляцию, необходимую для формирования изображения.

— Питер Уортон
источник

Я не могу найти здесь ничего, что отвечает на вопрос. Как соотносятся частота дискретизации и теорема выборки Найквиста с эквалайзером наушников?

— труба

У людей нет АЦП. Человеческий слух / зрение ничего не «пробует», он использует нейроны, которые являются своего рода сочетанием аналогового и цифрового и практически непрерывны. Ухо имеет физическую отсечку. Зрительное восприятие также ограничено тем, насколько быстро мозг может обрабатывать информацию.

— Пик напряжения