Покажи другим, как я себя слышу


18

Оооо .. Я думал об этом материале. Мы все знаем, что мы звучим не так, как слышим о нашем собственном голосе. Легко узнать, как другие нас слышат, записав себя и послушав это.

А как же наоборот?

Есть ли способ преобразовать наш голос так, чтобы другие могли слышать нас, когда мы воспринимаем наш собственный голос? Я считаю это довольно интересным вопросом. К сожалению, я не смог ничего найти в Интернете после пары поисков в Google. Никто не думал об этом или это невозможно по какой-то причине, которую я не вижу?

Любые выводы по этому вопросу будут оценены :).


5
Вы можете сделать задачу как можно проще: сделайте запись своей речи, которая при прослушивании вами через наушники звучит так же, как ваша речь звучит для вас, когда вы говорите в безэховой камере. Не уверен, как это сделать.
Олли Нимитало,

2
Я просто хотел предложить именно это. Однако действительно ли необходимо исключать влияние комнаты? Направленность вашего голоса как источника звука, безусловно, является фактором, но я думаю, что этот метод, вероятно, будет работать достаточно хорошо, если запись будет производиться в том же месте, где происходит «процедура настройки».
яблочный суп

Ответы:


10

Это не невозможно, но прогулка в парке тоже не будет.

То, что вы пытаетесь сделать, это добавить к голосовому сигналу те вибрации, которые доставляются к уху через кости и не доступны никому другому.

Но это легче сказать, чем сделать точным способом.

Распространение звука в среде очень сильно зависит от его плотности . Звук распространяется со скоростью ~ 1500 м / с в воде и с меньшим рассеиванием, чем в воздухе (~ 340 м / с). Кость плотнее воздуха, поэтому звук должен проходить быстрее через кость. Это означает, что «ваш» звук начинает сначала возбуждать ваши уши, а затем звук, который вы воспринимаете через «нормальный» воздушный канал. В действительности, кость имеет внутреннюю структуру, которая может влиять на то, как различные частоты проходят через нее, но в диапазоне частот, о котором мы говорим, возможно, мы можем рассматривать ее как эквивалентное тело. Это может быть только приблизительно, потому что любая попытка измерения должна быть инвазивной, но также и потому, что слух субъективен.

Слух или восприятие звука являются ОГРОМНЫМ источником трудностей здесь. Само ухо, внешнее ухо (видимая часть), канал и внутренний механизм работают вместе очень сложным образом. Это предмет психоакустики . Одним из примеров этой сложной обработки являются фантомные тона, когда мозг заполняет вещи, которые должны быть там. Сам мозг, возможно, уже разработал способы выделения самогенерируемого сигнала, которые нам пока недоступны.

Но упрощенный ( упрощенный! ) Способ засвидетельствовать разницу между тем, чтобы быть слушателем вашего собственного звука, а не таков:

Запишите короткое и простое слово (например, «Рыбная кость», слово, имеющее как низкие частоты (b, o, n), так и высокие частоты (F, sh, i, e)) с небольшим количеством тишины и проведите его через эквалайзер через ваши наушники. Начните воспроизведение и синхронизируйте свое произнесение слова с записью (что-то вроде «Fishbone ... Fishbone ... Fishbone ...»). Теперь попробуйте поиграть с эквалайзером, пока то, что вы слышите, и то, что вы произносите, не будут достаточно похожи.

На этом этапе настройки эквалайзера будут представлять разницу между звуком и тем, что он воспринимает через вас, и теоретически любая другая речь, проходящая через этот эквалайзер, будет имитировать то, как она поступает к вашим ушам, как если бы вы генерировали ее с помощью источник внутри вашего тела.

Надеюсь это поможет.


1
вероятно, это невозможно из-за индивидуальных различий в восприятии и невозможности количественного определения этой субъективности. Тем не менее, различия могут быть незначительными, например, в случае с каждым произведенным колпачком 1000 мкФ, на самом деле, немного отличается ...
Fat32

1
@ Fat32 Я не мог определиться с невозможностью, потому что технически можно было бы измерить / измерить вклад второго канала, который устанавливается через кости, и с помощью разумных предположений придумать некоторое приближение. Как то, что он чувствует в медицинском состоянии, которое совершенно не похоже на «пациента». Это было бы лучшим приближением, чем просто эквалайзер. Но в момент восприятия, да, сейчас было бы невозможно предложить определенный «фильтр», который трансформировал бы аудиоклип по запросу.
A_A

переформулировано по-другому: учитывая, что один и тот же точный физический стимул создается в улитках двух разных индивидуумов, они (вероятно) услышат два разных восприятия, и то, что они на самом деле слышат (afaik), является личным опытом, закрытым для любого внешнего инквизиции любого рода, но математического ... Как говорится, люди могут общаться акустически, является результатом дискретной природы языка.
Fat32

Большое спасибо! Это было очень информативно и полезно, и в то же время очень разочаровывающе. Я боялся, что структура каждой человеческой кости изменяет звук по-своему ... но я не думал о самом ухе как о другом нарушении. Ну, по крайней мере, их МОЖЕТ существовать определенная функция для каждого человека, которая переводит звук ~ соответственно.
Дунккиндев

@KevinFiegenbaum Спасибо, что сообщили мне об этом. Восприятие является источником большого мышления. Мозг соединяется с реальностью через чувства и создает и подтверждает (или отвергает) модели того, что, вероятно, происходит. Оптические иллюзии - это случаи, когда две «догадки» (модели) соответствуют одному и тому же объяснению, и мозг не может решить, так что он переключается между ними. Все чувства достигают мозга, уже закодированного, и невероятно трудно действительно знать, как они воспринимаются человеком. Лучшее, что мы можем сделать, - это разумное предположение. Всего наилучшего.
A_A

11

Самая практическая попытка, о которой я знаю, это Won and Berger (2005) . Они одновременно записывали вокализации в устье с помощью микрофона и на черепе с помощью самодельного виброметра. Затем они оценили соответствующие передаточные функции с помощью линейного прогнозирующего кодирования и кепстрального сглаживания.


0

Прежде чем разочароваться, позвольте мне предложить вам другой подход.

На мой взгляд, у вас есть две очень разные части: знание эквалайзера (индивидуально для каждого человека) и применение его к определенному сигналу (вашему голосу).

1-я часть: модель внутренней системы слуха человека

Есть профессионалы, которые работают для сбора данных об этом, стандартизации этого процесса и так далее. Afaik, есть усилия по разработке мер и графиков за пределами классической аудиограммы (которая измеряет воздушные и костные сигналы). Некоторые из них являются «тестами на слух» (более субъективными, но также и интересными).

Совместите с этими профессионалами. Если вы следите за их работой, вам просто нужны их результаты. Пусть они делают тяжелую работу. Они знают свою роль, что заняло у них десятки лет исследований. Они продвигаются в знаниях, которые вам нужны. Который является: своего рода аудиограмма, чтобы измерить, как кто-то слышит «внутри». Бьюсь об заклад, они это график. И вам просто нужен этот график.

2 часть: симуляция

Я сделал нечто похожее на то, что вы пытаетесь сделать. Из аудиограммы любого человека вы можете услышать, как он сам. Это делается с помощью ffmpeg. Вы можете проверить это здесь: comomeoyes.com

По сути, вы записываете свой голос, а алгоритм уравнивает его с вашей персонализированной аудиограммой. Таким образом, вы можете ввести аудиограмму человека с потерей слуха и самостоятельно прослушать, как он вас слышит.

Я понимаю, что вы хотели бы сделать то же самое, но с другой аудиограммой, которая моделирует, как внутренняя слуховая система выравнивает звук.

Могу поспорить, что такая аудиограмма уже может существовать, и аудиологи, медики, врачи в области оториноларингологии, исследователи и другие могут обсуждать вопрос о том, какие акустические тесты необходимо выполнить, чтобы получить данные, необходимые для моделирования полезного графика из измерений.

Удачи. Ваша попытка может помочь другим.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.