Вопросы с тегом «audio»

Аудио, или с точки зрения обработки сигнала, аудиосигнал представляет собой аналоговое или цифровое представление звука, обычно в виде электрического напряжения.

6
Что нужно знать, чтобы построить программный синтезатор?
Для кого-то, кто имеет некоторый опыт в разработке программного обеспечения, любит свои синтезаторы и знает [очень] основы представления цифрового аудио, каковы первые шаги, которым он должен следовать, чтобы запрограммировать музыкальный синтезатор, в отношении DSP?
19 audio 

3
Покажи другим, как я себя слышу
Оооо .. Я думал об этом материале. Мы все знаем, что мы звучим не так, как слышим о нашем собственном голосе. Легко узнать, как другие нас слышат, записав себя и послушав это. А как же наоборот? Есть ли способ преобразовать наш голос так, чтобы другие могли слышать нас, когда мы …

4
Библиотеки для обнаружения голосовой активности (не распознавания речи)
В продолжение моего предыдущего вопроса мне было интересно, существуют ли какие-либо библиотеки обнаружения речи. Под распознаванием речи я подразумеваю передачу в аудиобуфере и получение индекса того, где речь начинается и заканчивается. Так что, если у меня есть 10 секунд выборки звука на частоте 44 кГц, я бы ожидал массив чисел, …
18 audio  speech 

3
фильтр шума человеческой речи
Кто-нибудь знает фильтр для ослабления неречевой? Я пишу программное обеспечение для распознавания речи и хотел бы отфильтровать все, кроме человеческой речи. Это может включать фоновый шум, шум, производимый дерьмовым микрофоном, или даже фоновую музыку. Я уже внедрил фильтр первого порядка, который компенсирует спад спектра мощности на 6 дБ, но я …

1
Найти похожую музыку, используя FFT Spectrums
Я экспериментировал несколько недель, чтобы найти способ сопоставить / найти похожие песни в библиотеке, содержащей разные жанры музыки. Моей первой попыткой было определить такие особенности, как темп или количество басов в песнях, чтобы сформировать группы, но я не продвинулся далеко с этим подходом (определение ритма на основе изменения громкости), поскольку …
16 audio  fft  music 

2
Как извлечь вокальную часть из стерео аудио сигнала?
Я сейчас обрабатываю файл MP3 и сталкиваюсь с этой проблемой. Мой MP3 стерео закодирован. То, что я хочу сделать, это извлечь вокальную партию для дальнейшей обработки (любой режим выходных сигналов, моно или стерео оба в порядке). Насколько я знаю, аудио кодируется в различные несочлененные поддиапазоны в MP3. Я думаю, что …

4
Более низкие частоты сильнее в БПФ?
Я рассчитываю БПФ от входа микрофона. Я заметил, что более низкие частоты, кажется, всегда имеют большую мощность (более высокий дБ), чем более высокие частоты. Я разрезал данные на 24576 байт (4096 * 6). Применить окно Хемминга: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Запустите его через FFTW Process1D(). Преобразовать из комплексных …
15 audio  fft 

4
Извлечение функций для классификации звука
Я пытаюсь извлечь функции из звукового файла и классифицировать звук как принадлежащий к определенной категории (например: лай собаки, двигатель автомобиля и т. Д.). Я хотел бы получить некоторую ясность по следующим вопросам: 1) это вообще выполнимо? Существуют программы, которые могут распознавать речь и различать различные виды коры собак. Но возможно …

1
Получение громкости трека с RMS
Я пытаюсь вычислить громкость звуковой дорожки, которую я сохранил в буфере. Буфер содержит данные PCM о сигнале, и я хочу узнать, насколько он «громкий», используя Root Mean Squared. Я предполагаю, что могу сделать это во временной области вместо того, чтобы переключаться в частотную область. Каким будет псевдокод для этого? Буду …

2
Когда начинается трек смеха?
Один из моих проектов выходного дня привел меня в глубокие воды обработки сигналов. Как и во всех моих проектах кода, которые требуют некоторой тяжелой математики, я более чем рад найти свой путь к решению, несмотря на отсутствие теоретического обоснования, но в этом случае у меня его нет, и я хотел …

4
Наиболее эффективный способ извлечения частотных компонентов аудиосигнала с почти человеческой точностью в режиме реального времени
Я пытаюсь выяснить, как (если это возможно) извлечь частотные компоненты произвольного аудиосэмпла (обычно музыки), как FFT, но в моем исследовании алгоритма FFT я узнаю, что он страдает некоторыми жесткие ограничения для этой цели. Есть 3 проблемы, которые представляет БПФ: Поскольку разрешение бункера FFT эквивалентно размеру вашего окна, для достижения довольно …

4
Scipy - обработка аудио
Я ищу хорошие инструменты для обработки аудио сигнала. например, анализ речи и музыки, автоматическая идентификация языка и т. д. Предоставляет ли библиотека Scipy функции для обработки звука? Есть ли у него хороший инструмент для обработки аудио сигнала? Можете ли вы предложить инструмент для этого?

2
Какая конструкция полосового фильтра даст самый короткий импульсный отклик?
Разработка простого полосового фильтра IIR II-го порядка по Бутеруорту с центральной частотой 500 Гц и шириной полосы в 1 октаву дает мне следующую частотную характеристику ... Теперь, если я возьму импульсный отклик и нормализую его и переведу в дБ, мы можем наблюдать затухание импульсного отклика. Затухание импульсного отклика приблизительно линейно …

5
Определите, где пение начинается в записи только голоса
У меня есть небольшое приложение в стиле караоке, где пользователь поет 4 строки песни, с интервалом в одну секунду между каждой строкой. Бэк-музыки нет, так что это только голос, надеюсь, облегчить проблему. Я ищу наиболее надежный способ точно определить, где в моей записи пользователь начинает и заканчивает пение строки 1, …

2
Какие методы можно использовать для идентификации и удаления эха из аудиосистемы?
Фон Я разрабатываю систему, которая будет иметь один маленький микрофон и динамики для использования в настройках типа телефона. Самый простой пример, который я могу привести, это разговор по Skype, где вы используете динамики своего компьютера и настольный микрофон. Я беспокоюсь о том, что звук из динамиков будет поднят микрофоном и …
14 audio 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.