Ответы:
Используйте -mapопцию, чтобы выбрать ваши потоки. При выборе потока по умолчанию выбирается только один тип потока, поэтому -mapего следует использовать.

ffmpeg -i video.mkv -i audio.mp3 -map 0:v -map 0:a:0 -map 1:a \
-metadata:s:a:0 language=eng -metadata:s:a:1 language=sme -codec copy \
-shortest output.mkv
0:v- 0Ссылка на первый вход, который есть video.mkv. В vозначает «выберите видеопоток тип».
0:a:0- 0Ссылка на первый вход, который есть video.mkv. В aозначает «выбрать тип звукового потока». Последний 0относится к первому аудиопотоку с этого входа. Если 0:aиспользуется только , тогда все видеопотоки будут отображены.
1:a- 1Ссылка на второй вход, который является audio.mp3. В aозначает «выбрать тип звукового потока».
-codec copyбудет потоковое копирование (повторное мультиплексирование) вместо кодирования. Если вам нужен определенный аудиокодек, вы должны указать -c:v copy(для сохранения видео), а затем, например, -c:a libmp3lameперекодировать аудиопоток в MP3.
-shortest завершит вывод, когда закончится самый короткий ввод.

ffmpeg -i vid.mkv -i aud.mp3 -filter_complex "[0:a][1:a]amerge=inputs=2[a]" \
-map 0:v -map "[a]" -c:v copy -c:a aac -strict experimental -b:a 192k -ac 2 \
-shortest out.mp4
amergeфильтр , поэтому в этом примере звук не может быть скопирован в потоковом режиме.-codec copy, но я исправил это (другая версия ffmpeg), другая проблема, с которой я столкнулся, заключалась в том -map, что он жаловался на неправильное количество потоков.
-map 0:v -map 1:a. Я предполагаю, что это означает взять видео из первого файла (video.mkv), а затем взять аудио из второго файла (audio.mp4), чтобы создать output.mkv ... Не уверен, для чего это нужно -map 0:a:0. Я исключил это, и я получил результаты, которые я хотел.