Вы можете перебирать каждый файл в каталоге и использовать браузер командной строки, такой как lynx или w3m, чтобы отобразить HTML в виде открытого текста и сохранить его в текстовом файле.
Пример рыси:
lynx -dump in.html > out.txt
Пример w3m:
w3m -dump in.html > out.txt