9
Как извлечь текст из документов MS Office в Linux?
Мне нужен способ извлечения текста из всех типов документов MS Office (Word, Excel, Powerpoint) в Linux. Я предполагаю, что может быть несколько различных подходов для достижения этой цели, например, сценарий Bash или Python, или преобразование их в PDF, а затем извлечение текста с помощью такого инструмента, как pdftotext. Кажется, это …