У меня есть два документа ODT, они имеют очень близкое содержание, я хочу сравнить их, чтобы увидеть, насколько они похожи.
Лучше всего было бы иметь процент сходства , если не возможно, альтернативой было бы, по крайней мере, иметь какой-то тип diff .
Я использую Ubuntu Lucid .
Решение:
Я использовал odt2txt
для преобразования файлов в текст, а затем wdiff -i --statistics one.txt two.txt
имел статистику, которая давала мне процент общих слов (сходство).