Есть ли какая-нибудь утилита, подобная grep
или даже uniq
неточная, но для неточного поиска, или я должен написать ее сам?
Я имею в виду, что это будет выглядеть на 90% (количество может варьироваться) соответствия или что-то в этом роде. Например, у меня есть файл с несколькими строками:
abc123
abd123
abc223
qwe938
В этом случае такая утилита должна вернуть первые три строки или сказать, что они похожи. Конечно, я не знаю какой-либо структуры содержимого файла, как в случае с grep
или uniq
.
Это очень специфический набор данных. Например, Мэри похожа на Мари или ABC похожа на BCD? Можете ли вы привести пример ваших данных в реальном мире?
—
EightBitTony