Одним словом: индексация.
Lucene создает индекс вашего документа, что позволяет ему выполнять поиск намного быстрее.
То же самое различие между структурой данных списка O (N) и структурой данных хеш-таблицы O (1). Список должен пройти через всю коллекцию, чтобы найти то, что вам нужно. В хэш-таблице есть индекс, который позволяет точно определить, где находится нужный элемент, и просто извлечь его.
Обновить:
Я не уверен, что вы имеете в виду под «поиском по индексу Lucene намного быстрее, чем поиск по индексу MySQL».
Я предполагаю, что вы используете MySQL «WHERE document LIKE '% фраза%'» для поиска документа. Если это правда, то MySQL должен сканировать таблицу для каждой строки, которая будет O (N).
Lucene анализирует документ на токены, группирует их в n-граммы по вашему указанию и вычисляет индексы для каждого из них. Это O (1), чтобы найти слово в проиндексированном документе Lucene.