Как упоминалось в разделе «
Создание LSM-дерева из SSTables», Lucene использует структуру, похожую на SSTable, для своего словаря терминов. Эта структура требует небольшого резидентного индекса, который сообщает запросам, при каком смещении в отсортированном файле им нужно искать ключ. В LevelDB этот резидентный индекс представляет собой разреженную коллекцию некоторых ключей, но в Lucene резидентный индекс — это конечный автомат над символами в ключах, похожий на префиксное дерево. Этот автомат может быть преобразован в автомат Левенштейна, который поддерживает эффективный поиск слов в пределах заданного редакционного расстояния.