В предоставленных ответах ( здесь , здесь и здесь ) уже есть много хороших подходов . Если скорость - это то, что вы в первую очередь ищете, вам определенно следует рассмотреть возможность выполнения этой работы через Lua C API, который во много раз быстрее, чем необработанный код Lua. При работе с предварительно загруженными фрагментами (например, функция загрузки ) разница не такая большая, но все же значительная.
Что касается чистого решений Lua, позвольте мне поделиться этим небольшим тестом, который я сделал. Он охватывает все предоставленные ответы на эту дату и добавляет несколько оптимизаций. Тем не менее, главное, что нужно учитывать:
Сколько раз вам нужно будет перебирать символы в строке?
- Если ответ «один раз», то вам следует найти первую часть метки («сырая скорость»).
- В противном случае вторая часть предоставит более точную оценку, потому что она анализирует строку в таблице, что намного быстрее для перебора. Вам также следует подумать о написании простой функции для этого, например, @Jarriz.
Вот полный код:
local str = "Hello World!"
local attempts = 5000000
local reuses = 10
local x, c, elapsed, tbl
local stringbyte, stringchar, stringsub, stringgsub, stringgmatch = string.byte, string.char, string.sub, string.gsub, string.gmatch
print("-----------------------")
print("Raw speed:")
print("-----------------------")
x = os.clock()
for j = 1, attempts do
for i = 1, #str do
c = stringsub(str, i)
end
end
elapsed = os.clock() - x
print(string.format("V1: elapsed time: %.3f", elapsed))
x = os.clock()
for j = 1, attempts do
for c in stringgmatch(str, ".") do end
end
elapsed = os.clock() - x
print(string.format("V2: elapsed time: %.3f", elapsed))
x = os.clock()
for j = 1, attempts do
stringgsub(str, ".", function(c) end)
end
elapsed = os.clock() - x
print(string.format("V3: elapsed time: %.3f", elapsed))
local str2table = function(str)
local ret = {}
for i = 1, #str do
ret[i] = stringsub(str, i)
end
return ret
end
x = os.clock()
for j = 1, attempts do
tbl = str2table(str)
for i = 1, #tbl do
c = tbl[i]
end
end
elapsed = os.clock() - x
print(string.format("V4: elapsed time: %.3f", elapsed))
x = os.clock()
for j = 1, attempts do
tbl = {stringbyte(str, 1, #str)}
for i = 1, #tbl do
c = tbl[i]
end
end
elapsed = os.clock() - x
print(string.format("V5: elapsed time: %.3f", elapsed))
x = os.clock()
for j = 1, attempts do
tbl = {stringbyte(str, 1, #str)}
for i = 1, #tbl do
c = stringchar(tbl[i])
end
end
elapsed = os.clock() - x
print(string.format("V5b: elapsed time: %.3f", elapsed))
print("-----------------------")
print("Creating cache table ("..reuses.." reuses):")
print("-----------------------")
x = os.clock()
for k = 1, attempts do
tbl = {}
for i = 1, #str do
tbl[i] = stringsub(str, i)
end
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V1: elapsed time: %.3f", elapsed))
x = os.clock()
for k = 1, attempts do
tbl = {}
local tblc = 1
for c in stringgmatch(str, ".") do
tbl[tblc] = c
tblc = tblc + 1
end
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V2: elapsed time: %.3f", elapsed))
x = os.clock()
for k = 1, attempts do
tbl = {}
local tblc = 1
stringgsub(str, ".", function(c)
tbl[tblc] = c
tblc = tblc + 1
end)
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V3: elapsed time: %.3f", elapsed))
x = os.clock()
for k = 1, attempts do
tbl = str2table(str)
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V4: elapsed time: %.3f", elapsed))
x = os.clock()
for k = 1, attempts do
tbl = {stringbyte(str,1,#str)}
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V5: elapsed time: %.3f", elapsed))
x = os.clock()
for k = 1, attempts do
tbl = {stringbyte(str, 1, #str)}
for i = 1, #tbl do
tbl[i] = stringchar(tbl[i])
end
for j = 1, reuses do
for i = 1, #tbl do
c = tbl[i]
end
end
end
elapsed = os.clock() - x
print(string.format("V5b: elapsed time: %.3f", elapsed))
Пример вывода (Lua 5.3.4, Windows) :
Raw speed:
V1: elapsed time: 3.713
V2: elapsed time: 5.089
V3: elapsed time: 5.222
V4: elapsed time: 4.066
V5: elapsed time: 2.627
V5b: elapsed time: 3.627
Creating cache table (10 reuses):
V1: elapsed time: 20.381
V2: elapsed time: 23.913
V3: elapsed time: 25.221
V4: elapsed time: 20.551
V5: elapsed time: 13.473
V5b: elapsed time: 18.046
Результат:
В моем случае string.byte
и string.sub
были самыми быстрыми с точки зрения чистой скорости. При использовании таблицы кеширования и повторном ее использовании 10 раз за циклstring.byte
версия была самой быстрой даже при преобразовании кодов обратно в символы (что не всегда необходимо и зависит от использования).
Как вы, наверное, заметили, я сделал некоторые предположения на основе своих предыдущих тестов и применил их к коду:
- Библиотечные функции всегда должны быть локализованы, если они используются внутри циклов, потому что это намного быстрее.
- Вставка нового элемента в таблицу lua выполняется намного быстрее,
tbl[idx] = value
чем при использовании table.insert(tbl, value)
.
- Цикл по таблице с использованием
for i = 1, #tbl
немного быстрее, чем for k, v in pairs(tbl)
.
- Всегда предпочитайте версию с меньшим количеством вызовов функций, потому что сам вызов немного увеличивает время выполнения.
Надеюсь, это поможет.