strcmp для Python или как эффективно сортировать подстроки (без копирования) при построении массива суффиксов

Вот очень простой способ построитьмассив суффиксов из строки в питоне:

def sort_offsets(a, b):
    return cmp(content[a:], content[b:])

content = "foobar baz foo"
suffix_array.sort(cmp=sort_offsets)
print suffix_array
[6, 10, 4, 8, 3, 7, 11, 0, 13, 2, 12, 1, 5, 9]

Однако «content [a:]» делает копию контента, которая становится очень неэффективной, когда контент становится большим. Поэтому мне интересно, есть ли способ сравнить две подстроки без необходимости их копировать. Я пытался использовать встроенный буфер, но это не сработало.

Ответы на вопрос(4)

Ваш ответ на вопрос