Postgres: desempenho surpreendente em atualizações usando o cursor
Considere os dois exemplos de código Python a seguir, que alcançam o mesmo, mas com diferença de desempenho significativa e surpreendente.
import psycopg2, time
conn = psycopg2.connect("dbname=mydatabase user=postgres")
cur = conn.cursor('cursor_unique_name')
cur2 = conn.cursor()
startTime = time.clock()
cur.execute("SELECT * FROM test for update;")
print ("Finished: SELECT * FROM test for update;: " + str(time.clock() - startTime));
for i in range (100000):
cur.fetchone()
cur2.execute("update test set num = num + 1 where current of cursor_unique_name;")
print ("Finished: update starting commit: " + str(time.clock() - startTime));
conn.commit()
print ("Finished: update : " + str(time.clock() - startTime));
cur2.close()
conn.close()
E:
import psycopg2, time
conn = psycopg2.connect("dbname=mydatabase user=postgres")
cur = conn.cursor('cursor_unique_name')
cur2 = conn.cursor()
startTime = time.clock()
for i in range (100000):
cur2.execute("update test set num = num + 1 where id = " + str(i) + ";")
print ("Finished: update starting commit: " + str(time.clock() - startTime));
conn.commit()
print ("Finished: update : " + str(time.clock() - startTime));
cur2.close()
conn.close()
A instrução create para o teste da tabela é:
CREATE TABLE test (id serial PRIMARY KEY, num integer, data varchar);
E essa tabela contém 100000 linhas e VACUUM ANALYZE TEST; foi executado.
Obtive os seguintes resultados de forma consistente em várias tentativas.
Primeiro exemplo de código:
Finished: SELECT * FROM test for update;: 0.00609304950429
Finished: update starting commit: 37.3272754429
Finished: update : 37.4449708474
Segundo exemplo de código:
Finished: update starting commit: 24.574401185
Finished committing: 24.7331461431
Isso é muito surpreendente para mim, pois eu acho que deveria ser exatamente o oposto, o que significa que uma atualização usando o cursor deve ser significativamente mais rápida, de acordo comesta responda.