Regresja liniowa z ramką danych pandy

Mam ramkę danych w pandach, której używam do tworzenia wykresu rozrzutu i chcę uwzględnić linię regresji dla wykresu. W tej chwili próbuję to zrobić za pomocą Polyfit.

Oto mój kod:

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
from numpy import *

table1 = pd.DataFrame.from_csv('upregulated_genes.txt', sep='\t', header=0, index_col=0)
table2 = pd.DataFrame.from_csv('misson_genes.txt', sep='\t', header=0, index_col=0)
table1 = table1.join(table2, how='outer')

table1 = table1.dropna(how='any')
table1 = table1.replace('#DIV/0!', 0)

# scatterplot
plt.scatter(table1['log2 fold change misson'], table1['log2 fold change'])
plt.ylabel('log2 expression fold change')
plt.xlabel('log2 expression fold change Misson et al. 2005')
plt.title('Root Early Upregulated Genes')
plt.axis([0,12,-5,12])

# this is the part I'm unsure about
regres = polyfit(table1['log2 fold change misson'], table1['log2 fold change'], 1)

plt.show()

Ale mam następujący błąd:

TypeError: cannot concatenate 'str' and 'float' objects

Czy ktoś wie, gdzie się tutaj mylę? Nie wiem też, jak dodać linię regresji do mojego wykresu. Wszelkie inne ogólne uwagi na temat mojego kodu również byłyby bardzo mile widziane, nadal jestem początkującym.

questionAnswers(1)

yourAnswerToTheQuestion