Regresión lineal con marco de datos de pandas.

Tengo un marco de datos en pandas que estoy usando para producir un diagrama de dispersión, y quiero incluir una línea de regresión para la gráfica. En este momento estoy tratando de hacer esto con Polyfit.

Aquí está mi código:

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
from numpy import *

table1 = pd.DataFrame.from_csv('upregulated_genes.txt', sep='\t', header=0, index_col=0)
table2 = pd.DataFrame.from_csv('misson_genes.txt', sep='\t', header=0, index_col=0)
table1 = table1.join(table2, how='outer')

table1 = table1.dropna(how='any')
table1 = table1.replace('#DIV/0!', 0)

# scatterplot
plt.scatter(table1['log2 fold change misson'], table1['log2 fold change'])
plt.ylabel('log2 expression fold change')
plt.xlabel('log2 expression fold change Misson et al. 2005')
plt.title('Root Early Upregulated Genes')
plt.axis([0,12,-5,12])

# this is the part I'm unsure about
regres = polyfit(table1['log2 fold change misson'], table1['log2 fold change'], 1)

plt.show()

Pero me sale el siguiente error:

TypeError: cannot concatenate 'str' and 'float' objects

¿Alguien sabe dónde me voy mal aquí? Tampoco estoy seguro de cómo agregar la línea de regresión a mi gráfica. Cualquier otro comentario general sobre mi código también sería muy apreciado, todavía soy un principiante.

Respuestas a la pregunta(1)

Su respuesta a la pregunta