Python extrair dados do arquivo
Eu tenho um arquivo de texto apenas dizer
text1 text2 text text
text text text text
Eu estou olhando para em primeiro lugar contar o número de seqüências de caracteres no arquivo (todos deliminados pelo espaço) e, em seguida, saída os dois primeiros textos. (texto 1 texto 2)
Alguma ideia?
Obrigado antecipadamente pela ajuda
Edit: Isto é o que eu tenho até agora:
>>> f=open('test.txt')
>>> for line in f:
print line
text1 text2 text text text text hello
>>> words=line.split()
>>> words
['\xef\xbb\xbftext1', 'text2', 'text', 'text', 'text', 'text', 'hello']
>>> len(words)
7
if len(words) > 2:
print "there are more than 2 words"
O primeiro problema que tenho é, meu arquivo de texto é: text1 text2 text text text text
Mas quando eu puxo a saída de palavras eu recebo: ['\ xef \ xbb \ xbftext1', 'texto2', 'texto', 'texto', 'texto', 'texto', 'olá']
De onde vem o '\ xef \ xbb \ xbf?