Resultados da pesquisa a pedido "python"
pandas groupby contar ocorrência de seqüência de caracteres sobre a coluna
Quero contar a ocorrência de uma seqüência de caracteres em uma coluna agrupada de dados do pandas. Suponha que eu tenho o seguinte Dataframe: catA catB scores A X 6-4 RET A X 6-4 6-4 A Y 6-3 RET B Z 6-0 RET B Z 6-1 RET Primeiro, quero agrupar ...
Kivy fora da herança de regras
Quero especificar um botão especial para não precisar ajustar todos os botões que usar, no entanto, quero que o evento desencadeie uma função em uma classe diferente. main.py from kivy.app import App from kivy.uix.button import Button ...
Mude para usuário sudo em um script python
Eu tenho um problema. Estou escrevendo um software, necessário para executar uma operação que requer que o usuário esteja no modo sudo. executando 'sudo python filename.py' não é uma opção, o que me leva à minha pergunta. Existe uma maneira de ...
obter índices do texto original de nltk word_tokenize
Estou tokenizando um texto usando nltk.word_tokenize e também gostaria de obter o índice no texto bruto original para o primeiro caractere de cada token, ou seja, import nltk x = 'hello world' tokens = nltk.word_tokenize(x) >>> ...
Como dividir um caminho dos em seus componentes em Python
Eu tenho uma variável de string que representa um caminho dos, por exemplo: var = "d:\stuff\morestuff\furtherdown\THEFILE.txt" Eu quero dividir essa string em: [ "d", "stuff", "morestuff", "furtherdown", "THEFILE.txt" ] Eu tentei usarsplit() ...
Criando uma matriz numpy 2D de índices iniciais e finais de "estrias" em outra matriz.
Digamos que eu tenha uma matriz numérica de números 1DmyArray = ([1, 1, 0, 2, 0, 1, 1, 1, 1, 0, 0 ,1, 2, 1, 1, 1]). Quero criar uma matriz numpy 2D que descreva os primeiros (coluna 1) e os últimos (coluna 2) índices de qualquer "sequência" de 1 ...
Como gerar tuplas de (etiqueta original, etiqueta prevista) no Spark com MLlib?
Estou tentando fazer previsões com o modelo que voltei do MLlib no Spark. O objetivo é gerar tuplas de (orinalLabelInData, predictedLabel). Em seguida, essas tuplas podem ser usadas para fins de avaliação do modelo. Qual a melhor maneira de ...
Criando grandes DataFrames do Pandas: pré-alocação x append vs concat
Estou confuso com o desempenho do Pandas ao criar um grande pedaço de dataframe por pedaço. No Numpy, (quase) sempre vemos melhor desempenho pré-alocando uma grande matriz vazia e preenchendo os valores. Pelo que entendi, isso ocorre porque o ...
Por que declarar unicode por string em python?
Ainda estou aprendendo python e tenho uma dúvida: No python 2.6.x, geralmente declaro a codificação no cabeçalho do arquivo desta maneira (como emPEP 0263 [http://www.python.org/dev/peps/pep-0263/]) # -*- coding: utf-8 -*-Depois disso, minhas ...
Flutuadores não avaliados como negativos (Python)
Estou tentando excluir valores de ponto flutuante em uma lista que é negativa. A lista original com todos os valores é assim: [ 0.030079979253112028, -0.006015995850622406, -0.08920269709543568, -25.72356846473029, -9.770807053941908, ...