Resultados da pesquisa a pedido "python"
pandas obter média de um groupby
Estou tentando encontrar o custo médio mensal por user_id, mas só consigo obter o custo médio por usuário ou o custo mensal por usuário. Como eu agrupo por usuário e mês, não há como obter a média do segundo grupo por mês, a menos que eu ...
Monitorar a extração de arquivos ZIP Python
Eu preciso descompactar um arquivo .ZIP. Eu já sei como descompactá-lo, mas é um arquivo enorme e leva algum tempo para extrair. Como imprimir a porcentagem completa para a extração? Eu gostaria de algo assim: Extracting File 1% Complete 2% ...
Python 2.7: imprima um dicionário sem colchetes e aspas
myDict = {"Harambe" : "Gorilla", "Restaurant" : "Place", "Codeacademy" : "Place to learn"}Então, eu quero imprimir um dicionário. Mas quero fazê-lo como se fosse uma lista real de coisas. Não posso simplesmente fazerprint myDict, pois deixará ...
Por que precisamos de bloqueios para threads, se temos GIL?
Eu acredito que é uma pergunta estúpida, mas ainda não consigo encontrá-la. Na verdade, é melhor separá-lo em duas perguntas: 1) Estou certo de que poderíamos ter muitos threads, mas por causa do GIL em um momento apenas um thread está sendo ...
PySpark: calcula o máximo de linhas do subconjunto de colunas e adiciona a um quadro de dados existente
Gostaria de calcular o máximo de um subconjunto de colunas para cada linha e adicioná-lo como uma nova coluna para o existenteDataframe. Eu consegui fazer isso de uma maneira muito estranha: def add_colmax(df,subset_columns,colnm): ''' ...
Como configurar o log para syslog no Python?
Não consigo mexer na cabeça do Pythonlogging módulo. Minhas necessidades são muito simples: eu só quero registrar tudo no syslog. Depois de ler a documentação, criei este script de teste simples: import logging import logging.handlers my_logger ...
Qual é o significado do atributo "axis" em um DataFrame do Pandas?
Tomando o seguinte exemplo: >>> df1 = pd.DataFrame({"x":[1, 2, 3, 4, 5], "y":[3, 4, 5, 6, 7]}, index=['a', 'b', 'c', 'd', 'e']) >>> df2 = pd.DataFrame({"y":[1, 3, 5, 7, 9], "z":[9, 8, 7, 6, 5]}, index=['b', 'c', 'd', 'e', 'f']) >>> ...
Comando "py.test" vs "pytest"
opy.test comando está falhando no meu caso, enquantopytest está funcionando totalmente bem. Eu uso o plugin pytest-flask: platform linux -- Python 3.5.2, pytest-3.0.2, py-1.4.31, pluggy-0.3.1 ...
Como imprimo o modelo de tópico lda e a nuvem de palavras de cada um dos tópicos
from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud ...
Como recuperar XML bruto do lxml?
Estou usando o seguinte código para localizar uma div: parser = etree.HTMLParser() tree = etree.parse(StringIO(page), parser) div = tree.xpath("//div[@class='content']")[0]Meu único problema é que, depois de fazer isso, não quero confiar no lxml ...