Solucionado (ver solução)
Solucionado
(ver solução)
5
respostas

Eixo X não exibe "ticks"

Olá! Segui a mesma implementação das aulas. Porém, o eixo x não exibe as datas. Obviamente que a base de dados é maior (comparando a utilizada no curso com a atual), mas não há nenhuma referência ao período temporal. Isso se acontece devido as datas estarem como variáveis? Ou é devido a quantidade de dados? Mesmo tentando reduzir o intervalo, as datas não são exibidas. O que poderia ser feito para resolver tal problema? Segue abaixo uma imagem ilustrando a situação. Desde já agradeço pela atenção. Obrigado.

Eixo X sem as datas

5 respostas

Olá Diego, tudo bem?

Após testar o código, verifiquei que funcionou normalmente em meu ambiente. Possivelmente, a diferença de comportamento que você está experimentando pode estar relacionada à versão das ferramentas utilizadas. No meu caso, estou utilizando Python 3.12 e Conda 23.7.4.

Além disso, sugiro que verifique se todas as URLs utilizadas no curso foram atualizadas, o que pode ser feito nesta atividade específica.

É importante ressaltar que a mensagem que você recebeu é apenas um aviso (warning) e não um erro. Portanto, você pode prosseguir com o curso sem preocupações.

Caso o problema persista, estou à disposição para ajudar.

Abraços e bons estudos!

Olá, Monalisa! De fato: deve ser devido a versão do Python/Anaconda. Em outros gráficos plotados, o eixo X exibiu normalmente os valores dos "ticks". A versão do ambiente que estou utilizando é diferente, então certamente haverá algumas incongruências. Agradeço desde já e aproveito, sem querer abusar da boa vontade, para lhe pedir ajuda em outra questão:

Na aula 3 do curso, foi utilizado um dataset contido no seguinte link:

https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv

Porém, ao utilizar o last_date (como sugerido no curso) a coluna referente a letalidade (que foi criada também na aula 3) ficará zerada, pois não há dados referentes a esse período. Mas ao analisar determinada Series de um país aleatório, é possível notar que há recuperados nesse meio, o que compromete o cálculo de letalidade. Entendo que o exemplo do curso é diferente, pois o dataset continuou a ser atualizado após a publicação do curso.

Seria válido realizar uma modificação e utilizar apenas o recorte que contenha dados? Ou isso poderia prejudicar o andamento do curso? Alguma sugestão de como proceder em relação a isso? Obrigado.

solução!

Oi Diego.

Realmente, como o dataset continua sendo atualizado, pode haver casos em que as colunas estarão zeradas. Uma sugestão para contornar essa situação é utilizar um recorte dos dados que contenha informações até uma data específica, de forma a garantir que haja dados de recuperados para todos os períodos considerados. Dessa forma, você poderá calcular a letalidade de forma mais precisa.

Acredito que é possível que alguns trechos de códigos terão que ser adaptados, mas nada que comprometa o andamento e entendimento do conteúdo.

Destaco, que caso opte por realizar o recorte dos dados, você pode utilizar a função loc do pandas para selecionar apenas as linhas e colunas desejadas do dataset.

Espero ter ajudado e qualquer dúvida, que surgir, você poderá compartilhar no fórum!

Abraços!

Olá novamente, Monalisa! Grato pelo retorno.

Em relação a função loc, posso utilizá-la para selecionar um intervalo específico de colunas? Sempre tenho essa dúvida ao utilizar a mesma (sempre imagino que ela seja utilizada apenas para buscar índices que não sejam numéricos, não colunas).

Pois o "problema" em si com esse dataset é justamente esse: selecionar um intervalo específico de colunas (do dia x ao dia y, por exemplo). E a partir daí, com esse novo dataset criado a partir do loc, realizar as análises necessárias.

Agradeço novamente pela atenção e aguardo seu retorno. Obrigado.

Oi Diego, tudo bem?

Desde já peço desculpas pela demora em obter um retorno.

Neste caso, você pode definir o intervalo, definindo variáveis como "data_inicio" e a "data_fim" . Em seguida, você pode acessar utilizando o loc, como no código abaixo:

intervalo_colunas = df.loc[:, data_inicio:data_fim]

O código acima, selecionará todas as linhas (:) e as colunas dentro do intervalo de datas especificado (data_inicio até data_fim).

Espero ter ajudado.

Bons estudos!