Olá Rosangela, tudo bem? Espero que sim!
Desculpe pela demora em retornar.
Confira se está utilizando corretamenteo DataFrame df_OVNI que foi criado a partir do web scraping.
Deixarei o código completo para se chegar ao df1 a seguir, a parte do scraping pode ser obtida através do arquivo Coleta_e_Explora.R disponibilizado na atividade 09 da aula 01.
library(httr)
library(XML)
## Iteração de 20 anos
df_OVNI <- data.frame()
mes_corrente = 9
ano_corrente = 1997
ano_mes_corrente = (ano_corrente * 100) + mes_corrente
while (ano_mes_corrente <= 201709) {
site <- paste("http://www.nuforc.org/webreports/ndxe", as.character(ano_mes_corrente), ".html")
site <- gsub (" ", "", site)
html2 <- GET(site)
parsed <- suppressMessages(htmlParse(html2, asText=TRUE))
tableNodes <- getNodeSet(parsed, "//table")
tb <- readHTMLTable(tableNodes[[1]])
df_OVNI <- rbind(df_OVNI,tb)
if (mes_corrente == 12)
{
mes_corrente <- 1
ano_corrente <- ano_corrente + 1
ano_mes_corrente <- (ano_corrente * 100) + mes_corrente
}
else
{
mes_corrente <- mes_corrente + 1
ano_mes_corrente <- ano_mes_corrente + 1
}
print(ano_mes_corrente)
}
require(sqldf)
df1 = sqldf("select Shape, count(*) Views
from df_OVNI
group by shape
having count(*) > 3000
order by 2 desc")
Ao executar esse script, podemos ver o objeto df1 com 10 registros, assim como na imagem abaixo:
Espero que tenha tirado sua dúvida.
Estou à disposição. Bons estudos!