1
resposta

Lógica do código

Não entendi a lógica do código utilizado. O que afinal, e por que, criamos uma variável probabilidade? Esses dois fors estão aninhados? Ficou bastante confuso em minha cabeça. Também achei que não foi explicado de maneira satisfatória, em aula anterior, os módulos importados aqui pela primeira vez, que no caso um deles é o html5lib. E se houver mais de uma tabela no site? Não importa quanta sujeira ele tenha, como fotos, publicidade, etc? Senti falta, neste aspecto, de um exemplo mais real, não tão "laboratorial". Caso puderem me ajudar com a lógica do código, explicando de outra maneira, e com as explicações sobre importação de tabelas em um site e os módulos utilizados, agradeceria muito.

1 resposta

Oi Pietro!

Sim os dois "for" estão aninhados com a função iterrows que relaciona as linhas da tabela trabalhada.

Em alguns sites com outras informações e tabelas, será mais difícil a extração dessas informações. A técnica utilizada para isso é chamada de Web Scraping.

Vou deixar um artigo nosso sobre o assunto Aqui e também um curso que trata disso Aqui

Sobre a variável "probabilidade" foi criada para guardar a informação entre a variável "x" que recebe a chamada aleatória através do comando np.random.rand(20) "uma maneira de calcularmos randomicamente os 20 cursos que temos no dataframe" e então a divisão por sum(x) que seria a soma desses valores aleatórios gerados pela biblioteca numpy e divididos pelo "x "que já expliquei.

Espero que tenha ajudado e ficado mais claro para você! Qualquer coisa só voltar aqui! Bons estudos