2
respostas

novamente didática

Podem me ajudar. Sinto muita falta nos cursos de uma didática mais detalhada, independente do instrutor. Certo, importamos sqalchemy. Perfeito. Eu comecei por esse curso, então não tenho conhecimento de banco de dados. Bem, vejamos. Do que se tratam esses metadata e outros dois que foram importados do sqalchemy? Qual é mais utilizado? Não é o mysql? Ouço falar muito dele. Como é estruturado um banco de dados? Para entender essa aula tenho que fazer uma formação em banco de dados anteriormente? O que é esse engine do banco de dados? E esse motor? Percebem? Não entendi nada. Acho, não sei se com engano, que se o instrutor fosse mais didático e explicasse tudo que ele utiliza, as aulas talvez ficassem mais longas, mas mais inteligíveis para pessoas mais leigas como eu e que estão buscando uma formação iniciando por este curso. Mas pelo que percebi não é uma questão apenas deste. Muitas vezes utiliza-se ferramentas mas quase não explica de onde vem, o porquê ou a lógica subjacente. Só explica um "to do". Em minha opinião isso é bem ruim.

2 respostas

Olá Pietro, tudo bem com você?

Esse curso não exige conhecimento prévio de Banco de Dados. O sqlalchemy é uma biblioteca que utilizamos. Na aula o professor faz a instalação dela no note do Colaboratory através do comando:

!pip3 install sqlalchemy

depois a importação através do comando:

from sqlalchemy import create_engine, MetaData, Table

Na explicação ele cita sobre outros dois bancos de dados que poderíamos trabalhar, no caso o MySql e o Postgres, porém, como usaremos o SQLite, ele vem nativamente instalado.

A área de Data Science é uma área que possuí muitas chamadas diretas e utilização de bibliotecas prontas. Muitas vezes não veremos o que acontece por trás, elas são pensadas justamente para que a utilização se torne mais simples aplicando diretamente no problema. Pandas para tratamento de dados, Numpy para números e matrizes, Scikitlearn pra algoritmos de machine learning, seaborn para gráficos e visualização de dados e por aí vai.

Por isso essa sensação de "to do "que citou. No mercado é mais comum essa abordagem de aplicação mesmo. Fico feliz que você esteja buscando mais a fundo alguns conceitos e para isso eu indicaria que você olhasse em nosso blog artigos sobre os assuntos no qual gostaria de se aprofundar. Segue o link.

Deixo também a documentação do Pandas sobre "engine" aqui

Espero ter te ajudado a clarear essas dúvidas e todo retorno seu é importante para que possamos ir melhorando!

Bons estudos

Compartilho um pouco da frustração do Pietro. Sou contador e acho que a carreira de cientista de dados cada vez mais será estendida para pessoas que não vieram de uma formação de tecnologia. E faz sentido, pois o que mais faço são análises e por isso estou buscando alternativas para que essas análises sejam feitas em maior escala, com menos intervenção manual e mais assertivas. Então acho que falta um pouco de mostrar mais dos 'porquês', nem que a causa seja 'porque a documentação diz que tenho que fazer isso'. No caso do MySql, poderia ter dito, "estou fazendo para o SQLite, mas se fosse para o MySql, teria que instalar outra biblioteca, e a forma que se faz essa instalação, vc encontra na documentação X". Estou fazendo a formação Python para Data Science e portanto esse é meu quinto curso. Ainda não encontrei algo em que pudesse aplicar o Python e com certeza, quando for utilizar na prática, vou sentir muita dificuldade e não espero que o curso me mostre a solução, mas ao menos me mostre o caminho das pedras.