Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Aula 3.2 - Aplicação do cluster com K-Mean, no curso Clustering aplicado: recomendando músicas com K-Means

Na aula é feita a adição de duas colunas em projection_m, conforme comandos descritos abaixo:

projection_m['artist'] = dados['artists']
projection_m['song'] = dados['artists_song']

Existe uma relação de cada linha com o seu respectivo artista (artists) e artista-música (artists_song). Da forma como é colocada, eu imagino que a ordem dos registros dos dados importados, se não houver nenhuma interferência (tal como ordenar registros), não sofre alteração. E da mesma forma, todas as tabelas derivadas da original também mantém a mesma ordem. Ou seja, essa inclusão de colunas é feita sem uma avaliação de relacionamento (coisa de quem programa em SQL). Ela pode ser feita dessa forma, porque não houve nenhuma alteração na ordem dos registros de nenhuma das variáveis de dados. É isso mesmo?

2 respostas
solução!

Olá! Tudo bem?

Você está correto em sua observação. No pandas, quando você adiciona uma nova coluna a um DataFrame, os valores são associados com base no índice. Isso significa que, se você não alterou a ordem das linhas de seu DataFrame (por exemplo, através de ordenação ou embaralhamento), a ordem dos registros será preservada.

No exemplo que você mencionou:

projection_m['artist'] = dados['artists']
projection_m['song'] = dados['artists_song']

Você está adicionando as colunas 'artists' e 'artists_song' do DataFrame 'dados' ao DataFrame 'projection_m'. Como você não modificou a ordem das linhas em nenhum dos DataFrames, a correspondência entre as linhas é mantida. Ou seja, a primeira linha em 'projection_m' corresponderá ao primeiro registro em 'artists' e 'artists_song', a segunda linha corresponderá ao segundo registro, e assim por diante.

É um pouco diferente do SQL, onde você normalmente precisaria especificar uma chave para unir duas tabelas. No pandas, a "chave" é essencialmente o índice do DataFrame.

Portanto, sua compreensão está correta. A adição de colunas é feita sem uma avaliação explícita de relacionamento, porque a ordem dos registros não foi alterada.

Espero ter ajudado e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

Armano, sua resposta foi esclarecedora. Muito obrigado!