Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

3
respostas

[Projeto] Criação e Manipulação de DataFrames

1. Criação e Manipulação de DataFrames

Aprendemos a criar DataFrames utilizando o Pandas, organizando informações em linhas e colunas. Também vimos como adicionar, visualizar e manipular dados de forma estruturada.

Exemplo:

import pandas as pd

dados = {
    "Produto": ["Notebook", "Mouse", "Teclado"],
    "Preço": [3500, 120, 250]
}

df = pd.DataFrame(dados)
print(df)

2. Utilização do NumPy

Utilizamos o NumPy para gerar números aleatórios e preencher DataFrames com dados simulados, facilitando testes e análises.

Exemplo:

import numpy as np

vendas = np.random.randint(10, 100, size=5)
print(vendas)

3. Acesso e Filtragem de Dados

Aprendemos a acessar colunas específicas e aplicar filtros para selecionar apenas os registros desejados.

Exemplo:

df["Preço"]

Filtrando produtos acima de R$ 200:

df[df["Preço"] > 200]

4. Operadores de Comparação e Lógicos

Utilizamos operadores como:

  • == (igual)
  • != (diferente)
  • > (maior)
  • < (menor)
  • & (E)
  • | (OU)

Exemplo:

df[(df["Preço"] > 100) & (df["Preço"] < 1000)]

5. Seleção com loc e iloc

loc: seleciona utilizando rótulos.

df.loc[0]

iloc: seleciona utilizando índices numéricos.

df.iloc[0]

6. Carregamento de Arquivos CSV

Aprendemos a importar dados externos utilizando o Pandas.

df = pd.read_csv("dados.csv")

Visualização inicial:

df.head()

7. Análise de Sentimentos com LLMs

Foi demonstrado como utilizar modelos de linguagem para classificar textos em categorias como:

  • Positivo
  • Negativo
  • Neutro

Essa técnica é útil para analisar avaliações de clientes, comentários e feedbacks.

Exemplo conceitual:

def analisar_sentimento(texto):
    # chamada ao modelo de linguagem
    return "Positivo"

8. Adição de Novas Colunas

Após a análise dos dados, aprendemos a criar novas colunas para armazenar resultados.

df["Sentimento"] = resultados

Isso permite enriquecer o conjunto de dados com informações geradas por algoritmos ou modelos de IA.


Conclusão

Ao final da aula, você aprendeu a:

✅ Criar e manipular DataFrames com Pandas.

✅ Gerar dados utilizando NumPy.

✅ Filtrar e selecionar informações com condições.

✅ Utilizar os métodos loc e iloc.

✅ Importar arquivos CSV.

✅ Integrar análises de sentimentos com modelos de linguagem.

✅ Adicionar novas colunas aos DataFrames para armazenar resultados das análises.

Essas habilidades são fundamentais para projetos de Ciência de Dados, Inteligência Artificial, Machine Learning e Análise de Negócios, permitindo transformar dados brutos em informações úteis para tomada de decisão.

3 respostas

[DataFrame completo:
nome_produto categoria preco avaliacao itens_vendidos
0 Notebook eletrônicos 3500 4.8 150
1 Smartphone eletrônicos 2500 4.5 300
2 Geladeira eletrodomésticos 4200 3.9 80
3 Fone Bluetooth eletrônicos 250 1.8 500
4 Micro-ondas eletrodomésticos 800 1.5 120

Primeiras linhas:
nome_produto categoria preco avaliacao itens_vendidos
0 Notebook eletrônicos 3500 4.8 150
1 Smartphone eletrônicos 2500 4.5 300
2 Geladeira eletrodomésticos 4200 3.9 80
3 Fone Bluetooth eletrônicos 250 1.8 500
4 Micro-ondas eletrodomésticos 800 1.5 120

Coluna categoria:
0 eletrônicos
1 eletrônicos
2 eletrodomésticos
3 eletrônicos
4 eletrodomésticos
Name: categoria, dtype: object

Categorias únicas:
['eletrônicos' 'eletrodomésticos']

Produtos eletrônicos:
nome_produto categoria preco avaliacao itens_vendidos
0 Notebook eletrônicos 3500 4.8 150
1 Smartphone eletrônicos 2500 4.5 300
3 Fone Bluetooth eletrônicos 250 1.8 500

Produtos com avaliação abaixo de 2.0:
nome_produto categoria preco avaliacao itens_vendidos
3 Fone Bluetooth eletrônicos 250 1.8 500
4 Micro-ondas eletrodomésticos 800 1.5 120

Eletrônicos com preço abaixo de 3000:
nome_produto categoria preco avaliacao itens_vendidos
1 Smartphone eletrônicos 2500 4.5 300
3 Fone Bluetooth eletrônicos 250 1.8 500

Primeira linha usando iloc:
nome_produto Notebook
categoria eletrônicos
preco 3500
avaliacao 4.8
itens_vendidos 150
Name: 0, dtype: object

Linhas 1 a 3:
nome_produto categoria preco avaliacao itens_vendidos
1 Smartphone eletrônicos 2500 4.5 300
2 Geladeira eletrodomésticos 4200 3.9 80
3 Fone Bluetooth eletrônicos 250 1.8 500

Acessando Notebook com loc:
categoria eletrônicos
preco 3500
avaliacao 4.8
itens_vendidos 150
Name: Notebook, dtype: object

Reviews classificados:
feedback sentimento
0 Produto excelente, gostei muito! Positivo
1 Péssima qualidade, não recomendo. Negativo
2 Entrega rápida e produto bom. Positivo
3 Muito ruim, veio com defeito. Negativo
4 Atendeu minhas expectativas. Positivo
]()

[ Produto Preço
0 Notebook 3500
1 Mouse 120
2 Teclado 250
[38 84 11 57 48] ]()

Oi, Michele! Como vai?

Obrigada por compartilhar seus aprendizados com a comunidade. A forma como você organizou os conteúdos sobre criação e manipulação de DataFrames com Pandas, geração de dados utilizando NumPy, filtragem de informações e análise de sentimentos com modelos de linguagem demonstra uma compreensão sólida do fluxo de trabalho em Ciência de Dados.

Aprendemos juntos que criar DataFrames estruturados é o primeiro passo para transformar dados brutos em informações úteis. A partir disso, recursos como loc e iloc permitem acessar registros com precisão, enquanto os operadores de comparação e lógicos tornam a filtragem mais poderosa e flexível. O carregamento de arquivos CSV com Pandas amplia ainda mais esse processo, permitindo trabalhar com dados reais do dia a dia.

Vale destacar também a integração com modelos de linguagem para análise de sentimentos, adicionando novas colunas ao DataFrame com os resultados gerados. Essa combinação entre Pandas, NumPy e inteligência artificial é muito valorizada em projetos de Machine Learning e Análise de Negócios.

Continue praticando com pequenos conjuntos de dados, pois a repetição é o caminho mais eficiente para fixar cada etapa. Conte sempre com o apoio do Fórum na sua jornada de aprendizado.

Qual dessas etapas você achou mais desafiadora: a filtragem de dados, o uso de loc e iloc, ou a integração com modelos de linguagem para análise de sentimentos?

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!