Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

2
respostas

por Ronaldo Cesar Correia

| 26.7k xp | 82 posts

Apoio ao Adm

import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

Carregar o dataset Iris da biblioteca sklearn

dataset = datasets.load_iris()

Converter para DataFrame do Pandas para facilitar a manipulação dos dados

df = pd.DataFrame(data=dataset.data, columns=dataset.feature_names)
df['target'] = dataset.target # Adicionar a coluna com as classes das flores

Separar os atributos (X) e os rótulos (y)

X = df.iloc[:, :-1] # Todas as colunas exceto a última
y = df['target'] # Última coluna, que contém as classes

Dividir os dados em conjunto de treino e teste (80% treino, 20% teste)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Criar e treinar um modelo de Árvore de Decisão

model = DecisionTreeClassifier(random_state=42)
model.fit(X_train, y_train)

Fazer previsões nos dados de teste

y_pred = model.predict(X_test)

Avaliar o desempenho do modelo

accuracy = accuracy_score(y_test, y_pred)
print(f'Acurácia do modelo: {accuracy:.2f}')

Aplicar validação cruzada para melhor avaliação do desempenho

cross_val_scores = cross_val_score(model, X, y, cv=5)
print(f'Acurácia média na validação cruzada: {cross_val_scores.mean():.2f}')

Testar com uma nova amostra

nova_amostra = np.array([[5.1, 3.5, 1.4, 0.2]]) # Exemplo de medidas de uma flor
predicao = model.predict(nova_amostra)
print(f'Classe prevista para a nova amostra: {dataset.target_names[predicao[0]]}')

2 respostas

por Evandro Santana Amadio

| 1474.2k xp | 3337 posts

Process Improvement Analyst

4 semanas atrás

Olá, Ronaldo. Como vai?

Parabéns por mais uma excelente implementação prática! Você utilizou o Dataset Iris, que é um dos pilares do aprendizado de máquina, para construir um classificador completo utilizando a biblioteca scikit-learn.

Sua abordagem técnica demonstra um domínio sólido das etapas de ciência de dados:

Manipulação de Dados: Você converteu o dataset para o formato Pandas, facilitando a separação entre atributos ($X$) e rótulos ($y$).
Boas Práticas de Avaliação: O uso do train_test_split para separar dados de treino e teste, somado à Validação Cruzada (cross_val_score), garante que a acurácia reportada seja confiável e não fruto de um acaso nos dados.
Modelo de Árvore de Decisão: A escolha do DecisionTreeClassifier é ideal para esse dataset, pois permite uma visualização lógica de como o modelo "decide" a espécie da flor com base nas medidas das pétalas e sépalas.
Inferência Prática: Criar uma nova_amostra para testar a previsão do modelo é a melhor forma de validar se o sistema está pronto para uso em um cenário real.

Como você já está confortável com a validação cruzada, uma sugestão interessante para seus próximos passos é explorar o ajuste de hiperparâmetros (como o max_depth da árvore). Isso ajuda a evitar o overfitting, garantindo que sua árvore de decisão não se torne complexa demais para generalizar novos dados!

Espero que possa ter lhe ajudado!

por Monalisa Meyrelle de Sousa Silva

| 4100.2k xp | 9441 posts

Alura Scuba Team

3 semanas atrás

Oi, Ronaldo e Evandro! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Ronaldo, você organizou muito bem as etapas do projeto, desde o carregamento do dataset Iris até a validação cruzada do modelo. Gostei também da forma como separou X e y, além de aplicar cross_val_score.

Continue assim!

Como você imagina utilizar modelos de machine learning em outros tipos de projetos no futuro?

Conteúdo relacionado:

ARTIGO

Direto ao ponto: o que é Machine Learning com exemplos reais

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

Fundamentos de IA

Carregar o dataset Iris da biblioteca sklearn

Converter para DataFrame do Pandas para facilitar a manipulação dos dados

Separar os atributos (X) e os rótulos (y)

Dividir os dados em conjunto de treino e teste (80% treino, 20% teste)

Criar e treinar um modelo de Árvore de Decisão

Fazer previsões nos dados de teste

Avaliar o desempenho do modelo

Aplicar validação cruzada para melhor avaliação do desempenho

Testar com uma nova amostra

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Carregar o dataset Iris da biblioteca sklearn

Converter para DataFrame do Pandas para facilitar a manipulação dos dados

Separar os atributos (X) e os rótulos (y)

Dividir os dados em conjunto de treino e teste (80% treino, 20% teste)

Criar e treinar um modelo de Árvore de Decisão

Fazer previsões nos dados de teste

Avaliar o desempenho do modelo

Aplicar validação cruzada para melhor avaliação do desempenho

Testar com uma nova amostra

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP