Pensei que a resposta do exercício estava incorreta, mas ao rodar no meu colab funcionou, fiquei sem entender porque.
Questão:
Charlie está trabalhando com uma base de dados de clientes de uma loja.
clientes = np.array([[1, 'João', 30, 'Rua A', 100, 'eletrônicos'],
[2, 'Maria', 25, 'Rua B', 200, 'moda'],
[3, 'Pedro', 35, 'Rua C', 50, 'esportes']])
As quatro primeiras colunas representam dados pessoais dos clientes e ele não
pode usá-las na análise. Por isso, ele pretende construir um novo array de nome
intencao_compras para armazenar apenas as duas últimas colunas dos dados.
Qual comando ele deve utilizar para o resultado desejado?
O array possui 6 colunas, se é necessário trazer as duas últimas, seriam as colunas 5 e 6:
intencao_compras = clientes[:,4:]
Com isso retornaram as colunas da 5 em diante, com o 4 não incluso. A primeira duvida é que até aqui o 4 estaria incluso se observarmos os exemplos das aulas, já que os arrays sempre começaram por 0 e nós trouxemos a coluna 1 usando, por exemplo: "usecols=np.arange(1,88,1)" (da coluna 1 até 87)
A segunda duvida é que foram solicitadas duas alternativas corretas. E o que eu não entendi é como a outra alternativa pode estar correta...
intencao_compras = clientes[:,4:6]
Se o array possui 6 colunas e até o momento o professor tem reforçado que o ultimo número não está incluso e estamos usando o ultimo numero + 1, como pode essa solução também trazer as colunas 5 e 6 se o 6 não estava incluso?
Porque a logica foi invertida? De um código para outro a logica do ultimo numero não estar incluso passou a ser que o primeiro não estaria incluso. Não vi ele citar isso até o momento.