3
respostas

arquivo txt em tabela

Olá. tenho um arquivo .txt com algumas informações e queria transformar em uma tabela. Vou colocar parte do arquivo pra ficar mais fácil de compreender.

10000553, Adara Trindade Ayres Martins, 89.00 / 10000655, Adriano de Jesus Cardoso, 72.00 / 10000036, Adriano de Souza Braga, 134.00 / 10000541, Adriel de Aguiar Portela Moita, 115.00 / 10000070, Alan Lima Neves Salgado da Silva, 67.00 / 10001720, Alana dos Santos Vieira, 130.00 / 10000392, Alessandra de Souza Nascimento, 115.00 / 10001224, Alexander Leonard Martins Kellner, 38.00 / 10000020, Alexandre Castilho de Assis, 56.00 / 10001578, Alexandre Vaz Teixeira Junior, 90.00 / 10001008, Aline de Oliveira Cabral, 106.00 / 10001026, Aline Marques Costelha do Amaral, 128.00 / 10001308, Almerinda Alves de Oliveira, 87.00 / 10000362, Alvaro Emiliano Marcos, 56.00 / 10000039, Alvaro Gomes de Lima Junior, 59.00 / 10001311, Ana Aguiar Ribeiro, 37.00 / 10001655, Ana Beatriz Lopes Barbosa, 57.00 / 10001639, Ana Carolina Monteiro de Melo, 104.00 / 10000357, Ana Carolina Muniz Caracciolo de Moraes Talina, 89.00 / 10001012, Ana Carolina Pereira Figueiredo de Oliveira, 108.00 / 10000932, Ana Luiza Nanci Soares de Leal, 63.00 / 10001163, Ana Maria Costa Solis, 57.00 / 10000075, Ana Rosa da Costa, 14.00 / 10000231, Anderson Moreira Aguiar, 126.00 / 10000031, Andre Alexandre Assumpcao Fonseca, 26.00 / 10001267, Andre Alexandre Neves da Silva, 128.00 / 10000716, Andre Fabiano Guimaraes de Araujo, 116.00 / 10001582, Andre Gatti Bavuzo Celho Pereira, 65.00 / 10000760, Andre Marcos Carvalho Pereira, 50.00 / 10000345, Andre Mendes da Fonseca Ferraz, 61.00 / 10001530, Andre Renato Ramos da Silva, 88.00 / 10001584, Andre Silva Alves, 137.00 / 10000571, Andre Silva Fernandez Y Fernandez, 121.00 / 10000496, Andrei Herberth Rodrigues de Oliveira, 138.00 / 10001060, Andrezza Lopes Pessoa, 50.00 / 10000466, Angela Maria da Silva Arcanjo, 8.00 / 10001672, Angelo da Silva Oliveira, 129.00 / 10000539, Angelo Leal Barrozo, 129.00 / 10000319, Anna Carolina Antunes Madureira, 39.00 / 10001487, Anna Cintia Rocha Ximenes de Mendonca, 116.00 / 10001528, Antonio Miguel Lemgruber Chaves, 110.00 / 10000690, Arnaldo da Cunha Lobo Souto Maior, 96.00 / 10000065, Arthur Cesar Albuquerque de Sousa, 113.00 / 10000837, Arthur Pinel Berbert da Silva, 142.00 / 10001159, Arthur Rodrigues de Sousa Oliveira, 136.00 / 10000902, Arthur Trindade Gabriel, 54.00 / 10000478, Augusto Cesar Pinheiro dos Santos, 50.00 / 10001398, Aurea Lucia de Andrade Serafim Felipe, 72.00 / 10001160, Ayres da Costa Erthal, 70.00 / 10000245, Beatriz Felix do Nascimento, 15.00 / 10000229, Beatriz Fernandes Bezerra, 139.00 / 10000885, Beatriz Kropf de Camargo e Silva, 79.00 / 10000463, Bernardo dos Santos, 122.00 / 10001558, Breno Porto Pereira, 111.00 / 10000469, Bruno da Guia Silva, 108.00 / 10000275, Bruno Ferreira, 108.00 / 10001220, Bruno Ferreira Mattos, 136.00 / 10000137, Bruno Freire de Almeida, 122.00 / 10000945, Bruno Palermo,70.00 / 10001392, Bruno Pereira Santos, 121.00 / 10001675, Caique Cesar Dias Castro Oliveira, 77.00 / 10000721, Camila Alves Ribeiro, 97.00 / 10001117, Camila Correa de Rezende, 92.00 / 0000062, Camila Marcolino de Souza Ribeiro, 100.00 / 10001473, Carlos Alexandre Rufino da Silva, 73.00 / 10000109, Carlos Araujo, 90.00 / 10001551, Carlos Augusto Rachid Maia de Andrade, 102.00 / 10001155, Carlos Eduardo Dutra Curado, 72.00 / 10000363, Carlos Eduardo Ferreira de Souza, 58.00 /....

Os dados possuem um padrão: matrícula, nome, nota.

por onde posso iniciar?

3 respostas

Olá Carlos,

Eu vi que você fez os cursos de Python na plataforma. Agora sugiro que você faça os que envolvem a biblioteca pandas. Esses cursos vão te ajudar bastante nessa questão de lidar com tabelas.

No seu caso você pode ler o arquivo com os comandos:

import pandas as pd

df = pd.read_csv('arquivo.txt', header=None, sep=',')

Como a sua tabela não tem o nome das colunas você pode adicionar por exemplo através do comando:

df = df.rename(columns={0: 'ID', 1: 'Nome', 2: 'Pontuação'})

Por fim, você pode visualizar as primeiras linhas da tabela digitando:

df.head()

Muito obrigado pela ajuda! Ficou organizada mas estou com uma dúvida. Como posso retirar o caractere ' na coluna ID e Pontuação? Insira aqui a descrição dessa imagem para ajudar na acessibilidadeJá tentei utilizar o replace porém não obtive sucesso.

Para a coluna ID, por exemplo, você pode fazer:

df['ID'] = df['ID'].str.replace("'", "")

Em resumo, o método replace substitui um caractere dentro do texto da coluna.