Refiz o seu código para pular as 3 primeiras linhas e remover a coluna vazia (era a primeira coluna correto?).
O maior problema parece ser o encoding dos arquivos, utilizando windows-1252
tive muitos problemas ao tentar manipular o texto, depois de alguns testes consegui melhores resultados utilizando o encoding UTF-16
, esse parece ser o formato do seu arquivo. Ainda assim teve um caractere estranho que teve que ser removido manualmente de cada linha, o caractere "ഀ"
, infelizmente não conheço muito sobre os encodings para encontrar uma solução ideal, mas o código abaixo deve funcionar para fazer a limpeza.
Você está utilizando qual versão do python? O código que eu fiz é baseado no python 3, e pode apresentar problemas em versões anteriores.
Segue o código:
with open('ZV_R0051.txt', mode="r", encoding="UTF-16") as sourceFile, open('ZVCSV.csv', mode="w", encoding="UTF-16") as targetFile:
# Pula as 3 primeiras linhas
next(sourceFile)
next(sourceFile)
next(sourceFile)
# Executa esse código do for para cada linha do arquivo
for line in sourceFile:
if len(line.strip("ഀ").strip()) > 0:
# O [:-2] foi a forma que eu encontrei de remover o caractere extra
targetFile.write(line.strip()[:-2])
targetFile.write("\n")
Espero que isso ajude, se tiver qualquer dúvida ou problema é só falar!