Se o texto a ser analisado fosse em português vi que podemos usar tokenizer_language como argumento do data.Field.
Por exemplo: TEXT = data.Field(tokenize='spacy', tokenizer_language='???', include_lengths=True).
A dúvida é o que colocar para substituir essa interrogação?