Olá,
Gostaria de saber como devo proceder com o preenchimento do meu dataframe para a análises de dados na seguinte situação hipotética abaixo:
Situação:
Estou elaborando um dataframe com informações sobre pacientes que usam e não usam uma medicação para tratamento de uma doença, para isso, uma das colunas do dataframe conterá esta informação (resposta sim ou não).
Haverá diversas outras colunas com dados sobre a doença e** colunas exclusivas para registar informações sobre o modo de uso da medicação**.
Assim, as linhas de cada paciente do dataframe relativas às maneiras de uso da medicação só serão preenchidas pelos pacientes que reponderam "sim" na coluna de uso da medicação.
Isso resultará em valores NaN para todas as colunas contendo as características de uso da medicação apenas para os pacientes que reponderam "não" ao uso do medicamento.
Observação: Os registros dos pacientes estão na linha enquanto as informações relativas à doença dele e ao medicamento estão na coluna do dataframe.
Minha dúvida:
Deverei deixar os valores nulos no meu dataframe ou incluir algum tipo de dado (string, booleano ou numérico) que indique que os dados para aquele paciente naquela coluna não serão preenchidos?