#=========== AULA 1
Pergunta: 0 que afeta a qualidade do ar? Como?
install.packages("Ecdat") # se necessário
library(Ecdat) # carregando data(Airq) # carregando o banco de dados do pacote names(Airq) # exibe os nomes das variáveis
Descrevendo as variáveis
---------------------------------------------------------
airq: índice da qualidade do ar (quanto menor, melhor)
vala: valor das empresas nas cidades (milhares de dólares)
rain: quantidade de chuva (em polegadas)
coas: a posição costeira da cidade (sim ou não)
dens: densidade populacional nas cidades (milha quadrada)
medi: renda média per capita (dólares)
Análise descritiva ou exploratória
---------------------------------------------------------
summary(Airq) # sumário das variáveis
as variáveis podem ser contínuas ou categóricas (dívidas em categorias)
a variável resposta é a qualidade do ar (airq)
plot(airq~vala,data=Airq)
#=========== AULA 2
Criando um modelo estatístico
y (resposta) ~ x (explicativa)
y (crescimento da planta) ~ x (quantidade de adubo) + x (quantidade de luz)
y ~ x1 + x2 + x3
airq ~ vala + coas + rain
Montando o modelo
m2<-lm(airq~coas,data=Airq)
alguns dados podem não ser lineares
summary(m1) # para saber a significância do modelo plot(airq~vala,data=Airq) # plot de regressão linear
p-valor indica a significância do modelo ou da variável
se p-valor for menor (<) 0.05 a variável é significativa
se p-valor for maior que 0.05 não existe o efeito esperado
A variável "vala" não influenciou a qualidade do ar nas cidades ("airq")
Montando os modelos (lineares simples):
---------------------------------------------------------
m1
A variável (valor das empresas) 'vala' influencia a (qualidade do ar) 'airq'?
m1<-lm(airq~vala, data=Airq) # lm = modelo linear. m1 summary(m1)
p-value indica a significância do modelo, ou variável.
Se p-value < 0.05, existe significância (= < 5%).
Se p-value > 0.05, não existe significância.
NÃO, a variável 'vala' não influencia 'airq' (p-value = 0.07).
plot(airq~vala, data=Airq)
m2, com variável categórica (posição costeira)
A variável (posição costeira) 'coas' influencia a (qualidade do ar) 'airq'?
m2<-lm(airq~coas, data=Airq) m2 summary(m2)
SIM, a variável 'coas' influencia a 'airq'? (p-value = 0.005)
Mas o quanto? Vamos representar graficamente.
plot(airq~coas, data=Airq)
Cidades costeiras, nesta amostra, apresentam melhor 'airq'. Vide reta abaixo.
curve(125.333+-29.476*x, add=TRUE) # Retas para os modelos não significativos são opcionais.
m3
A variável (renda média per capita) 'medi' influencia a (qualidade do ar) 'airq'?
m3<-lm(airq~medi, data=Airq) m3 summary(m3)
NÃO, a variável 'medi' não influencia 'airq' (p-value = 0.18).
plot(airq~medi, data=Airq)
curve(9.936e+01+5.638e-04*x, add=TRUE) # opcional
m4
A variável (quantidade de chuva) 'rain' influencia a (qualidade do ar) 'airq'?
m4<-lm(airq~rain, data=Airq) m4 summary(m4)
NÃO, a variável 'rain' não influencia 'airq' (p-value = 0.8).
plot(airq~rain, data=Airq)
curve(106.6662+-0.0545*x, add=TRUE)
m5
A variável (densidade populacional) 'dens' influencia a (qualidade do ar) 'airq'?
m5<-lm(airq~dens, data=Airq) m5 summary(m5)
NÃO, a variável 'dens' não influencia 'airq' (p-value = 0.8).
plot(airq~dens, data=Airq)