Apresentamos o último de nove artigos gentilmente disponibilizados pelo Eng. Mário Pinho Miranda, que versam uma temática muito importante para a abordagem de mercado, a inferência estatística. A literatura disponível para o perito avaliador de imóveis certificado sobre a inferência estatística aplicada à avaliação imobiliária é escassa.
Agradeço muito a colaboração prestada do Eng. Mário Pinho de Miranda, dizendo ainda que a porta estará sempre aberta para quando achar que deve usar este espaço.
Os oito primeiros artigos foram:
–A Amostra na Regressão Linear;
–A Capacidade Explicativa do Modelo
–A Significância Estatística de um Modelo de Regressão Linear
–Análise de Resíduos na avaliação de um modelo de regressão linear
–Variáveis Qualitativas na avaliação de imóveis
–Modelos Não-Lineares na avaliação de imóveis
–Seleção de regressores na avaliação imobiliária
–Intervalos de confiança na avaliação imobiliária
9 – Saneamento da Amostra
Mário Pinho Miranda
Resumo
O saneamento da amostra visa limpá-la das observações que perturbam o modelo. Os valores que os elementos amostrais perturbadores trazem para a análise são os valores suspeitos («outliers») e os valores influenciadores.
1. Introdução
A regressão linear é muito sensível a valores das variáveis explicadas que se afastem muito do conjunto médio dos seus valores, tornando obrigatório o saneamento da amostra sempre que isso aconteça. Devem considerar-se dois tipos diferentes de valores incomuns:
- Valores suspeitos, atípicos ou «outliers»;
- Valores influenciadores.
Vejamos em que consiste cada um deles.
2. Valores Suspeitos
Entende-se por valores suspeitos, atípicos ou «outliers» aqueles cujos resíduos são muito grandes e muito divergentes da maioria. Resíduos padronizados fora do intervalo [-2;2] podem considerar-se suspeitos em amostras pequenas (amostras de dimensão n <=20). Contudo, a eliminação imediata dos itens cujos valores não respeitem esta regra pode ser imprudente porque pode corresponder a situações em que a população de onde as amostras são extraídas tenha uma distribuição diferente da normal. Reforça-se a importância da análise dos gráficos de resíduos.
Na Figura 1 os elementos da amostra com os números #5 e #9 reúnem condições para serem considerados suspeitos porque os seus resíduos padronizados são superiores a 2 embora n = 25 > 20.
Uma vez que um elemento seja considerado suspeito deverá ser eliminado da amostra. Tenha–se em atenção que, por vezes, a eliminação dum elemento suspeito promove outros elementos a esta categoria!
3. Valores Influenciadores
Os valores influenciadores são aqueles que, embora com pequenos resíduos, correspondem a elementos da amostra cujos valores da variável explicativa são muito diferentes dos da restante amostra, influenciando desse modo a regressão.
A Figura 2 demonstra a existência de uma observação – elemento influenciador – cuja área é muito superior às áreas dos restantes elementos da amostra as quais se concentram entre os valores 150 e 200 m2. Se esse elemento for retirado da amostra obtém-se o gráfico da Figura 3. Comparando estes dois gráficos conclui-se que, na presença do elemento influenciador (Figura 2), a regressão dos preços sobre as áreas apresenta uma boa capacidade explicativa (R2=0,62) mas, ao ser eliminado esse elemento (Figura 3), a capacidade explicativa da regressão regride muito (R2 = 0,14). É óbvio que este tipo de elementos, que são denunciados com o recurso a estes gráficos, devem ser eliminados da amostra.
4. Referências
| [1] | M. P. MIRANDA e R. S. CAMPOSINHOS, Avaliação Imobiliária, Porto: Edição dos Autores, 2022. |



