Apresentamos o último de nove artigos gentilmente disponibilizados pelo Eng. Mário Pinho Miranda, que versam uma temática muito importante para a abordagem de mercado, a inferência estatística. A literatura disponível para o perito avaliador de imóveis certificado sobre a inferência estatística aplicada à avaliação imobiliária é escassa.

Agradeço muito a colaboração prestada do Eng. Mário Pinho de Miranda, dizendo ainda que a porta estará sempre aberta para quando achar que deve usar este espaço.

Os oito primeiros artigos foram:

A Amostra na Regressão Linear;

A Capacidade Explicativa do Modelo

A Significância Estatística de um Modelo de Regressão Linear

Análise de Resíduos na avaliação de um modelo de regressão linear

Variáveis Qualitativas na avaliação de imóveis

Modelos Não-Lineares na avaliação de imóveis

Seleção de regressores na avaliação imobiliária

Intervalos de confiança na avaliação imobiliária

9 – Saneamento da Amostra

Mário Pinho Miranda

 Resumo

O saneamento da amostra visa limpá-la das observações que perturbam o modelo. Os valores que os elementos amostrais perturbadores trazem para a análise são os valores suspeitos («outliers») e os valores influenciadores.

1. Introdução

A regressão linear é muito sensível a valores das variáveis explicadas que se afastem muito do conjunto médio dos seus valores, tornando obrigatório o saneamento da amostra sempre que isso aconteça. Devem considerar-se dois tipos diferentes de valores incomuns:

  1. Valores suspeitos, atípicos ou «outliers»;
  2. Valores influenciadores.

Vejamos em que consiste cada um deles.

2. Valores Suspeitos

Entende-se por valores suspeitosatípicos ou «outliers» aqueles cujos resíduos são muito grandes e muito divergentes da maioria. Resíduos padronizados fora do intervalo [-2;2] podem considerar-se suspeitos em amostras pequenas (amostras de dimensão n <=20). Contudo, a eliminação imediata dos itens cujos valores não respeitem esta regra pode ser imprudente porque pode corresponder a situações em que a população de onde as amostras são extraídas tenha uma distribuição diferente da normal. Reforça-se a importância da análise dos gráficos de resíduos.

Na Figura 1 os elementos da amostra com os números #5 e #9 reúnem condições para serem considerados suspeitos porque os seus resíduos padronizados são superiores a 2 embora n = 25 > 20.

Uma vez que um elemento seja considerado suspeito deverá ser eliminado da amostra. Tenha–se em atenção que, por vezes, a eliminação dum elemento suspeito promove outros elementos a esta categoria!

3. Valores Influenciadores

Os valores influenciadores são aqueles que, embora com pequenos resíduos, correspondem a elementos da amostra cujos valores da variável explicativa são muito diferentes dos da restante amostra, influenciando desse modo a regressão.

A Figura 2 demonstra a existência de uma observação – elemento influenciador – cuja área é muito superior às áreas dos restantes elementos da amostra as quais se concentram entre os valores 150 e 200 m2. Se esse elemento for retirado da amostra obtém-se o gráfico da Figura 3. Comparando estes dois gráficos conclui-se que, na presença do elemento influenciador (Figura 2), a regressão dos preços sobre as áreas apresenta uma boa capacidade explicativa (R2=0,62) mas, ao ser eliminado esse elemento (Figura 3), a capacidade explicativa da regressão regride muito (R= 0,14). É óbvio que este tipo de elementos, que são denunciados com o recurso a estes gráficos, devem ser eliminados da amostra.

blank

4. Referências

[1] M. P. MIRANDA e R. S. CAMPOSINHOS, Avaliação Imobiliária, Porto: Edição dos Autores, 2022.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *