sexta-feira, 21 de abril de 2017

Estatística Espacial na Avaliação Imobiliária


A Estatística e Análise Espacial incorpora cada vez mais os Sistemas de Informação Geográfica, incluindo novos princípios e procedimentos de análise espacial, e existe o consenso na comunidade científica de que alguns processos espaciais, principalmente aqueles observados no ambiente urbano das grandes cidades, apresentam indexação no espaço e trazem como característica comum a continuidade. Isto significa dizer que esses valores variam de forma gradual numa determinada vizinhança ou região de influência.

 A associação de procedimentos de estatísticas espaciais aos sistemas SIG é importante porque permite que novos modelos inferenciais possam ser utilizados, incluindo uma informação importante: a correlação espacial.

Para que se possa estimar a correlação espacial, o estudo da geoestatística e seus conceitos básicos são de extrema importância e envolve a análise e inferência de fenómeno espacial e/ou temporal, tal como os preços de imóveis no mercado imobiliário.

A geoestatística teve a sua origem na área de mineração (Krige, 1951) e actualmente está associada com uma classe de técnicas usada para analisar e inferir valores de uma variável regionalizada. Estes valores, nestes estudos representados pelos preços dos imóveis, o consumo habitacional e a procura por habitação, estão implicitamente correlacionados uns com os outros, e o estudo de tal correlação é denominada de análise estrutural ou modelagem do variograma. A construção do variograma permite realizar a análise estrutural e inferências em localizações não amostradas, que são realizadas usando "Krigagem" ou a regressão espacial com a matriz de espacialidade.

Resumidamente, os passos num estudo de mercado imobiliário empregando técnicas geoestatísticas incluem a análise exploratória dos dados, a análise estrutural (cálculo e modelagem do variograma) e a realização de inferências (Krigagem ou Regressão Espacial).
A conceituação das técnicas de geoestatística está fundamentada na Teoria das Variáveis Regionalizadas, desenvolvida por Matheron (1963, 1971). A variável regionalizada é uma variável distribuída no espaço (ou tempo), como o preço dos imóveis no mercado imobiliário. As estimativas podem ser realizadas através de uma função aleatória (ou processo aleatório, ou processo estocástico). Esta teoria consolida o alicerce da geoestatística.
No trabalho apresentado por Anselin (1998) é demonstrado que existem dois tipos de efeitos que podem ser encontrados nos dados distribuídos espacialmente: o efeito causado pela heterogeneidade espacial e pela autocorrelação ou dependência espacial. O primeiro diz respeito à instabilidade dos parâmetros em relação à macro-região em que se situam os dados e, na ausência de dependência espacial, podem ser tratados pela metodologia tradicional; o segundo efeito diz respeito a uma interacção espacial entre os dados colectados e distribuídos espacialmente e que pode afectar a componente do erro aleatório, a variável dependente em estudos ou ambos.

Neste caso, a econometria espacial é adequada para realizar estimativas seguras dos parâmetros do modelo. Os efeitos de autocorrelação espacial no termo erro devem ser tratados pelos Modelos de Erros Espaciais, através da inclusão e um factor de defasagem espacial nos erros aleatórios do Modelo Clássico de Regressão.

Enquanto os efeitos de dependência entre os preços de cada imóvel e os preços dos imóveis vizinhos devem ser tratados pelos Modelos de Defasagem Espacial, onde se inclui uma variável dependente espacialmente defasada, como variável explicativa no modelo Modelo Clássico de Regressão.

Existem duas maneiras de se diagnosticar a presença de efeitos de dependência espacial numa amostra: pela análise gráfica do variograma ou utilizando-se testes estatísticos específicos como os testes de Moran I e os testes LM Robusto (erro) e LM Robusto (defasagem). No primeiro caso, a inferência espacial é realizada pelo processo denominado de Krigagem (Método de estimação, por interpolação, que considera a distância entre os dados distribuídos espacialmente, e no segundo caso, a modelagem espacial é realizada conforme a metodologia desenvolvida por Anselin (1988).

Para diagnosticar a presença de efeitos de dependência espacial, bem como introduzir estes efeitos no modelo de regressão linear, pela metodologia desenvolvida por Anselin, é necessário definir, previamente, uma matriz de pesos espaciais, conhecida como W. A construção desta matriz requer cuidados especiais. A abordagem mais simples é feita com a construção de uma matriz simétrica W em que cada elemento wij, é igual a 1(um) se i e j são vizinhos e igual a zero no caso contrário. Por convenção, os elementos diagonais são iguais a zero, ou seja, wii = 0. Uma segunda abordagem leva em consideração a importância dos vizinhos através de uma ponderação correspondente ao inverso da distância ou ao inverso do quadrado da distância entre eles. Normalmente, esta distância é calculada com base nas coordenadas geográficas dos imóveis que compõe a amostra, medidas em UTM. Cuidado especial deve ser dado quando existirem, na amostra de bens do mercado imobiliário, imóveis localizados num mesmo edifício. Nesta circunstância, a distância calculada utilizando as coordenadas geográficas será igual a zero, o que contradiz a lógica de mercado. Apartamentos situados num mesmo edifício possuem uma alta correlação espacial e a distância entre estes imóveis deve ser medida na vertical.

Em geral, a matriz W é padronizada por linha, onde cada elemento de W, representado por Wsij, é obtido dividindo-se Wij pela soma dos elementos da linha i a que pertence.

Nesta matriz, os elementos das linhas somam 1. Este procedimento, além de facilitar a interpretação dos pesos, como uma média ponderada dos valores dos vizinhos, assegura a compatibilidade entre os modelos (Anselin e Bera, 1998). O argumento principal a favor do uso de uma matriz de peso espacial é que esta associa uma variável em certo ponto do espaço (preço dos imóveis para o mercado de habitação) às observações da mesma variável noutros lugares do espaço. Nos estudos do mercado imobiliário é utilizada a notação W para a matriz de pesos espaciais ponderada por linha, calculada com base no inverso da distância entre os imóveis, para os modelos de preços hedónicos.

Os principais testes utilizados para detectar a autocorrelação espacial são Moran I, LM Robusto (erro) e LM Robusto (defasagem). O teste de Moran I é o mais usado nos estudos de dados de corte transversal de unidades geográficas. O problema deste teste é que ele não identifica o tipo de efeito (erro ou defasagem espacial). Por isso, serão utilizados testes mais específicos: o LM (erro) Robusto, para detectar efeitos de autocorrelação espacial no termo de erro; e o LM (defasagem) Robusto, para verificar a presença de efeitos de defasagem espacial na variável dependente. É importante frisar que a validade destes testes exige a aceitação das hipóteses de normalidade e homocedasticidade dos resíduos de MQQ – Método dos Mínimos Quadrados, obtidos pelo modelo de regressão linear.

A autocorrelação espacial no termo de erro está relacionada a erros de medida ocasionados pelas divisões artificiais das unidades geográficas, como os limites estabelecidos para os bairros ou regiões consideradas homogéneas de uma cidade, que não necessariamente coincidem com a realidade estudada. Isto é, na prática, o consumidor não tem o conhecimento exacto dos limites que dividem os bairros ou regiões. No mercado habitacional há uma tendência de efeito de transbordamento de um bairro de maior importância sobre os seus vizinhos. Outro factor que pode gerar a autocorrelação espacial nos erros é a omissão de variáveis de localização relevantes, nomeadamente as variáveis de microlocalização. Para tratar adequadamente este tipo de efeito espacial nos dados, será necessário considerar o processo espacial auto-regressivo no termo de erro. Quando os erros são autocorrelacionados espacialmente, os parâmetros estimados pelo modelo de regressão linear são não eficientes, isto é, os desvios-padrões que se encontram associados a eles são tendenciosos. Assim, os testes de hipóteses e os intervalos de confiança construídos não são confiáveis nem válidos e os resultados obtidos a partir deles são enganosos.

O efeito de defasagem espacial é ocasionado pela dependência espacial criada como consequência da interacção espacial entre os preços dos imóveis, conhecido como “efeito de vizinhança” (Dantas, 2001). Quando um comprador e um vendedor realizam a transacção de um imóvel, eles não somente levam em consideração as suas características estruturais e locacionais, mas também são influenciados pelos preços dos imóveis vizinhos. Neste caso, esta influência é medida pela inclusão de uma variável adicional no modelo dada por W × Y, sendo W a matriz de pesos espaciais e Y o vector de preços dos imóveis, que é a variável dependente espacialmente defasada (Anselin, 1998).
Cada elemento WYi, do vector WY é formado por uma ponderação dos preços dos imóveis vizinhos. Esta variável serve também para captar os efeitos de dependência espacial não considerados explicitamente nas variáveis locacionais comummente utilizadas, como questões ligadas à segurança, saúde e educação (Dantas, 2001). A introdução do termo de defasagem espacial, como variável explicativa, serve como “proxy” para as variáveis independentes omitidas que estão correlacionadas com as características locacionais (Pace, Barry e Sirmams, 1998).

Tendo em vista que a variável WY é aleatória, a estimação por MQO não é adequada, porque viola um dos pressupostos básicos do Modelo Clássico de Regressão Linear: as variáveis não devem conter nenhuma perturbação aleatória.

Uma maneira de escolher o modelo a adoptar – o Modelo de Erro espacial ou o Modelo de Defasagem Espacial – pode ser feita pela comparação do valor absoluto das estatísticas LM Robusto para o erro e defasagem. Assim, quanto maior for o valor encontrado na estatística de teste, maior será o efeito espacial correspondente a esta estatística, conforme argumento de Anselin e Rey (1991).


Sem comentários:

Enviar um comentário

Grato pela sua participação.