A Estatística e
Análise Espacial incorpora cada vez mais os Sistemas de Informação Geográfica, incluindo
novos princípios e procedimentos de análise espacial, e existe o consenso na
comunidade científica de que alguns processos espaciais, principalmente aqueles
observados no ambiente urbano das grandes cidades, apresentam indexação no
espaço e trazem como característica comum a continuidade. Isto significa dizer
que esses valores variam de forma gradual numa determinada vizinhança ou região
de influência.
A associação de procedimentos de estatísticas
espaciais aos sistemas SIG é importante porque permite que novos modelos
inferenciais possam ser utilizados, incluindo uma informação importante: a
correlação espacial.
Para que se possa estimar a
correlação espacial, o estudo da geoestatística e seus conceitos básicos são de
extrema importância e envolve a análise e inferência de fenómeno espacial e/ou
temporal, tal como os preços de imóveis no mercado imobiliário.
A geoestatística teve a sua origem
na área de mineração (Krige, 1951) e actualmente está associada com uma classe
de técnicas usada para analisar e inferir valores de uma variável
regionalizada. Estes valores, nestes estudos representados pelos preços dos
imóveis, o consumo habitacional e a procura por habitação, estão implicitamente
correlacionados uns com os outros, e o estudo de tal correlação é denominada de
análise estrutural ou modelagem do variograma. A construção do variograma
permite realizar a análise estrutural e inferências em localizações não
amostradas, que são realizadas usando "Krigagem" ou a regressão espacial com a matriz de espacialidade.
Resumidamente, os passos num estudo de mercado imobiliário empregando técnicas geoestatísticas incluem a análise exploratória dos dados, a
análise estrutural (cálculo e modelagem do variograma) e a realização de
inferências (Krigagem ou Regressão Espacial).
A conceituação das técnicas de geoestatística está fundamentada na Teoria das Variáveis Regionalizadas,
desenvolvida por Matheron (1963, 1971). A variável regionalizada é uma variável
distribuída no espaço (ou tempo), como o preço dos imóveis no mercado
imobiliário. As estimativas podem ser realizadas através de uma função
aleatória (ou processo aleatório, ou processo estocástico). Esta teoria
consolida o alicerce da geoestatística.
No trabalho apresentado por Anselin (1998) é demonstrado
que existem dois tipos de efeitos que podem ser encontrados nos dados
distribuídos espacialmente: o efeito causado pela heterogeneidade espacial e
pela autocorrelação ou dependência espacial. O primeiro diz respeito à
instabilidade dos parâmetros em relação à macro-região em que se situam os
dados e, na ausência de dependência espacial, podem ser tratados pela
metodologia tradicional; o segundo efeito diz respeito a uma interacção
espacial entre os dados colectados e distribuídos espacialmente e que pode
afectar a componente do erro aleatório, a variável dependente em estudos ou
ambos.
Neste caso, a econometria espacial é adequada para realizar
estimativas seguras dos parâmetros do modelo. Os efeitos de autocorrelação
espacial no termo erro devem ser tratados pelos Modelos de Erros Espaciais,
através da inclusão e um factor de defasagem espacial nos erros aleatórios do Modelo
Clássico de Regressão.
Enquanto os
efeitos de dependência entre os preços de cada imóvel e os preços dos imóveis
vizinhos devem ser tratados pelos Modelos de Defasagem Espacial, onde se inclui
uma variável dependente espacialmente defasada, como variável explicativa no
modelo Modelo Clássico de Regressão.
Existem duas maneiras de se
diagnosticar a presença de efeitos de dependência espacial numa amostra: pela
análise gráfica do variograma ou utilizando-se testes estatísticos específicos
como os testes de Moran I e os testes LM Robusto (erro) e LM Robusto (defasagem). No primeiro caso, a inferência
espacial é realizada pelo processo denominado de Krigagem (Método de estimação,
por interpolação, que considera a distância entre os dados distribuídos
espacialmente, e no segundo caso, a modelagem espacial é realizada conforme a
metodologia desenvolvida por Anselin (1988).
Para diagnosticar a
presença de efeitos de dependência espacial, bem como introduzir estes efeitos
no modelo de regressão linear, pela metodologia desenvolvida por Anselin, é
necessário definir, previamente, uma matriz de pesos espaciais, conhecida como
W. A construção desta matriz requer cuidados especiais. A abordagem mais
simples é feita com a construção de uma matriz simétrica W em que cada elemento
wij, é igual a 1(um) se i e j são vizinhos e igual a zero no caso contrário.
Por convenção, os elementos diagonais são iguais a zero, ou seja, wii
= 0. Uma segunda abordagem leva em consideração a importância dos vizinhos
através de uma ponderação correspondente ao inverso da distância ou ao inverso
do quadrado da distância entre eles. Normalmente, esta distância é calculada
com base nas coordenadas geográficas dos imóveis que compõe a amostra, medidas
em UTM. Cuidado especial deve ser dado quando existirem, na amostra de bens do
mercado imobiliário, imóveis localizados num mesmo edifício. Nesta
circunstância, a distância calculada utilizando as coordenadas geográficas será
igual a zero, o que contradiz a lógica de mercado. Apartamentos situados num
mesmo edifício possuem uma alta correlação espacial e a distância entre estes
imóveis deve ser medida na vertical.
Em geral, a matriz W é
padronizada por linha, onde cada elemento de W, representado por Wsij,
é obtido dividindo-se Wij pela soma dos elementos da linha i a que
pertence.
Nesta matriz, os elementos
das linhas somam 1. Este procedimento, além de facilitar a interpretação dos
pesos, como uma média ponderada dos valores dos vizinhos, assegura a
compatibilidade entre os modelos (Anselin e Bera, 1998). O argumento principal
a favor do uso de uma matriz de peso espacial é que esta associa uma variável
em certo ponto do espaço (preço dos imóveis para o mercado de habitação) às
observações da mesma variável noutros lugares do espaço. Nos estudos do mercado
imobiliário é utilizada a notação W para a matriz de pesos espaciais ponderada
por linha, calculada com base no inverso da distância entre os imóveis, para os
modelos de preços hedónicos.
Os principais testes utilizados para detectar a
autocorrelação espacial são Moran I, LM Robusto (erro) e LM Robusto
(defasagem). O teste de Moran I é o mais usado nos estudos de dados de corte
transversal de unidades geográficas. O problema deste teste é que ele não
identifica o tipo de efeito (erro ou defasagem espacial). Por isso, serão
utilizados testes mais específicos: o LM (erro) Robusto, para detectar efeitos
de autocorrelação espacial no termo de erro; e o LM (defasagem) Robusto, para
verificar a presença de efeitos de defasagem espacial na variável dependente. É
importante frisar que a validade destes testes exige a aceitação das hipóteses
de normalidade e homocedasticidade dos resíduos de MQQ – Método dos Mínimos
Quadrados, obtidos pelo modelo de regressão linear.
A autocorrelação espacial
no termo de erro está relacionada a erros de medida ocasionados pelas divisões
artificiais das unidades geográficas, como os limites estabelecidos para os
bairros ou regiões consideradas homogéneas de uma cidade, que não
necessariamente coincidem com a realidade estudada. Isto é, na prática, o
consumidor não tem o conhecimento exacto dos limites que dividem os bairros ou
regiões. No mercado habitacional há uma tendência de efeito de transbordamento
de um bairro de maior importância sobre os seus vizinhos. Outro factor que pode
gerar a autocorrelação espacial nos erros é a omissão de variáveis de localização relevantes, nomeadamente as variáveis de microlocalização. Para tratar
adequadamente este tipo de efeito espacial nos dados, será necessário considerar
o processo espacial auto-regressivo no termo de erro. Quando os erros são
autocorrelacionados espacialmente, os parâmetros estimados pelo modelo de
regressão linear são não eficientes, isto é, os desvios-padrões que se
encontram associados a eles são tendenciosos. Assim, os testes de
hipóteses e os intervalos de confiança construídos não são confiáveis nem
válidos e os resultados obtidos a partir deles são enganosos.
Cada elemento WYi,
do vector WY é formado por uma ponderação dos preços dos imóveis vizinhos. Esta
variável serve também para captar os efeitos de dependência espacial não
considerados explicitamente nas variáveis locacionais comummente utilizadas,
como questões ligadas à segurança, saúde e educação (Dantas, 2001). A
introdução do termo de defasagem espacial, como variável explicativa, serve
como “proxy” para as variáveis independentes omitidas que estão correlacionadas
com as características locacionais (Pace, Barry e Sirmams, 1998).
Tendo em vista que a
variável WY é aleatória, a estimação por MQO não é adequada, porque viola um
dos pressupostos básicos do Modelo Clássico de Regressão Linear: as variáveis
não devem conter nenhuma perturbação aleatória.
Uma maneira de escolher o
modelo a adoptar – o Modelo de Erro espacial ou o Modelo de Defasagem Espacial
– pode ser feita pela comparação do valor absoluto das estatísticas LM Robusto
para o erro e defasagem. Assim, quanto maior for o valor encontrado na
estatística de teste, maior será o efeito espacial correspondente a esta
estatística, conforme argumento de Anselin e Rey (1991).
Sem comentários:
Enviar um comentário
Grato pela sua participação.