Na estimação do valor dos imóveis por modelos hedónicos, as
variáveis de localização são classificadas geralmente em variáveis de distância
(para as características de acessibilidade) e variáveis de zonas homogéneas
(para as características qualitativas de vizinhança), entre outras possíveis,
como descritas a seguir.
As variáveis de tipo distância são consideradas em relação
aos possíveis centros de valorização de uma região. A principal dificuldade de
usar este tipo de variáveis reside em que a influência real destes factores
pode ter um efeito geográfico limitado. A partir de certa distância, o efeito
de um pólo valorizador pode ser nulo ou imperceptível. Definir a priori esta
distância máxima é impossível sem uma análise empírica dos dados de mercado.
Outra dificuldade está em modelar a forma de variação funcional do valor com a
distância. As formas funcionais mais utilizadas são as seguintes: diminuição
linear com a distância, diminuição logarítmica, inversa da distância, inversa
da distância ao quadrado. A escolha entre estas formas requer uma análise dos
dados de mercado, porém, muitas vezes, modelos são adoptados de forma
arbitrária pelo avaliador.
Estes factores podem
introduzir erros no modelo de regressão e falta de significância estatística de
variáveis importantes. Outra limitação de usar variáveis de tipo distância a
pólos de valorização é a possível multicolinearidade de variáveis
independentes, pois geralmente uma mesma região tende a concentrar a presença
de vários pólos de atractividade, conformando-se centros e subcentros de
valorização; as variáveis de tipo distância podem estar então correlacionadas,
impedindo a sua utilização como variáveis independentes na regressão.
As variáveis de tipo
vizinhança ou zona homogénea definem-se para regiões teoricamente homogéneas
quanto às suas características qualitativas de localização. Elas podem ser
definidas com base em informações sociais, económicas, ambientais, e existem
propostas de utilizar os SIG para a sua análise e definição (Silva et al.,
2004). As limitações que apresentam este tipo de variáveis são as seguintes: a
definição objectiva dos limites destas zonas, geralmente baseada em sectores
definidos para outros objectivos; a validade da hipótese de homogeneidade no
interior destas regiões, pois esta hipótese representa uma simplificação que
pode ser excessiva; mesmo dividindo em regiões pequenas, a pergunta que
subsiste é se elas podem ser consideradas com um valor de localização constante
em todos os seus pontos. Do ponto de vista da aplicação deste conceito, vários
estudos realizados utilizando variáveis de vizinhanças em modelos hedónicos,
com amostras de grande tamanho, têm mostrado resultados positivos, trabalhando
com um grande número de sectores homogéneos como variáveis dicotómicas. O uso
de variáveis dicotómicas permite avaliar a média de valorização de cada região
ou vizinhança. A principal dificuldade para poder usar este tipo de modelagem
consiste em que são necessárias amostras de grande tamanho; para trabalhar com
zonas realmente homogéneas as amostras devem conter centenas ou milhares de
dados; tamanho disponível em muitas cidades dos Estados Unidos de América onde
este método é utilizado, mas de difícil aquisição noutras partes do mundo.
Também são utilizadas variáveis socioeconómicas como
variáveis proxy do valor da localização: renda média das famílias ou per
capita, nível de escolaridade, entre outras, são definidas para regiões
consideradas homogéneas; este tipo de variável apresenta as mesmas limitações do
que as variáveis de zonas homogéneas: definição do suporte espacial e
homogeneidade real.
As variáveis de tipo zona fiscal são semelhantes às
zonas homogéneas (vide CIMI), criam-se zonas fiscais com um valor venal teoricamente homogéneo.
Estas variáveis têm os erros provenientes dos cadastros existentes, que podem
estar desactualizados ou mal calculados, além de existir o problema de
definição de limites arbitrários para estas zonas.
Finalmente, existem também
variáveis construídas por Análise Factorial: Análise de Componentes Principais
ou Análise de Correspondências, a partir de um conjunto de variáveis que
representam características da vizinhança ou socioeconómicas. Estas variáveis
apresentam o mesmo problema de definição do suporte de medição, além da
disponibilidade real de informação completa e abrangente. Entre as vantagens
destas variáveis está a redução da dimensão localização a um número pequeno de
factores, permitindo a sua utilização em modelos hedónicos para amostras de
tamanho reduzido, dado que poucos factores possam expressar a informação
contida numa grande quantidade de características de localização.
O problema do tamanho da
amostra é um problema sério, inclusive onde existe disponibilidade para
trabalhar com amostras de grande tamanho, pois acontece geralmente que alguns
tipos de imóveis não sejam comercializados com tanta frequência. O caso mais
comum é o caso de terrenos em áreas densamente urbanizadas. Geralmente, existem
poucos terrenos livres, o que dificulta conseguir uma quantidade mínima de
dados para poder modelar os efeitos de localização, por exemplo.
Segundo Chica Olmo (1994), os factores de localização
afectam no mesmo sentido todos os imóveis de uma região, sejam terrenos ou
construções, porém, o grau em que afectam o valor de cada tipo de imóvel pode
ser diferente.
Peruzzo Trivelloni (1998),
analisando uma amostra de mercado de apartamentos, comprova que os mesmos
factores de localização, analisados para imóveis de características diferentes,
podem ser significativos na explicação do valor de todos eles mas afectar de
forma diferente a cada tipo de imóvel.
No mesmo sentido,
Gloudemans (2002), considerando imóveis construídos e terrenos, argumenta que
as variáveis de localização afectam todos os imóveis de forma semelhante, mas
que o efeito sobre um e outro tipo de imóveis poderia ser proporcionalmente
diferente, sendo que esta diferença pode ser modelada por meio da análise dos
dados de mercado.
Em resumo, as limitações
dos modelos hedónicos para a modelagem dos factores de localização são os
seguintes:
–
A consideração individual de cada factor de localização como uma variável
independente do modelo provoca a necessidade de uma grande quantidade de
observações como amostra, que geralmente é difícil de encontrar na prática.
–
Dificuldade para enumerar e considerar todos os factores de localização
influenciantes.
–
Dificuldade para considerar o gradiente de variação de cada efeito e o seu
alcance em distância. Erros na consideração do gradiente ou do alcance provocam
autocorrelação espacial nos resíduos.
–
Factores que não conseguem ser modelados significativamente também provocam
autocorrelação espacial nos resíduos.
–
Factores de localização são variáveis parcialmente correlacionadas e por este
motivo a sua inclusão simultânea nos modelos de regressão não é possível.
As dificuldades de incorporar nos modelos hedónicos todas
as variáveis de localização influenciantes determinam que os resíduos do modelo
possam apresentar autocorrelação espacial: os resíduos de imóveis próximos, por
estarem afectados pelas mesmas características de localização, estarão
correlacionados.
A autocorrelação espacial
dos resíduos invalida uma das hipóteses básicas dos modelos de regressão, que é
a de ter resíduos não correlacionados.
Dubin (1988) propôs uma
metodologia diferente para o tratamento das variáveis de localização. Ela
sugeriu usar como variáveis explicativas da regressão apenas as características
construtivas dos imóveis. Assim, os efeitos das variáveis de localização
estarão embutidos nos resíduos do modelo. Calculando a média ponderada destes
resíduos pode ser estimado o efeito de vizinhança. Desta forma, o modelo de
regressão teria as seguintes variáveis explicativas: por um lado, as
tradicionais variáveis construtivas dos imóveis: por outro lado, um polinómio
formado pelas coordenadas dos imóveis, para conseguir a estacionariedade dos
resíduos, e finalmente um termo obtido por krigagem dos resíduos que
representaria os efeitos de localização não medidos pelas outras variáveis.
Segundo Can (1998) e
Anselin (2001), diversas técnicas de análise exploratória de dados, como os
testes de Moran, a análise de semivariogramas ou correlogramas podem ser
utilizadas para avaliar a existência de autocorrelação espacial.
Segundo Anselin (1998a), as
técnicas de análise exploratória de dados espaciais consistem numa série de
técnicas para descrever e visualizar distribuições espaciais, descobrir padrões
de associação espacial, sugerir regimes espaciais diferenciados e outras formas
de não estacionariedade, e identificar observações atípicas. A descrição de
distribuições espaciais está sendo gradualmente integrada com técnicas de
gráficos dinâmicos incluindo mapas como forma adicional de visualização dos
dados espaciais, em adição a box-plots, diagramas de dispersão e outras
técnicas comuns de análise exploratória de dados.
As técnicas de análise exploratória de dados espaciais
podem ser classificadas por duas vias: na primeira, segundo sejam medidas
baseadas na vizinhança ou medidas baseadas na distância; na segunda, em função
do nível de abrangência e podem ser classificadas em medidas globais ou locais
de autocorrelação.
No caso de medidas baseadas na vizinhança, a interacção
espacial é visualizada para um conjunto determinado de vizinhos. A interacção
global dos vizinhos sobre um imóvel é obtida a partir da definição arbitrária
de uma forma particular de processo espacial. Este enfoque requer a formalização
de uma estrutura de vizinhança para cada observação na forma de uma matriz de
pesos espaciais.
O outro ponto de vista, baseado na distância, tipicamente
adoptado na geoestatística, assume a interacção espacial como uma função
suavizada da distância entre pares de observações. Uma medida indispensável
para poder calcular esta interacção será, então, a medida da distância entre
cada par de observações.