domingo, 2 de abril de 2017

Modelagem da localização nos modelos hedónicos


 Na estimação do valor dos imóveis por modelos hedónicos, as variáveis de localização são classificadas geralmente em variáveis de distância (para as características de acessibilidade) e variáveis de zonas homogéneas (para as características qualitativas de vizinhança), entre outras possíveis, como descritas a seguir.

As variáveis de tipo distância são consideradas em relação aos possíveis centros de valorização de uma região. A principal dificuldade de usar este tipo de variáveis reside em que a influência real destes factores pode ter um efeito geográfico limitado. A partir de certa distância, o efeito de um pólo valorizador pode ser nulo ou imperceptível. Definir a priori esta distância máxima é impossível sem uma análise empírica dos dados de mercado. Outra dificuldade está em modelar a forma de variação funcional do valor com a distância. As formas funcionais mais utilizadas são as seguintes: diminuição linear com a distância, diminuição logarítmica, inversa da distância, inversa da distância ao quadrado. A escolha entre estas formas requer uma análise dos dados de mercado, porém, muitas vezes, modelos são adoptados de forma arbitrária pelo avaliador.

Estes factores podem introduzir erros no modelo de regressão e falta de significância estatística de variáveis importantes. Outra limitação de usar variáveis de tipo distância a pólos de valorização é a possível multicolinearidade de variáveis independentes, pois geralmente uma mesma região tende a concentrar a presença de vários pólos de atractividade, conformando-se centros e subcentros de valorização; as variáveis de tipo distância podem estar então correlacionadas, impedindo a sua utilização como variáveis independentes na regressão.

As variáveis de tipo vizinhança ou zona homogénea definem-se para regiões teoricamente homogéneas quanto às suas características qualitativas de localização. Elas podem ser definidas com base em informações sociais, económicas, ambientais, e existem propostas de utilizar os SIG para a sua análise e definição (Silva et al., 2004). As limitações que apresentam este tipo de variáveis são as seguintes: a definição objectiva dos limites destas zonas, geralmente baseada em sectores definidos para outros objectivos; a validade da hipótese de homogeneidade no interior destas regiões, pois esta hipótese representa uma simplificação que pode ser excessiva; mesmo dividindo em regiões pequenas, a pergunta que subsiste é se elas podem ser consideradas com um valor de localização constante em todos os seus pontos. Do ponto de vista da aplicação deste conceito, vários estudos realizados utilizando variáveis de vizinhanças em modelos hedónicos, com amostras de grande tamanho, têm mostrado resultados positivos, trabalhando com um grande número de sectores homogéneos como variáveis dicotómicas. O uso de variáveis dicotómicas permite avaliar a média de valorização de cada região ou vizinhança. A principal dificuldade para poder usar este tipo de modelagem consiste em que são necessárias amostras de grande tamanho; para trabalhar com zonas realmente homogéneas as amostras devem conter centenas ou milhares de dados; tamanho disponível em muitas cidades dos Estados Unidos de América onde este método é utilizado, mas de difícil aquisição noutras partes do mundo.

Também são utilizadas variáveis socioeconómicas como variáveis proxy do valor da localização: renda média das famílias ou per capita, nível de escolaridade, entre outras, são definidas para regiões consideradas homogéneas; este tipo de variável apresenta as mesmas limitações do que as variáveis de zonas homogéneas: definição do suporte espacial e homogeneidade real.


As variáveis de tipo zona fiscal são semelhantes às zonas homogéneas (vide CIMI), criam-se zonas fiscais com um valor venal teoricamente homogéneo. Estas variáveis têm os erros provenientes dos cadastros existentes, que podem estar desactualizados ou mal calculados, além de existir o problema de definição de limites arbitrários para estas zonas.

Finalmente, existem também variáveis construídas por Análise Factorial: Análise de Componentes Principais ou Análise de Correspondências, a partir de um conjunto de variáveis que representam características da vizinhança ou socioeconómicas. Estas variáveis apresentam o mesmo problema de definição do suporte de medição, além da disponibilidade real de informação completa e abrangente. Entre as vantagens destas variáveis está a redução da dimensão localização a um número pequeno de factores, permitindo a sua utilização em modelos hedónicos para amostras de tamanho reduzido, dado que poucos factores possam expressar a informação contida numa grande quantidade de características de localização.

O problema do tamanho da amostra é um problema sério, inclusive onde existe disponibilidade para trabalhar com amostras de grande tamanho, pois acontece geralmente que alguns tipos de imóveis não sejam comercializados com tanta frequência. O caso mais comum é o caso de terrenos em áreas densamente urbanizadas. Geralmente, existem poucos terrenos livres, o que dificulta conseguir uma quantidade mínima de dados para poder modelar os efeitos de localização, por exemplo.

Segundo Chica Olmo (1994), os factores de localização afectam no mesmo sentido todos os imóveis de uma região, sejam terrenos ou construções, porém, o grau em que afectam o valor de cada tipo de imóvel pode ser diferente.

Peruzzo Trivelloni (1998), analisando uma amostra de mercado de apartamentos, comprova que os mesmos factores de localização, analisados para imóveis de características diferentes, podem ser significativos na explicação do valor de todos eles mas afectar de forma diferente a cada tipo de imóvel.
No mesmo sentido, Gloudemans (2002), considerando imóveis construídos e terrenos, argumenta que as variáveis de localização afectam todos os imóveis de forma semelhante, mas que o efeito sobre um e outro tipo de imóveis poderia ser proporcionalmente diferente, sendo que esta diferença pode ser modelada por meio da análise dos dados de mercado.

Em resumo, as limitações dos modelos hedónicos para a modelagem dos factores de localização são os seguintes:

– A consideração individual de cada factor de localização como uma variável independente do modelo provoca a necessidade de uma grande quantidade de observações como amostra, que geralmente é difícil de encontrar na prática.

– Dificuldade para enumerar e considerar todos os factores de localização influenciantes.

– Dificuldade para considerar o gradiente de variação de cada efeito e o seu alcance em distância. Erros na consideração do gradiente ou do alcance provocam autocorrelação espacial nos resíduos.

– Factores que não conseguem ser modelados significativamente também provocam autocorrelação espacial nos resíduos.

– Factores de localização são variáveis parcialmente correlacionadas e por este motivo a sua inclusão simultânea nos modelos de regressão não é possível.

As dificuldades de incorporar nos modelos hedónicos todas as variáveis de localização influenciantes determinam que os resíduos do modelo possam apresentar autocorrelação espacial: os resíduos de imóveis próximos, por estarem afectados pelas mesmas características de localização, estarão correlacionados.

A autocorrelação espacial dos resíduos invalida uma das hipóteses básicas dos modelos de regressão, que é a de ter resíduos não correlacionados.

Dubin (1988) propôs uma metodologia diferente para o tratamento das variáveis de localização. Ela sugeriu usar como variáveis explicativas da regressão apenas as características construtivas dos imóveis. Assim, os efeitos das variáveis de localização estarão embutidos nos resíduos do modelo. Calculando a média ponderada destes resíduos pode ser estimado o efeito de vizinhança. Desta forma, o modelo de regressão teria as seguintes variáveis explicativas: por um lado, as tradicionais variáveis construtivas dos imóveis: por outro lado, um polinómio formado pelas coordenadas dos imóveis, para conseguir a estacionariedade dos resíduos, e finalmente um termo obtido por krigagem dos resíduos que representaria os efeitos de localização não medidos pelas outras variáveis.

Segundo Can (1998) e Anselin (2001), diversas técnicas de análise exploratória de dados, como os testes de Moran, a análise de semivariogramas ou correlogramas podem ser utilizadas para avaliar a existência de autocorrelação espacial.

Segundo Anselin (1998a), as técnicas de análise exploratória de dados espaciais consistem numa série de técnicas para descrever e visualizar distribuições espaciais, descobrir padrões de associação espacial, sugerir regimes espaciais diferenciados e outras formas de não estacionariedade, e identificar observações atípicas. A descrição de distribuições espaciais está sendo gradualmente integrada com técnicas de gráficos dinâmicos incluindo mapas como forma adicional de visualização dos dados espaciais, em adição a box-plots, diagramas de dispersão e outras técnicas comuns de análise exploratória de dados.

As técnicas de análise exploratória de dados espaciais podem ser classificadas por duas vias: na primeira, segundo sejam medidas baseadas na vizinhança ou medidas baseadas na distância; na segunda, em função do nível de abrangência e podem ser classificadas em medidas globais ou locais de autocorrelação.

No caso de medidas baseadas na vizinhança, a interacção espacial é visualizada para um conjunto determinado de vizinhos. A interacção global dos vizinhos sobre um imóvel é obtida a partir da definição arbitrária de uma forma particular de processo espacial. Este enfoque requer a formalização de uma estrutura de vizinhança para cada observação na forma de uma matriz de pesos espaciais.

O outro ponto de vista, baseado na distância, tipicamente adoptado na geoestatística, assume a interacção espacial como uma função suavizada da distância entre pares de observações. Uma medida indispensável para poder calcular esta interacção será, então, a medida da distância entre cada par de observações. 

Sem comentários:

Enviar um comentário

Grato pela sua participação.