Introdução à Análise de Dados Espaciais

Introdução à Análise de Dados Espaciais

Geospatial Data Analysis

GeoDa é uma ferramenta Livre e Open Source (FOSS) que serve como uma introdução à análise de dados espaciais. Ele é projetado para facilitar novas idéias a partir de análise de dados, explorando e modelando padrões espaciais.

GeoDa foi desenvolvido pelo Dr. Luc Anseln e sua equipe. O programa fornece uma interface amigável e gráfica para os métodos de análise de dados espaciais exploratórios (ESDA), como estatísticas de autocorrelação espacial e análise de regressão espacial básica para dados de treliça¹ (pontos e polígonos). ¹lattice data

A versão mais recente 1.10 contém vários novos recursos de agrupamentos local (local cluster), incluindo mapas de cluster de Gear locais univariados e multivariados e várias técnicas clássicas de cluster não-espacial (análise de componentes principais, k-means e cluster hierárquico) implementadas na biblioteca de clusters em C  de Hoon et al. (2013).

GeoDa 1.10 também continua a oferecer suporte a mais formatos de arquivos espaciais, suporte total de dados espaço-temporais em todas as exibições, camadas basemap para todos os mapas, gráficos de médias, matrizes de plotagem de dispersão, autocorrelação espacial não-paramétrica (correlograma) e categorização de dados flexíveis.

Geographically Weighted Modelling

GWR4.09 já está disponível e substitui todas as versões anteriores. Esta versão do GWR é uma nova versão de aplicativo do Windows da ferramenta para modelar relacionamentos variando espacialmente entre variáveis, calibrando Regressão Geograficamente Ponderada (GWR) e Modelos Lineares Generalizados Ponderados Geograficamente (GWGLM) com suas variantes semiparamétricas.

A Regressão Geograficamente Ponderada é uma técnica para análise exploratória de dados espaciais.

Na regressão “normal”, assumimos que o relacionamento que estamos modelando é válido em toda a área de estudo – ou seja, os parâmetros de regressão são estatísticas de “mapa completo”.

Em muitas situações, este não é necessariamente o caso, pois o mapeamento dos resíduos (a diferença entre os dados observados e previstos) pode revelar. Muitas soluções diferentes foram propostas para lidar com a variação espacial no relacionamento. O GWR fornece um meio elegante e fácil de modelar tais relações.

Referências

http://spatial.uchicago.edu/geoda

http://gwr.maynoothuniversity.ie

https://gwrtools.github.io

STATSREF: Statistical Analysis Handbook

Geospatial Analysis – A comprehensive guide

Remoção da Tendência da Variável de Precipitação

Remoção da Tendência da Variável de Precipitação

La geoestadistica es ampliamente utilizada en diversas áreas de las ciencias con el objetivo de conocer la continuidad espacial del fenómeno en estudio. Un concepto importante de la geoestadistica son las variables regionalizadas. Una variable regionalizada es una función aleatoria, que varía de un lugar a otro con continuidad aparente, cuyas variaciones no pueden ser descritas por una función determinística, y son basadas en el concepto básico de hipótesis intrínseca. La hipótesis intrínseca requiere que la media y la semivariancia dependan únicamente de la distancia y orientación entre puntos, y no de la posición coordenada de los datos. Según Vieira et. al., (1983), cuando la hipótesis intrínseca no puede ser satisfecha es porque los datos tienen alguna tendencia, la cual debe ser removida antes de poder realizar cualquier aplicación geoestadistica.

La presencia o no de tendencia en una área de interese puede ser fácilmente verificada por la existencia de un sill en el variograma experimental, que es aproximadamente a la variancia a priori de los datos. La tendencia de los datos comúnmente es removida ajustando una superficie por el método de mínimos cuadrados.

En ese sentido, veremos un ejemplo de cómo remover la tendencia que presenta la variable precipitación (Figura 1). En la solución al problema, fue utilizada la herramienta surf.l del paquete library(spatial) del software estadístico R. Está herramienta fue utilizada dentro del software QGIS como una rutina de procesamiento.

Figura 1. Variograma experimental de la variable precipitación con tendencia.

La figura 2 muestra los datos originales al lado derecho y al lado izquierdo los residuales calculados, después de ajustar una superficie de tendencia de grado p = 2 a los datos. La superficie de tendencia ajustada es dada por:

donde  es la superficie de tendencia estimada, X e Y son las coordenada de los datos, y  y  son los parámetros estimados por el método de mínimos cuadrados.  Los coeficientes o parámetros de la superficie de tendencia se muestran en la tabla 1.

Figura 2. Localización de la variable precipitación en el estado de São Paulo-Brasil (Derecha) y los residuales de la variable precipitación después de ajustada la superficie de tendencia (Izquierda).

Tabla 1. Parámetros de la superficie de tendencia ajustada por el método de mínimos cuadrados.

La figura 3 ilustra la superficie de tendencia ajustada a los datos originales.  La figura 4 muestra el variograma experimental de los residuales después de removida la tendencia de la variable precipitación.

Figura 3. Superficie de tendencia ajustada por el método de mínimos cuadrados a la variable precipitación.
Figura 4. Variograma experimental de los residuos de la variable precipitación después de removida la tendencia de los datos.

Una vez removida la tendencia de la variable precipitación en el estado de São Paulo – Brasil, se procede a aplicar cualquier herramienta geoestadistica disponible en la literatura, por ejemplo, Krigagem Ordinaria.

Análise de Dados Espaciais no QGIS

Análise de Dados Espaciais no QGIS

Geoestatística

Gstat é um software livre de Geoestatística (atualmente ele foi transformado em um pacote do R).

Análise de Dados Espaciais no QGIS

  • Mapa de Localização

 

  • Análise Exploratória

  • Resultado do Cálculo do Variograma Experimental

  • Modelagem do Variograma

  • Krigagem Ordinária

Dados Amostrais

O Meuse é um conjunto de dados geoestatísticos clássico usado com freqüência pelo criador do pacote gstat para demonstrar várias etapas de análise geoestatística.
O conjunto de dados de pontos consiste em 155 amostras de concentrações de metais pesados do solo superficial (ppm), junto com um número de variáveis do solo e da paisagem.
As amostras foram coletadas em uma planície de inundação do rio Meuse, perto da vila Stein.

Referências

  1. Applied Spatial Data Analysis with R
  2. A Practical Guide to Geostatistical Mapping

Curso Análise de Dados Espaciais no QGIS

Objetivo: aula prática de interpolação de dados no QGIS;

Área de aplicação: solos, contaminação, ambiental, geoquímica, etc.;

Data: Setembro ou Outubro (ainda à definir);

Local: São Paulo – SP.

Inscrições: http://www.geosaber.com.br

Contato: sidney.goveia@geosaber.com.br

GEOKRIGE – Análise Geoestatística e Modelagem 3D

Lançamento do programa GEOKRIGE de Análise Geoestatística e Modelagem Geológica e Geotécnica 3D (tridimensional) no 48° Congresso Brasileiro de Geologia, em Porto Alegre – RS.

http://www.geokrigagem.com.br
  • Cálculo e Modelagem de Variogramas;
  • Krigagem Ordinária com Determinação de Incertezas;
  • Regularização de Sondagens por Bancadas e Down-the-Hole;

  • Modelagem Geológica com informação Estrutural das Litologias;

    • Edição Interativa de Seções Geológicas e Modelagem Implícita;

    • Visualização 3D com renderização otimizada dos Modelos de Blocos.

    QGIS e R

    A integração dos programas QGIS e R – Statistical Computing, é de tal maneira que se pode trabalhar com diversas ferramentas de um dentro de outro (Caixa de Processamento no QGIS ou o RQGIS no R).
    Um exemplo, é a aplicação de Geoestatística usando QGIS e R para produzir um mapa de predição por Krigagem Ordinária.

    Com as possibilidades de se programar scripts e plugins (complementos) no QGIS, estamos preparando um conjunto de ferramentas Geoestatísticas do R para serem usadas dentro do QGIS.

    Referências

    Seminário online sobre Geoestatística Aplicada

    MundoGEO e Oficina de Textos convidam você para participar de um seminário online sobre Geoestatística Aplicada.

    Com inscrições abertas e gratuitas, o webinar vai acontecer no dia 29 de abril, a partir das 14h30.
    Na palestra serão abordados os conceitos fundamentais da geoestatística, cálculo e modelagem de variogramas experimentais, estimativas geoestatísticas lineares e não lineares, erros e incertezas, simulações estocásticas e interpolação de variáveis categóricas com mapeamento da zona de incerteza, além de exemplos de aplicações.
    O palestrante será Jorge Kazuo Yamamoto, formado em Geologia pelo Instituto de Geociências – USP, em 1976. Geólogo pesquisador do IPT entre 1977-1989. Atualmente é professor titular do departamento de Geologia Sedimentar e Ambiental do Instituto de Geociências da USP.

    SADA – Spatial Analysis and Decision Assistance

    Spatial Analysis and Decision Assistance (SADA) é um programa gratuito que incorpora ferramentas do campo de avaliação ambiental em um ambiente de resolução de problemas eficaz.
    Essas ferramentas incluem módulos integrados para visualização, análise geoespacial, análise estatística, avaliação de risco à saúde humana, avaliação de risco ecológico, o custo / benefício, design de amostragem e análise de decisão.
    As capacidades do SADA podem ser usadas de forma independente ou em conjunto na caracterização de um sítio contaminado, avaliação de risco, determinando a localização das amostras futuras, e na concepção de medidas corretivas.
    Acessehttp://www.sadaproject.net

    Livro: Geoestatística, Conceitos e Aplicações

    "… leitura essencial para todos aqueles que procuram na Geoestatística um conjunto de instrumentos para resolver problemas concretos na gestão de recursos naturais. Geoestatística: conceitos e aplicações um forte componente pedagógico, conferindo a todos os temas abordados uma clareza de exposição e uma grande preocupação com os detalhes dos formalismos matemáticos e algoritmos. – Prof. Dr. Amilcar Soares – Diretor do Centre for Natural Resources and Environment (Cerena) do Instituto Superior Técnico (IST) da Universidade Técnica de Lisboa, Portugal.

    O livro aborda amostragem, inferência espacial e natureza das variáveis aleatórias; cálculo e modelagem de variogramas experimentais; técnicas geoestatísticas de estimativa e interpolação para variáveis aleatórias contínuas e discretas; coestimativas geoestatísticas; e simulação estocástica.
    Geoestatística destina-se a estudantes de Geologia, Geofísica, Engenharia de Minas, Agronomia, Oceanografia e Engenharia Florestal, assim como para profissionais e pesquisadores envolvidos na análise de dados geológicos ou georreferenciados."

    The Stanford Geostatistical Modeling Software (SGeMS)

    O Programa de Modelagem Geoestatística de Stanford (SGeMS) é um pacote de computador de código aberto para a solução de problemas que envolvem variáveis espacialmente  ​​relacionadas.
    Ele fornece aos praticantes de geoestatística uma interface amigável, uma visualização 3-D interativa, e uma grande variedade de algoritmos.

    A Editora da Universidade de Cambridge publicou o livro Applied Geostatistics with SGeMS que você pode adquirir em livrarias e pode baixar o CD com a base dados gratuitamente no próprio site do SGeMS {http://sgems.sourceforge.net}.
    Outra fonte excelente e gratuita é o Open File Report publicado pelo Ricardo Olea, da USGS:
    Olea, R.A., 2009, A practical primer on geostatistics: U.S. Geological Survey Open- File Report 2009-1103, 346 p. .