Introdução à Análise de Dados Espaciais

Introdução à Análise de Dados Espaciais

Geospatial Data Analysis

GeoDa é uma ferramenta Livre e Open Source (FOSS) que serve como uma introdução à análise de dados espaciais. Ele é projetado para facilitar novas idéias a partir de análise de dados, explorando e modelando padrões espaciais.

GeoDa foi desenvolvido pelo Dr. Luc Anseln e sua equipe. O programa fornece uma interface amigável e gráfica para os métodos de análise de dados espaciais exploratórios (ESDA), como estatísticas de autocorrelação espacial e análise de regressão espacial básica para dados de treliça¹ (pontos e polígonos). ¹lattice data

A versão mais recente 1.10 contém vários novos recursos de agrupamentos local (local cluster), incluindo mapas de cluster de Gear locais univariados e multivariados e várias técnicas clássicas de cluster não-espacial (análise de componentes principais, k-means e cluster hierárquico) implementadas na biblioteca de clusters em C  de Hoon et al. (2013).

GeoDa 1.10 também continua a oferecer suporte a mais formatos de arquivos espaciais, suporte total de dados espaço-temporais em todas as exibições, camadas basemap para todos os mapas, gráficos de médias, matrizes de plotagem de dispersão, autocorrelação espacial não-paramétrica (correlograma) e categorização de dados flexíveis.

Geographically Weighted Modelling

GWR4.09 já está disponível e substitui todas as versões anteriores. Esta versão do GWR é uma nova versão de aplicativo do Windows da ferramenta para modelar relacionamentos variando espacialmente entre variáveis, calibrando Regressão Geograficamente Ponderada (GWR) e Modelos Lineares Generalizados Ponderados Geograficamente (GWGLM) com suas variantes semiparamétricas.

A Regressão Geograficamente Ponderada é uma técnica para análise exploratória de dados espaciais.

Na regressão “normal”, assumimos que o relacionamento que estamos modelando é válido em toda a área de estudo – ou seja, os parâmetros de regressão são estatísticas de “mapa completo”.

Em muitas situações, este não é necessariamente o caso, pois o mapeamento dos resíduos (a diferença entre os dados observados e previstos) pode revelar. Muitas soluções diferentes foram propostas para lidar com a variação espacial no relacionamento. O GWR fornece um meio elegante e fácil de modelar tais relações.

Referências

http://spatial.uchicago.edu/geoda

http://gwr.maynoothuniversity.ie

https://gwrtools.github.io

STATSREF: Statistical Analysis Handbook

Geospatial Analysis – A comprehensive guide

Mapas de Densidade de Pontos no R

Mapas de Densidade de Pontos no R

Construindo Mapas de Densidade de Pontos com Dados do Censo do Reino Unido no R

Paul Campbell publicou em seu blog um tutorial de construção de Mapa de Densidade de Pontos (a partir de dados censitários do Reino Unido) no R – Linguagem Computacional de Estatística.

Essa é uma das melhores formas de representação em mapas de dados estatísticos.

Referências

Culture of Insight: Building Dot Density Maps with UK Census Data in R

Revolutions – Daily news about using open source R for big data analysis, predictive modeling, data science, and visualization since 2008.

QGIS plugin for hotspot analysis

Mapas de calor (Heat Map) são uma das melhores ferramentas de visualização de dados de densidade de pontos. Mapas de calor são utilizados para identificar facilmente aglomerados e encontrar onde existe uma elevada concentração de uma determinada atividade. Eles também são úteis para fazer análises de agrupamentos (cluster) ou análise de pontos quentes (hotspot analysis).¹

Para demonstrar a aplicação dessas análises, vamos usar o famoso “Mapa da Cólera em Londres – 1854 de John Snow” (esse sabia muito!).¹¹

No QGIS 2.18 Las Palmas de G.C. é possível criar um Mapa de Calor diretamente no Estilo da Camada (de Pontos), sem precisar usar o complemento Mapa de Calor (que cria um raster).

Com isso se tem a interpolação dos Pontos pela distância (o raio é a distância mínima da influência do ponto com os pontos vizinhos) e ponderada pela contagem (atributo) de ocorrências.³

Análise de Hotspot no QGIS

Mapas de calor e de pontos quentes são semelhantes, podem parecer o mesmo de algumas maneiras, mas são completamente diferentes. Os pontos quentes são determinados por estatísticas e os mapas de calor são determinados pela distribuição. Os mapas de calor são medidos pela proximidade dos pontos e os pontos quentes são medidos estatisticamente pelo nível de confiança.²

O complemento do QGIS para executar a Análise de Pontos Quentes (Hotspot) é baseada na Biblioteca Python de Análise Espacial – PySAL.

O plugin de análise de Hotspot associa os Z-escores e os p-valores (sob a hipótese de Aleatoriedade Espacial Completa) da estatística local Gi* (Getis e Ord, 1992; Getis e Ord, 1996), Anselin I de Moran Local (Anselin, 1995) e Moran Bivariada Local (Wartenberg, 1985) para cada feição do shapefile, com um sistema de coordenadas projetado atribuído e um atributo numérico associado. A camada de saída permite identificar hotspots (ou coldspots) no conjunto de dados de entrada, bem como sua significância estatística.

Para o que se refere a estatística local Gi*, o escore Z positivo e estatisticamente significativo indica um cluster intenso de valores elevados (hotspot). Escores Z negativos e estatisticamente significativos indicam cluster intenso de valores baixos (coldspot). Com relação ao I do Moran Local (e sua contrapartida bivariada, o Moran Local Bivariável), as pontuações Z são traduzidas em valores de quadrante (q) que descrevem a presença de Clusters ou Outliers dentro do conjunto de dados. A significância é calculada, com base na escolha do usuário, contra a suposição de normalidade ou usando a abordagem de permutações.

A relação espacial entre as feições pontuais é modelada usando uma Banda de Distância Fixa (expressa com a mesma unidade de medida do sistema de coordenadas projetado do shapefile de pontos de entrada). Para a análise do shapefile de polígonos, a relação espacial é modelada usando a matriz de contigüidade do “caso da rainha” (queen’s case). Para mais informações, consulte: Análise Geoespacial – 5ª Edição, 2015 – de Smith, Goodchild, Longley [En].

*Texto foi traduzido (em parte) do site HotSpotAnalysis Plugin²², de Daniele Oxoli. ₢2017.

Referências

²²https://github.com/danioxoli/HotSpotAnalysis_Plugin

²https://yuhuinnovation.maps.arcgis.com/apps/MapJournal/index.html?appid=b89b59ef0ad14534aae4e5fc85fdb2eb

¹http://www.qgistutorials.com/pt_BR/docs/creating_heatmaps.html

³https://rodolfomaduroalmeidasite.wordpress.com/2017/02/14/analise-de-densidade-de-eventos-pontuais-utilizando-o-qgis

http://www.pet.est.ufpr.br/?p=3592 Autocorrelação Espacial – I de Moran

John Snow’s famous cholera analysis data in modern GIS formats

¹¹http://blog.rtwilson.com/john-snows-famous-cholera-analysis-data-in-modern-gis-formats

https://www.theguardian.com/news/datablog/2013/mar/15/john-snow-cholera-map

https://www1.udel.edu/johnmack/frec682/cholera/cholera2.html

Data Analysis and Statistical Inference

Análise de Dados e Inferência Estatística

Este curso interativo do DataCamp complementa o curso de Coursera Análise de Dados e Inferência Estatística por Mine Çetinkaya-Rundel. Para cada lição dada em Coursera, você pode acompanhar os exercícios interativos no conforto do seu navegador para dominar os tópicos diferentes.

Lab 0: Introduction to R

Lab 1: Introduction to data

Lab 2: Probability

Lab 3A: Foundations for inference: Sampling distributions

Lab 3B: Foundations for inference: Confidence intervals

Lab 4: Inference for numerical data

Lab 5: Inference for categorical data

Lab 6: Introduction to linear regression

Lab 7: Multiple linear regression

Acesse:

https://www.datacamp.com/community/open-courses/statistical-inference-and-data-analysis

RQGIS – integrando R com QGIS

O RQGIS estabelece uma interface entre o R e o QGIS, ou seja, ele permite ao usuário acessar funcionalidades do QGIS de dentro R.
https://github.com/jannes-m/RQGIS
Ele consegue isso usando a API QGIS via linha de comando. Isto proporciona ao usuário um amplo conjunto de funções de SIG, uma vez que permite que você chame o QGIS de forma nativa, bem como algoritmos de terceiros através da sua estrutura de processamento.
Provedores de terceiros incluem entre outros GDAL, GRASS GIS, SAGA GIS, Orfeo Toolbox – OTB, TauDEM e ferramentas para dados LiDAR.
O RQGIS traz-lhe este ambiente de Geoprocessamento incrivelmente poderoso para o console R.

Referências

Plataformas de Aprendizagem Online

Para quem gosta de cursos online para aprendizagem de SIG, essas são ótimas opções totalmente gratuitas:

  1. Curso de QGIS

    IGET – India Geospatial Education and Training.

    GST 101 – Introduction to Geospatial Technology Using Quantum GIS


    1. Curso de R – Project for Statistical Computing

      OpenIntro – educational materials that are open and innovative.


      *Copiar conteúdo de forma integral é crime e antiético, além de falta de (bom) caráter.
      Se quiser publicar a notícia em seu blog, é obrigatório citar a fonte, o autor e colocar o link para a postagem original.
      Respeite os direitos dos outros para que seus direitos sejam respeitados.

      SADA – Spatial Analysis and Decision Assistance

      Spatial Analysis and Decision Assistance (SADA) é um programa gratuito que incorpora ferramentas do campo de avaliação ambiental em um ambiente de resolução de problemas eficaz.
      Essas ferramentas incluem módulos integrados para visualização, análise geoespacial, análise estatística, avaliação de risco à saúde humana, avaliação de risco ecológico, o custo / benefício, design de amostragem e análise de decisão.
      As capacidades do SADA podem ser usadas de forma independente ou em conjunto na caracterização de um sítio contaminado, avaliação de risco, determinando a localização das amostras futuras, e na concepção de medidas corretivas.
      Acessehttp://www.sadaproject.net