DissertationsEnLigne.com - Dissertations gratuites, mémoires, discours et notes de recherche
Recherche

Datawarehouse

Rapports de Stage : Datawarehouse. Rechercher de 53 000+ Dissertation Gratuites et Mémoires
Page 1 sur 33

cultés cachées" de la référence spatiale qui font l'objet de nos préoccupations de recherche.

Enrichissement du SOLAP pour l’analyse géographique

1. Introduction

Partout dans le monde, de nombreuses organisations dépensent des sommes colossales en acquisition de données localisées sur le territoire. La production cartographique, l'établissement de relations avec les bases de données internes à l’organisation et l'analyse spatiale de ces données relèvent du domaine de la géomatique qui représente un marché annuel de plusieurs dizaines de milliards d'euros. Cependant, les données ainsi produites sont surtout de nature opérationnelle et difficiles à exploiter à des fins décisionnelles, fins qui demandent des informations multisources, agrégées, des comparaisons dans l'espace et le temps, des synthèses, des mesures de tendances, des réponses rapides à des requêtes imprévues, etc. D'importants efforts sont déployés depuis une quinzaine d'années pour mettre en place des systèmes d'aide à la décision géospatiale, mais ces systèmes reposent sur les systèmes d'information géographique (SIG) et les approches transactionnelles habituelles (OLTP) pour produire l'information géodécisionnelle, souvent avec des délais inacceptables, voire des coûts prohibitifs au point d'en laisser tomber la production. Cette situation nuit à la prise de décision tactique/stratégique (ex. déploiement des ressources, de nouvelles infrastructures) et devient particulièrement problématique en situation d'urgence où tout retard peut avoir des impacts majeurs. Cette difficulté de produire l'information géospatiale décisionnelle provient de cinq problèmes : (1) des méthodes inadéquates de conception de bases de données géospatiales à fins décisionnelles, (2) la difficulté, voire l'impossibilité d'agréger et synthétiser automatiquement des données cartographiques hétérogènes, (3) la difficulté d'évaluer la qualité de l'information géospatiale agrégée, (4) une sous-exploitation des technologies de l'information et des communications par la communauté géomatique, et (5) un manque de technologies décisionnelles géospatiales efficaces. Le présent article traite de ce dernier point, particulièrement de l'analyse spatiale en ligne (SOLAP). Il est déjà reconnu que pour soutenir leurs processus décisionnels, les organismes déploient des entrepôts de données et utilisent des outils clients spécifiques afin d'accéder, visualiser et analyser leurs données intégrées. Puisqu'une grande partie de ces données peut avoir une composante spatiale (ex. position GPS, adresse civique, polygone cartographique), de nouveaux outils sont nécessaires pour profiter pleinement de la position et la forme des phénomènes analysés. Il a été démontré [Caron 1998] que les technologies OLAP sans visualisation et navigation cartographiques présentent d'importantes limitations pour l'analyse de phénomènes géographiques et spatio-temporels comme on en rencontre en environnement, foresterie, agriculture, urbanisme, sécurité, transport, etc. Malheureusement, cette solution prévaut encore aujourd'hui malgré que différentes possibilités existent pour développer des applications d'analyse spatiale en ligne (appelées "applications SOLAP"). L'objectif de cet article est de présenter ces différentes possibilités tout en mettant l'accent sur la solution la plus évoluée : la "technologie SOLAP". Ainsi, la prochaine section résume les besoins spécifiques au monde géodécisionnel et présente les opportunités qui conduisent depuis 1997, au développement d’applications SOLAP avec différentes solutions (ex. combinaisons SIG + OLAP, technologie SOLAP). La troisième section définit la technologie SOLAP et présente certains concepts spécifiques aux données spatiales accompagnés d'exemples d’applications. La quatrième section présente les différentes méthodes de développement d’applications SOLAP, incluant l'utilisation de la technologie Spatiale OLAP et chaque exemple d'application y est positionné. Finalement, nous concluons avec des

RNTI - E -

Bédard et al. avenues de recherche importantes pour le développement d’applications SOLAP du point de vue de géomaticiens spécialisés sur la donnée géospatiale.

2. Les besoins spécifiques du géodécisionnel.

Les données emmagasinées dans les entrepôts de données forment la base des analyses et guident l’organisation dans sa prise de décision. Cependant, les données ne sont pas toujours exploitées selon leur plein potentiel et une partie de leur richesse, c'est-à-dire, leur composante spatiale, est souvent inutilisée. "Hidden in most data is a geographical component that can be tied to a place : an address, postal code, global positioning system location, (…) region or country" [ESRI 2000]. En effet, il est estimé qu’environ quatre-vingt pour cent des données stockées dans les bases de données corporatives possèdent une référence spatiale [Franklin 1992], laquelle référence peut inclure, en plus de la position, une forme, une orientation et une taille. La simple visualisation de cette composante spatiale permet de répondre à un premier besoin, soit de mieux comprendre le phénomène en question en voyant sa position dans un cadre de référence géographique, en voyant son étendue sur le territoire, en voyant sa distribution sur le territoire (concentrée, dispersée, par groupes, aléatoire, régulière, etc.). Une telle visualisation permet de découvrir des informations non disponibles dans les outils OLAP traditionnels, soit des modes de distribution géographique du phénomène ne suivant pas les découpages territoriaux prédéfinis comme membres d'une dimension (ex. nom du pays, nom de la région, nom de la ville). L'utilisation de la composante spatiale permet également de répondre à un deuxième besoin, soit de découvrir des relations spatiales entre différents phénomènes géographiques (ex. corrélation spatiale entre une fréquence d’une maladie X et un taux d'émission d'un polluant Y). Cette découverte peut se faire par visualisation même si une corrélation ne suit pas la hiérarchie de la dimension territoriale telle que définie dans le cube de données (i.e. dont la délimitation géographique est uniquement identifiée par un nom de lieu, comme pays – province - région administrative). Cette découverte peut également se faire par l'ajout de plusieurs découpages territoriaux ou l'ajout de dimensions d'analyse spatiale [Marchand et al 2004]. Souvent, l’affichage cartographique révèle des informations (ex. proximité entre deux phénomènes isolés, étendue d’un phénomène, forme d’un phénomène longeant une rive, orientation des phénomènes selon un flanc de montagne) qui n’auraient pas été soupçonnées en faisant appel à d’autres méthodes de représentation telles que les tableaux et les graphiques. Un troisième besoin majeur dans un contexte d'analyse spatiale en ligne est celui de pouvoir naviguer dans une carte aussi librement que ce que permet un outil OLAP dans les tableaux et graphiques statistiques. Ainsi, l'utilisateur a besoin de pouvoir regarder les détails d'une région d'intérêt grâce à un forage spatial, comparer ces détails avec ceux d'une autre région qui n'est pas adjacente, découvrir s'il y a des caractéristiques communes entre les distributions spatiales du phénomène dans ces deux régions, remonter à une vision plus globale pour comparer un phénomène local avec un phénomène national, voir l'évolution du phénomène sur le territoire sans être restreint au découpage géographique de la dimensions spatiale utilisée, obtenir des valeurs statistiques spatiales et temporelles sur l'évolution de ce phénomène, etc. Beaucoup de connaissances géographiques peuvent être obtenues par l'utilisation appropriée de la visualisation et de la navigation cartographique à la OLAP, et ceci même pour des références spatiales non prévues dans le cube de données.

RNTI - E -

Enrichissement du SOLAP pour l’analyse géographique L'utilisation de la carte comme médium d'exploration de données permet d'avoir un modèle informatisé se rapprochant davantage de la réalité de l'utilisateur et conséquemment lui demandant un moins grand effort d'abstraction, ce qui accroît son efficacité. L'utilisation de la cartographie impose également une utilisation plus judicieuse, grâce à la sémiologie graphique [Bertin 1977, Tufte 1992], des variables visuelles telles que la couleur, la teinte, le poids des traits et la trame, mettant ainsi en action de façon plus efficace les principales facultés corticales (mot, image, nombre, couleur, conscience spatiale, etc.). Les cartes se prêtent mieux que les tableaux et graphiques statistiques à l'ajout de codes, symboles et couleurs significatifs permettant de mieux supporter l'exploration interactive des données. La possibilité de naviguer dans la carte permet de chercher des associations, favorisant la découverte de relations spatiales insoupçonnées et potentiellement la construction d'un nouveau cube de données avec un découpage différent du territoire. Une application SOLAP, comparativement à une application OLAP, réveille davantage notre

...

Télécharger au format  txt (57.6 Kb)   pdf (392.5 Kb)   docx (25.8 Kb)  
Voir 32 pages de plus »
Uniquement disponible sur DissertationsEnLigne.com