La Normalisation De l'Information Pour Une Exploitation Dans Un Contexte De l'Intelligence Économique
Documents Gratuits : La Normalisation De l'Information Pour Une Exploitation Dans Un Contexte De l'Intelligence Économique. Rechercher de 53 000+ Dissertation Gratuites et MémoiresBabátisé,
à mes proches…
Table des matières
1. Contexte Général, Problématique et Objectifs 10
1.1 Introduction 10
1.2 Cadre du travail 11
1.3 Présentation de cette étude 14
2. La Normalisation de l’Information 15
2.1 La normalisation de l’information 15
2.1.1 L’information, documentation et connaissance 15
2.1.2 La normalisation 18
2.1.3 La normalisation de l’information 20
2.2 Les structures des sources de documents électroniques 22
2.2.1 La structure des formats des documents textuels 22
2.2.2 La structure des tableaux 24
2.2.3 La structure des bases de données 26
2.2.4 Vers une source homogène 30
2.3 Les méthodes de conversion dans XML 33
2.3.1 Documents structurés 33
2.3.2 Documents non structurés ou semi structurés 34
2.4 La rétro-conception des bases de données 37
2.4.1 Etude de certaines méthodes de rétro-conception 44
2.4.2 Les outils de rétro-conception 46
3. Domaine d’Application 50
3.1 Systèmes d’Information 51
3.2 Gestion des connaissances 54
3.2.1 La fouille de données 54
3.2.2 L’entrepôt de données 56
3.3 Système d’informations stratégiques (SIS) 58
4. Application Concrète 63
4.1 La proposition de NetLor-Concept 64
4.2 L’algorithme de la proposition 66
4.2.1 La problématique 66
4.2.2 Description de l’algorithme 66
4.2.3 L’algorithme 70
4.2.4 Problème de l’algorithme 71
4.3 Une amélioration de l’algorithme 72
4.3.1 L’algorithme proposé 73
5. Conclusion et Perspective 75
5.1 Pour conclure … 75
5.2 Perspectives 76
5.2.1 L’utilisateur au cœur du système 76
5.2.2 Interopérabilité dans les SIS 78
Bibliographie 81
Table des illustrations
Figure 2.1 : La normalisation de l’information 21
Figure 2.2 : Le processus standard de la conception des bases de données et leurs produits, inspiré de [Hainaut 2002] 29
Figure 2.3 : Architecture générale de la rétro-conception des bases de données [Hainaut 2002]. 38
Figure 2.4 : Architecture générale de la phase d'extraction de structure de données 40
Figure 2.5 : Architecture générale de la phase de conceptualisation des structures de données 42
Figure 2.6 : Une table pour la comparaison des méthodes de rétro-conception 46
Figure 3.1 : Architecture d’un système d’information [Zacklad 2000] 53
Figure 3.2 : Une classification des différents systèmes d’information 54
Figure 3.3 : Architecture d’un entrepôt de données 57
Figure 3.4 : Architecture d’un système d’intelligence économique [Thiéry 2002] 59
Figure 3.5 : Représentation du SI-S et du S-IS [Thiery 2002] 61
Figure 4.1 : Schéma présentant une base de données non exploitable 64
Figure 4.2 : Schéma présentant le nouveau MPD (Modèle Physique de Données) 65
Figure 4.3 : Conversion et regroupement d’informations 67
Figure 4.4 : Modification de structures respectant le modèle relationnel standard 68
Figure 4.5 : Migration étape par étape des champs et des données associées 69
Figure 5.1 : Modélisation de l’utilisateur et S-IS 77
Figure 5.2 : Tableau récapitulatif des différents modes de coopération entre SI 79
Avant-propos
Les systèmes d’informations des organismes socio économiques sont souvent alimentés par des sources bien différentes et hétérogènes (en contenu et en format). Ces différences mènent, parfois, à une augmentation de coût de traitement, de la gestion du stockage et le problème de la rentabilité.
La nécessité d’alimenter ces systèmes d’informations par des informations ou données homogènes pour une exploitation efficace dans le contexte de l’intelligence économique est assez importante.
L’intelligence économique est un domaine de recherche en Information Scientifique et Technique actuellement intégré dans les Sciences de l’Information et de la Communication comme un aspect des technologies de l’information. La problématique de ce domaine d’étude est l’acquisition, l’organisation, la gestion et l’exploitation des données personnelles dans les technologies de l’information.
Cette étude porte sur une amélioration de l’organisation et l’exploitation, en particulier informatique, des informations dans les entreprises.
1. Contexte Général, Problématique et Objectifs
1.1 Introduction
L’apparition des nouvelles technologies de l’information (l’accès au haut débit, les réseaux câblés et l’Internet) fait naître de nouvelles sources, besoins et contraintes liés à l’utilisation des informations hétérogènes (contenu et/ou format). Ceci nous pousse à revoir en profondeur la normalisation de l’information.
En effet, la gestion de l'information vise le cycle de vie des documents des organismes socio-économiques. Ces documents doivent demeurer disponibles, compréhensibles et utilisables tant que l'administration et les employés en ont besoin. Priorité est accordée aux services qui sont considérés comme indispensables à la conservation de ces documents, à savoir leur identification, leur description, leur classification, leur organisation, leur entreposage, leur protection et leur disposition.
Ceci pose différents problèmes. La variété des sources d’information est extrême. Par exemple, il y a une distinction entre les sources générales et les sources spécifiques [Jakobiak 2001]. Les sources générales (les revues, journaux, publications périodiques diverses etc.) sont les sources connues, indispensables, diffusées et utilisées par les entreprises de toute taille. Elles sont utilisables pour organiser une surveillance systématique. De plus les sources spécifiques (les rapports pour des acteurs particuliers ou les rapports annuels, les normes, l’information informelle, les informations internes à l’entreprise etc.) sont généralement moins utilisées et permettent de répondre à des questions ponctuelles. Il faut également distinguer les différentes sources suivant leur moyen de stockage : les sources non électroniques (livres, journaux, etc.) et les sources électroniques (documents textuels, tableaux, bases de données, etc.). Ces dernières nous intéressent, parce que nous allons essayer de les normaliser.
Remarquons que les informations contenues dans ces sources peuvent être disponibles dans des formats différents. Dans une revue, les informations peuvent être des tables, des tableaux, des textes, des pictogrammes, etc.
On peut trouver toutes ces informations dans des bibliothèques, sur les sites Web, dans les bases de données opérationnelles des entreprises ou plus généralement dans les systèmes d’information des entreprises sous différents formats. Les trois dernières sont des sources pour l’alimentation des systèmes d’information stratégiques et par conséquent sont importantes pour notre travail.
Dans sa forme la plus simple, un système d’information stratégique (SIS) peut être considéré comme
...