Benoît FRICEAU
Edition Multimédia de l'Information
Centre Universitaire d'enseignement du Journalisme
de Strasbourg
Année 2000-2001

 

VISUALISER LES DONNEES
(1/2)

Une fois la collection ordonnée, elle révèle enfin son organisation interne. Une organisation faite de " pôles informatifs " (autour desquels les documents vont pouvoir être agrégés), et de liens porteurs de sens.

Les différentes catégories de représentations que nous allons voir ci-dessous permettent, chacune à leur manière, d'exprimer cette organisation.

De leur côté, les interfaces vont avoir pour but de rendre la collection de documents manipulable. Il ne s'agit alors plus d'accéder aux informations uniquement par la requête, mais par la navigation à l'aide de la souris.

 

QUE VISUALISER?

CONSEQUENCES DE LA VISUALISATION SUR LA COMPREHENSION DES DOCUMENTS

LES INTERFACES

 


QUE VISUALISER?

LES CIBLES (" BULLEYES ")

Les cibles reposent sur une structure concentrique. Chaque cercle reçoit des nœud de connectivité égale (même niveau hiérarchique). Les nœuds placés les plus près du centre sont les plus élevés dans la hiérarchie et inversement pour les noeuds les plus éloignés.

La représentation bull-eye se prête particulièrement bien à la visualisation de résultats d'un moteur de recherche. L'utilisateur peut en effet repérer d'un seul coup d'oeil les documents les plus susceptibles de répondre à sa demande. L'exemple ci-contre est l'illustration la plus sommaire de ce genre de graphique. Aucune indication n'est donnée sur le type de liens qui relient les documents entre eux. Mais un service comme Kartoo (cf rubrique "utiliser") laissera apparaître en permanence le nom de chaque noeud, ainsi que des thêmes qui les relient ensemble.

 

Les murs en perspective ("perspectives walls")

Le mur en perspective est une très bonne méthode pour visualiser de grandes quantités d'informations qui seront ordonnées suivant l'axe horizontal (en particulier des informations chronologiques). Sur l'axe vertical les documents seront répartis selon une infinité de catégories.
Le principe des perspective-walls est issu du Centre de recherche Xerox de Palo Alto.

 

Perspectives Wall
(Image: Xerox Center)

Exemple d'un mur en perspective, avec ici l'un des pans mis en évidence par l'effet de perspective. Pour passer d'un pan à un autre, il suffit, à l'aide de la souris, de faire pivoter l'ensemble latéralement. Les documents sont représentés par de petits rectangles de couleur.

Si la manipulation de tels espaces est très intuitive et permet de placer une infinité de documents (en augmentant le nombre de côtés ou de lignes horizontales), elle présente néanmoins deux inconvénients :
1) dès lors que l'on zoome sur l'un des documents, les autres ne sont plus aussi visibles (en particulier ceux qui sont répartis sur les autres côtés du mur).
2) Il est difficile de différencier les documents de référence des autres, à moins de jouer sur leur couleur.

 

Les "tables lentilles" ("Table lens")

Inxight Table Lens
(Image: Inxight)

Les table lens sont utilisées généralement pour visualiser le contenu d'une base de données.
Les données sont inscrites dans un tableau (comme dans tout bon tableur de type Excel ou Lotus), avec la possibilité de zoomer sur chaque champ à l'aide du curseur. La technique de visualisation présente l'intérêt de pouvoir placer un très grand nombre d'informations dans le tableau, sans que la lisibilité n'en souffre. Sur l'exemple ci-contre, le rectangle bleu-turquoise représente le champ mis en évidence.

 

Les arbres

Les représentations en arbre sont idéales pour les hiérarchies telles que les arborescences de sites, les répertoires de fichiers, les organigrammes etc…

Principe : Un nœud constitue l'origine de l'arbre (par exemple la page d'accueil, l'introduction d'un mémoire…) d'où partent des liens qui aboutissent à des nœuds dits de " première génération " ou " fils " ( " Chapitre 1 " par exemple) qui eux même possèdent des liens conduisant aux documents de deuxième génération ou petits-fils (" Chapitre 1 - Première partie ") et ainsi de suite, jusqu'à finalement dérouler l'ensemble des documents présents dans la collection.

Ce type de visualisation présente l'avantage de bien matérialiser tous les niveaux hiérarchiques de la collection de documents.


On distinguera deux types d'arbres :
Les arbres coniques et les arbres hyperboliques

Les arbres coniques (" cone trees ")

Arbre cônique en 3 dimensions.
(Image: AB)
Cliquer sur l'image pour l'agrandir.

Les arbres coniques sont visualisables en 2 ou 3 dimensions. La taille des nœuds ainsi que leur aspect peuvent également être paramétrés.
Bien que facilement manipulables, ces arbres en cône deviennent vite illisibles dès que le nombre d'informations à représenter devient trop important.


Les arbres hyperboliques

Pour résoudre le problème évoqué ci-dessus, les chercheurs du Xerox Park de Palo Alto ont mis au point les arbres hyperboliques. Basés sur un modèle mathématique complexe, l'information est présentée de sorte que plus un objet est éloigné du point de zoom, plus il rétrécit (comme lorsque l'on regarde dans un objectif photo de type " fisheye ").

Exemple d'arbre hyperbolique développé par Inxight. Cliquer sur l'image pour en voir un aperçu animé. (Image: Inxight)

Cliquer sur un document le ramène vers le centre, sans pour autant perturber l'organisation du graphe. A tout moment, il est possible de sauter d'un nœud à un autre tout en gardant à l'œil le point d'origine de l'arbre.
Ces représentations supportent des déformations et des zooms successifs sans que la lisibilité de leur structure n'en souffre.

Arbre hyperbolique en 3D.
(Image: Geometry Center)

De manière générale, toutes les représentations citées ci-dessus rendent essentiellement compte de classements mono-hiérarchiques (un fils n'a qu'un seul père - une sous catégorie n'est incluse que dans une seule catégorie supérieure).
Dès qu'il s'agit de représenter une structure poly-hiérarchique (un fils a plusieurs pères - une sous catégorie peut faire partie de plusieurs catégories supérieures et distinctes), le graphe perd en visibilité. En effet, il est très difficile d'isoler à la fois un fils et ses pères respectifs sans dénaturer la structure générale du graphe (et donc perdre la cohérence du graphe tout entier).
Seuls les arbres hyperboliques avec leur méthode de visualisation particulière (et particulièrement ceux en 3D) y parviennent correctement.

 

Les cartes

En général, sont désignées comme logiques de cartes des logiques de visualisation issues d'une classification automatique. Mais nous serions alors tentés de dire que dans ce cas, presque toutes les techniques de visualisation citées plus haut entrent dans cette catégorie...

Aussi, nous avons décidé de ne retenir ci-dessous qu'un exemple caractéristique d'une procédure de "régionalisation", où les pôles de la collection emplissent la totalité de l'espace dévoué à l'interface.

 

Les SOM (Self Organizing Maps)

Mise à plat de la catégorie "diverstissements" de l'annuaire Yahoo!.
(Image: AIL)

Le principe des SOM repose sur une organisation en strates. Le premier niveau n'affiche que les thèmes généraux, tandis que les niveaux inférieurs affichent les sous-catégories, jusqu'à finalement aboutir aux documents contenus dans les sous-catégories. Tout dépend en fait du nombre de strates de départ.

En cliquant par exemple sur la catégorie "musique" de la carte, l'utilisateur accède à une seconde carte qui représentera toutes les sous-catégories de "musique".

Les pôles occupent sur le graphique une zone d'autant plus importante que le nombre de documents (ou de sous-catégories) qui les constituent sont élevés.

Pour en arriver là, un logiciel va rapatrier en local l'ensemble de la collection. Puis il va analyser le contenu de chaque page, et indexer leurs mots-clefs. De cette indexation, il va dégager les pôles principaux ainsi que leurs sous-catégories respectives.

Visualisation du site de Boeing Industries, par le logiciel SiteMap. (Photo: Drexel Univ.)
Cliquer sur l'image pour l'agrandir.

Les SOM peuvent être visualisables via une représentation "en carrés" comme ci-dessus, ou bien encore via un ensemble de points, comme le montre l'interface ci-contre développée par l'Université Drexel de Philadelphie.

De telles interfaces s'appliquent parfaitement bien à la visualisation des collections de grande taille, telles que des collections bibliographiques ou des archives.

 

 

Conséquences de la visualisation sur la compréhension des documents

Représenter visuellement l'information limite certains phénomènes qui peuvent peser sur la compréhension des documents et en particulier sur les documents hypertextes :

  • Ainsi, elles limitent la désorientation
    Cette dernière, engendrée par la navigation, est la résultante de sauts hypertextes successifs.
  • Elles limitent également la surcharge cognitive
    Ce phénomène est le résultat d'une trop grande exposition à de l'information différente. Le concept d'empan mnésique, définit par Miller à la moitié du siècle dernier, part du principe qu'il est impossible de retenir plus de 7 (plus ou moins 2) éléments à la fois, sans engendrer le phénomène d'oubli. Les hypermédias ont tendance à accentuer le phénomène.

En se servant des aptitudes perceptives de l'utilisateur, la visualisation aide à mieux appréhender et comprendre l'information.
David Clark, chercheur au Massachusetts Institute of Technology, résume cela dans son concept du " Up button ". En donnant à l'utilisateur la possibilité de presser ce " bouton d'en haut " pour prendre du recul, la compréhension globale du document et des documents voisins s'en trouve améliorée.

Mais peu de méthodes de structuration de l'information en 2D ou 3D sont unanimement reconnues à l'heure actuelle. Comme évoqué plus haut, il existe plusieurs types de repérésentations, assortis à chaque fois d'une interface de navigation spécifique. À moins que l'utilisateur ne comprenne intuitivement la signification des objets et leurs liens dans l'espace, toute visualisation de l'information a forcément ses limites.
Il ne faut pas non plus oublier que le web a habitué ses utilisateurs à accéder aux documents par le biais de la requête traditionnelle (remplir une zone de texte, lancer la recherche et visualiser les résultats sur de longues pages de texte) ou de la navigation sommaire (explorer les sites, jusqu'à trouver la bonne information).
Si visualiser un plan de site reste à la portée de tout le monde, mener une recherche à l'aide d'une interface de visualisation n'est pas toujours facile les premières fois.
Aussi, même si la visualisation des informations apporte indéniablement un plus dans la recherche et la navigation, il n'est pas dit que le grand public y souscrive de suite.

>>>Suite: Les interfaces

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L'utilisateur dispose de deux stratégies lorsqu'il se trouve devant une collection de documents qu'il ne connaît pas ou qu'il ne peut appréhender dans sa totalité:

- Ou bien il va tenter d'accéder au éléments qu'il recherche par la requête (par le biais d'un moteur par exemple).

- Ou bien il va utiliser la navigation.
Cette deuxième option peut d'ailleurs se décliner sous de multiples formes :
* le vagabondage, qui ne correspond à aucun cheminement véritablement structuré
* le " butinage ", qui ne répond pas à un besoin précis, mais pousse l'utilisateur à continuer jusqu'à satisfaire son besoin
* le balayage rapide des documents sans rentrer dans leur structure profonde
* l'exploration, qui permet de couvrir toutes les perspectives de l'information recueillie

Cf travaux de :
- Le Crosnier " Une introduction à l'hypertexte ", Bulletin des Bibliothèques de France, 1991.
- E. Kolmayer, " Navigation et interfaces : cartes conceptuelles et autres outils ".

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Rhizome.org est un site américain spécialement dédié aux arts interactifs et au design. Zone d'exposition permanente pour de jeune artistes créatifs passionnés par les interfaces visuelles, il propose de très nombreux articles et références sur le sujet.

L'équipe du site a mis en place depuis quelques temps une interface visuelle particulièrement spectaculaire. Elle consiste en une spirale, le long de laquelle sont agencés tous les documents publiés sur le site (plus de 1700 documents, représentés par des étoiles lumineuses). A l'aide d'une barre de défilement, l'internaute peut littéralement " plonger " dans cette spirale sans fin, qui laisse découvrir des documents de plus en plus anciens au fur et à mesure de la progression.
Bien que peu académique, et fruit du travail d'artistes n'ayant rien à voir avec la recherche scientifique, cette spirale reste pour le moins très intéressante.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sur le site du Geometry Center de l'Université de l'Arizona, consulter le dossier "Visualizing the structure of the World Wide Web in 3D hyperbolic space"

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sur le site MappaMundi, lire l'article "A Map of Yahoo !" qui revient sur la cartographie du site de Yahoo réalisée par l'équipe du labo d'intelligence artificielle de l'Université de l'Arizona.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Le site de David Clark, consacré aux réseaux neuronaux atificiels