Le web sémantique, ou la mort annoncée des moteurs.

Le web sémantique c'est une secte ?
Alors c'est quoi le web sémantique ?
A quoi sert le langage RDF et ses triplets ?
Que veut dire ontologie quand ce n'est pas de la philo ?
Quelles applications pour le web sémantique ?
Pour en savoir plus

Un tas de bois à AutransDans les clubs ou les associations que je fréquente, on ne parle depuis quelque temps que du « web sémantique  », nouveauté censée révolutionner le Web.. Je me suis donc inscrite à divers ateliers ou conférences — les plus récents à Autrans en janvier dernier — pour tenter d'y voir plus clair. Hélas ! Plus j'entendais d'explications, moins je comprenais quoi que ce soit. Pire, j'avais la désagréable impression que certains orateurs, soit cultivaient l'ésotérisme à dessein, soit ne maîtrisaient pas du tout leur sujet. Je ne peux résister au plaisir de vous citer ceci :

" Le web sémantique [...] possède un caractère sémantique dans la mesure où il s'appuie essentiellement sur la vertu d'objectivation de l'informatique pour valoriser les expressions particulières en les réunissant au-delà de leurs spécificités au sein d'un système d'information unique. Réciproquement, tout message, dans son ambition de participation à la communication planétaire, doit s'alourdir d'une enveloppe abstraite [...], cette abstraction qui n'est qu'humaine pouvant être convertie en principe en potentiel d'universalité et de discrimination par le pouvoir objectivant informatique."

C'est à hurler de rire, ne dirait-on pas un texte style pipotron, généré par javascript ? Lisez encore ceci : « Le web sémantique est une forme de Graal de la Communication, et je pèse mes mots.  » Bon. Ces mots bien pesés, je m'étais persuadée que le Web Sémantique était au mieux une technologie en train de se chercher, et au pire une secte d'allumés, lorsque j'ai croisé Carole et lui ai raconté mes malheurs. Pouvait-elle m'aider ?

Carole, le Web Sémantique, c'est quoi ?
— Aujourd'hui, me répond Carole, le contenu du Web est fait pour des lecteurs humains, mais pas pour des ordinateurs.

— Et alors ? C'est grave, docteur ?

— Oui, c'est grave pour faire une recherche efficace. Comme il y a de plus en plus de pages web, des milliards, et que le moteur de recherche ne comprend pas le sens des documents, sa recherche sera de moins en moins efficace.

— Mais on peut mettre des métatags dans la page pour aider les moteurs !
— Oui, les métatags, [mots-clés qu'on met en tête de la page HTML, qui ne s'affichent pas mais sont visibles pour les moteurs de recherche ndlw], sont certes une petite avancée, mais elle reste très limitée. L'idée du Web Sémantique c'est de permettre une recherche intelligente sur le web, faite par des ordinateurs et basée sur des définitions qu'ils puissent « comprendre », des définitions données pour le monde entier.


— Quel genre de définitions ? Comme dans un dictionnaire ?

— Pas exactement : disons qu'il faut mettre à disposition un langage de recherche, qui complète le web d'aujourd'hui, et qui rende son contenu intelligible par des applications différentes. Autrement dit, qui lui donne un sens, c'est la signification du mot «  sémantique ».

— Ce langage, c'est XML ?

Non ; XML n'est qu'un langage de description de document. Il permet de structurer l'information que l'on fait apparaître. Il consiste en de simple tags qui délimitent des données. Mais il ne donne pas la signification de ses structures ! Et sans la définition des structures, seul celui qui a créé le document est capable de le comprendre. Alors c'est RDF (Resource Definition Framework) qui va permettre de définir les structures, et cela au moyen de propositions ou « triplets » de type sujet/verbe/complément. Par exemple, une définition du type « une femme d'oncle est une tante » sera indipensable pour rechercher dans un arbre généalogique..

— RDF est donc un langage ?

— Mmoui...si tu veux ; ou plutôt un mode de stockage des définitions, comparable à une feuille de style CSS. Mais en beaucoup plus complexe, car basé sur la théorie des triplets : tout document sera en effet défini par les occurrences de ces trois données, sujet verbe complément, ou plus exactement sujet, prédicat, objet encore appelés objet,attribut,valeur [A(O,V)]. A chaque tag XML correspond un triplet dans RDF. Dans la représentation graphique de RDF, le sujet et l'objet sont représentés par des sortes d'ellipses appelée "noeuds", et le prédicat par une flèche qui va du sujet vers l'objet.

— On dirait de l'Intelligence Artificielle appliquée au web ?

— Non, car la grande différence, c'est que l'IA est basée sur la centralisation des données dans une Base De Données, alors que dans le Web sémantique, les données peuvent être n'importe où, l'agent intelligent va les prendre en se baladant partout, sans qu'on ait besoin de les stocker.

— Comment est-ce possible ?

— C'est que je ne t'ai pas encore tout dit ! En plus d'une structure (XML) et d'un langage définissant cette structure (RDF), le web sémantique se caractérise par le fait que
chaque partie du « triplet » RDF possède un identifiant appelé URI (Uniform Resource Identifier) qui permet à l'agent de le repérer.

— Ca a un rapport avec l'URL ?

— Oui l'URL est un cas particulier de l'URI. Les URIs assurent que les concepts ne sont pas juste des mots dans un document, mais qu’ils sont attachés à une définition unique que tout le monde peut trouver sur le web.
En tout cas, cela change tout, car ainsi on pourra vraiment travailler en grids, en peer to peer, c'est à dire d'ordinateur à ordinateur, si les définitions sont partagées par tous. Pour me résumer, dans le web sémantique on a donc u
n support, le XML, qui organise le document, puis le RDF qui définit la structure c'est-à-dire la signification des tags XML, et enfin un univers non centralisé, mondial, avec des grids et du peer to peer.

Et l'ontologie là dedans c'est quoi ? On en entend souvent parler à propos du web sémantique, or l'ontologie, c'est l'étude de l'être en tant qu'être, si je me souviens de mes cours de philo !
— Effectivement. Mais dans le cas du Web Sémantique, ce mot comme pas mal d'autres – dont "triplets" –  est emprunté au vocabulaire de la logique formelle et signifie tout à fait autre chose ! Je ne voulais pas t'en parler pour ne pas trop compliquer les choses, mais puisque c'est toi qui pose la question... En mathématique informatique, donc, une ontologie c'est la spécification formelle de la représentation des concepts, objets et entités et de leurs relations.

— Et ça sert à quoi ?
— Une ontologie typique sur le web a une taxonomie et un répertoire de règles d’inférence dans un domaine de connaissances donné. La taxonomie définit des classes d’objets et leurs relations, exactement comme le fait par exemple la classification des animaux en embranchements, classes, ordres, familles, genres, espèces et sous espèces . Les règles d’inférence peuvent apporter une plus grande visualisation des éléments. Une ontologie peut exprimer la règle « si un code département est associé avec un code région et qu’une adresse utilise ce code département, alors cette adresse est associée avec le code région ». Avec le langage permettant d'écrire les ontologies, OWL (Web Ontology language), et RDF, des applications vont pouvoir utiliser et traiter les informations contenues dans des documents, indépendamment des humains.

— Quel genre d'applications ?
— Par exemple dans le domaine du commerce électronique. Imaginons un consommateur qui veut acheter une voiture. Un agent intelligent va chercher à sa place toutes les voitures correspondant à ses critères, comparer les prix, vérifier la disponibilité, les délais de livraison etc. en fouillant dans les documents du web décrits selon les standards du web sémantique. Autre exemple, donné par l'inventeur du web sémantique qui est d'ailleurs le même que celui du web tout court, à savoir Sir Tim Berners-Lee : je reçois un appel sur mon téléphone, aussitôt il va transmettre à tous les appareils possédant un réglage de volume sonore, hi-fi, télé.. l'ordre de baisser le son pour que je puisse téléphoner en paix..

— Mais cela suppose que les documents en question soient décrits comme le veut le web sémantique, et c'est loin d'être le cas !
— Pas encore mais ça vient. Le W3C s' occupe de définir les standards. Il y a toujours un temps d'évangélisation ! Les premières définitions de Tim Berners-Lee concernant le web sémantique sont sorties en 2001, mais à l'époque personne n'a compris, c'était trop tôt. Maintenant il y a déjà des applications qui marchent, les gens se mettent à faire leurs ontologies dans différents domaines, et surtout on a compris à quel point une recherche décentralisée sur le web, et non pas sur le mode client-serveur, est utile aujourd'hui.
— C'est la mort annoncée des moteurs classiques ?
— Hé oui.

Elisabeth a interviewé Carole, le 3 mars 2004

LIENS UTILES

Pour en savoir plus sur le web sémantique:
L'article de Tim Berners-Lee (en français)
Jdnet
XMLfr.org
Inria

Slides du W3C
articles universitaires intéressants

Pour mieux comprendre le vocabulaire utilisé :
Remarquable article en anglais

Pour rigoler un peu du jargon :
http://websemantique.org/ReperePointDepart

http://autrans.crao.net/index.php/AtelierWebS%E9mantique

Pour connaître ou imaginer des applications :
www.isima.fr/limos/publi/paper/2003/RR0315.doc (article technique)
http://www.servicedoc.info/article.php3?id_article=133 (domaine du droit)
http://jena.hpl.hp.com:3030/blojsom-devt/blog/semantic-web/

etc etc.


Retour