Comme une ressource mondiale construit à partir du temps libre de millions de volontaires, Wikipédia peut être l’incarnation du Web 2.0. Mais la Fondation Wikimedia, une organisation sans but lucratif qui gère Wikipedia, entre autres projets, est en train de réfléchir sur la façon d’en faire un pilier du Web 3.0, ou le Web sémantique.
Cela signifie faire partie des données sur 15 millions de articles Wikipédia (et plus) compréhensibles pour les ordinateurs ainsi que les êtres humains. Cela permettrait aux logiciels de savoir, par exemple, que les chiffres présentés dans l’une des colonnes d’un tableau d’annonce de président américain sont des dates. Cela pourrait, à son tour, permettre aux applications qui s’appuient sur Wikipédia pour générer automatiquement des calendriers historiques ou de répondre à ce genre de questions de connaissances générales qui entraînent habituellement une personne de trouver et de lire une entrée correspondante sur le site.
Dans la conférence sur la technologie sémantique à San Francisco le mois dernier, le directeur de la fondation adjoint, Erik Möller, collègue et Trevor Parscal, un développeur de l’expérience utilisateur pour Wikimedia, a donné des premières mesures prises par la fondation d’explorer comment les plus sémantique structure pourrait être ajouté a Wikipedia. Ils ont également demandé à la communauté du Web sémantique d’aider à développer des moyens pour rendre la connaissance plus accessible sue Wikipédia à des ordinateurs et des logiciels.
« L’information sémantique existe déjà dans Wikipedia, et les gens s’appuient déjà sur elle», dit Möller. »Malheureusement, nous ne sommes pas vraiment aidé, et ils doivent utiliser un traitement complet pour le faire. »
DBpedia est un exemple, une base de données sémantique construite en utilisant un logiciel pour recueillir des données à partir des pages du site, et mis à jour par l’Université de Berlin et l’Université de Leipzig, en Allemagne. Un autre est Freebase, une base de connaissances à but lucratif, dont une grande partie a également été compilé par raclage de Wikipédia. Freebase est la source des données utilisées par question-réponse du moteur de recherche Powerset, qui avait été acquise par Microsoft pour faire partie de son moteur de recherche Bing.
Les premières cibles de Möller et Parscal sont les infoboxes « qui apparaissent sous forme de résumés sur les nombreuses pages Wikipédia, et les tableaux des entrées, comme celle montrant le produit national brut de tous les pays dans le monde.
« Le fait d’être en mesure de réutiliser les données de Wikipédia serait une grande chose», explique Yaron Koren, qui dirige une société de conseil spécialisée dans le Semantic MediaWiki, une extension du logiciel MediaWiki utilisés pour construire Wikipédia. «Le travail manuel qui va dans le maintien de nombreux tableaux et listes d’aujourd’hui pourrait être éliminée », at-il ajouté. Au lieu de cela, les listes peuvent être générées automatiquement à partir des infoboxes d’autres pages. Il serait également possible de générer des cartes, en utilisant les coordonnées de localisation qui figurent sur certaines pages, ou de générer automatiquement des délais de résumer périodes de l’histoire couverte par de nombreuses autres pages, dit Möller.

À l’avenir, il peut être possible de supprimer la nécessité d’un homme pour remplir certaines parties de l’encyclopédie Wikipédia , dit Möller. « Fondamentalement, beaucoup de ces données ne devraient probablement pas être inscrit par l’homme en premier lieu, il devrait simplement, par exemple, interroger la source d’une figure comme celle du PIB une fois par an. » C’est une capacité que Koren a déjà ajouté à Semantic MediaWiki, par une extension appelée ExternalData.
Tag supplémentaires :
- wikipedia fr
- wikipedia page marque
Posts relatifs:
- Wikipédia inaccessible : peut être a cause d’un serveur est down Au moment d’écrire ces lignes, Wikipédia est DOWN et...
- La page Wikipedia ‘FIFA World Cup 2010′ était effacé à plusieurs reprises Les chercheurs en sécurité de Sophos avertissent que la...
- La collecte de fonds de Wikipedia se termine avec 20M$ dans la banque Ces bannières intrigantes de collecte de fonds ont finalement disparu des pages de Wikipédia, l’encyclopédie en...
- Annuaire Pages blanches france en web2.0 ! Découvrez Pagesblanches.fr Pagesblanches.fr est votre source directe et la plus fiable...
- Connecteur USB Flipper d’UltraTek qui marche dans les deux sens Le connecteur USB de Flipper UltraTek que vous pouvez...