<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blogabriel &#187; web de données</title>
	<atom:link href="http://www.kepeklian.com/blog/category/web-de-donnees/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.kepeklian.com/blog</link>
	<description>Le blog de Gabriel, innovation, recherche et développement ... et arménien classique</description>
	<lastBuildDate>Sun, 11 Dec 2011 18:35:05 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Présentation de Datalift au GFII</title>
		<link>http://www.kepeklian.com/blog/2011/12/11/presentation-de-datalift-au-gfii/</link>
		<comments>http://www.kepeklian.com/blog/2011/12/11/presentation-de-datalift-au-gfii/#comments</comments>
		<pubDate>Sun, 11 Dec 2011 18:35:05 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[GFII]]></category>
		<category><![CDATA[linked data]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1251</guid>
		<description><![CDATA[Le Groupement Français des Industries de l&#8217;Information organise mardi 13 décembre 2011 une journée d&#8217;étude sous le titre de &#8220;Introduction<a href="http://www.kepeklian.com/blog/2011/12/11/presentation-de-datalift-au-gfii/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Le Groupement Français des Industries de l&#8217;Information organise mardi 13 décembre 2011 une journée d&#8217;étude sous le titre de &#8220;<a href="http://www.gfii.fr/fr/evenement/introduction-illustree-au-web-semantique-realites-et-perspectives">Introduction illustrée au web sémantique : réalités et perspectives</a>&#8221; ?</p>
<p>Ce séminaire mettra en perspectives les principes du web sémantiques à partir de réalisations concrètes et de travaux de recherche. Il s’adresse aux professionnels de l’information, aussi bien producteurs d’information, éditeurs, gestionnaires et utilisateurs finaux.</p>
<p>Le projet <a href="http://www.datalift.org/">Datalift</a> sera présenté, notamment comme solution concrète de passage de l&#8217;Open Data au Linked Open Data, de la donnée brute à la donnée liée.</p>
<p>De plus en plus d’administrations et d’entreprises ont à prendre en compte des données hétérogènes, non normalisées, produites par des acteurs de leur écosystème proche comme lointain.</p>
<p>Dans ce contexte, le projet Datalift crée un système logiciel pour a) capter des jeux de données provenant de multiples sources internes et externes, notamment opendata b) les convertir à l’aide de vocabulaires (ontologies) c) afin d’obtenir leur équivalent exprimé dans les formats du web des données d) permettant alors leur enrichissement croisé et e) l’exploitation de cette nouvelle richesse.</p>
<p>Tout nouveau jeu de données bénéficient de ceux déjà « liftés » et ceux-ci bénéficient de tout nouveau jeu entrant. Datalift, c&#8217;est le cercle vertueux dans le web des données.</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Présentation de Datalift au GFII" data-url="http://www.kepeklian.com/blog/2011/12/11/presentation-de-datalift-au-gfii/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/12/11/presentation-de-datalift-au-gfii/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Opendata &amp; Quality</title>
		<link>http://www.kepeklian.com/blog/2011/08/01/opendata-quality/</link>
		<comments>http://www.kepeklian.com/blog/2011/08/01/opendata-quality/#comments</comments>
		<pubDate>Mon, 01 Aug 2011 20:38:19 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[linked data]]></category>
		<category><![CDATA[linked opendata]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[linked]]></category>
		<category><![CDATA[lod]]></category>
		<category><![CDATA[qualite]]></category>
		<category><![CDATA[quality]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1202</guid>
		<description><![CDATA[Cela fait un tour de temps que je navigue et observe ce qui est mis en ligne sous le nom<a href="http://www.kepeklian.com/blog/2011/08/01/opendata-quality/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Cela fait un tour de temps que je navigue et observe ce qui est mis en ligne sous le nom d&#8217;Opendata. Bien sûr, ce sont des données, bien sûr elles sont mises à disposition, bien sûr il y a souvent une fiche de méta données plus ou moins complètes, et il y a même des portails qui s&#8217;organisent pour les mettre en catalogue &#8230; bref ce sont là des ingrédients qui disent que ce sont bien des données publiques répondant aux exigences d&#8217;un cahier des charges.</p>
<p>Mais justement, parlons un peu de ce cahier des charges. Il y a comme une partie importante du problème qui est oubliée. Le jeu de données, le dataset, doit être intrinsèquement de qualité et cette qualité semble ne pas être clairement définie. </p>
<p>Aujourd&#8217;hui, le dataset est de mieux en mieux défini extérieurement. Il a un nom,  des dates (création, mise(s) à jour, péremption), des acteurs de référence (créateur, diffuseur, administrateur, etc.), une typologie (format, domaines, etc.) &#8230; mais si on veut travailler avec autrement que manuellement, là, ça se complique. En effet, que sait-on de sa qualité interne ?</p>
<p>Or précisément, un bon dataset n&#8217;est-il pas fait pour être utiliser, pour permettre des nouveaux traitements, pour innover et servir à une entreprise, une organisation&#8230; Les gouvernements qui poussent à l&#8217;ouverture des données attendent qu&#8217;un développement économique effectivement en découle. Si les jeux de données ne sont pas exploitables, ou à des coûts trop élevés, ne risque t-on pas de perdre l&#8217;élan actuellement suscité ?</p>
<p>Par exemple, un fichier produit par un traitement de textes a peu de chance de servir à quelque chose dans un dispositif de traitement automatique sauf si on a déjà l&#8217;application faite juste pour ce fichier. Avec un fichier PDF, c&#8217;est pareil &#8230; En fait, les bons formats, on les connait mais ils sont encore trop peu utilisés dans la publication de jeux de données ;-( On a encore du chemin à faire avant de trouver quelques datasets dans les formats du web des données (en RDF, N3,Turtle&#8230;) De fait, actuellement, les développements réalisés sur la base de datasets opendata sont pour grande part des travaux spécifiques de conversion de données.</p>
<p>Un deuxième critère est l&#8217;utilisation d&#8217;un vocabulaire (ontologie) dans l&#8217;expression des données. C&#8217;est par ce moyen que les interconnexions de jeux de données deviennent possibles. (Pensez aux mashups).</p>
<p>Un autre critère de qualité des données est leur exactitude. Par exemple, dans l&#8217;<a href="http://www.proximamobile.fr/sites/default/files/RapportDonneesPubliques2011.pdf">étude toute récente</a> réalisée par des étudiants de l&#8217;Ecole des Ponts, on peut lire que &#8220;les données sur le système<br />
national de transports publics en Grande-Bretagne, mises en ligne en 2010, contenaient près de 6% de localisations d’arrêts de bus erronées&#8221;. Et ces inexactitudes n&#8217;ont pu être relevées que par des usagers.</p>
<p>Une autre qualité est la fraîcheur du dataset. Actuellement, nombre de jeux de données ne semblent être exposés qu&#8217;a des fins de test et leur données ne sont pas mises à jour. Que vaut un dataset sur les prix du carburant dans telle région quand il a plus d&#8217;un an d&#8217;âge ?</p>
<p>C&#8217;est grâce à des plateformes comme <a href="http://www.datalift.org">Datalift</a> que les datasets actuels pourront être &#8220;élevés&#8221; pour devenir des objets du web des données. Le lifting des jeux de données permet en effet de satisfaire toutes ces exigences de qualité.</p>
<p>1 &#8211; <strong>Publier dans un format dédié au traitement automatique des données</strong> : la plateforme automatise les processus d&#8217;élévation dans des formats du web des données.</p>
<p>2 &#8211; <strong>Référer les données à un vocabulaire</strong> : les datasets contiennent des données, des valeurs. L&#8217;utilisation d&#8217;un vocabulaire (ontologie), c&#8217;est un peu comme donner une valeur avec son unité de mesure. Par exemple, c&#8217;est plus parlant de savoir que le &#8220;mur mesure 4m&#8221; plutôt que d&#8217;avoir seulement la valeur 4. La plateforme gère un catalogue de vocabulaires de référence.</p>
<p>3 &#8211; <strong>Distinguer les données</strong> : c&#8217;est par exemple permettre de s&#8217;assurer que deux applications parlent bien de la même chose quand elles désignent un objet. Techniquement, c&#8217;est l&#8217;utilisation d&#8217;URI.</p>
<p>4 &#8211; <strong>Vérifier l&#8217;exactitude des données</strong> : les datasets élevés dans des formats idoines peuvent être interconnectés et les incohérences peuvent être détectées (par exemple par inférence).</p>
<p>5 &#8211; <strong>Rafraîchir les données</strong> : c&#8217;est un disposant d&#8217;une plateforme automatisant le lifting qu&#8217;on peut mettre à jour facilement les datasets qui dans le cas contraire nécessiteraient des manipulations manuelles et donc longues et onéreuses.</p>
<p>La satisfaction de ces 5 qualités permet le passage effectif de l&#8217;Opendata au Linked Opendata.</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Opendata & Quality" data-url="http://www.kepeklian.com/blog/2011/08/01/opendata-quality/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/08/01/opendata-quality/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Quelle autorité pourra porter l&#8217;Opendata international ?</title>
		<link>http://www.kepeklian.com/blog/2011/07/18/quelle-autorite-pourra-porter-lopendata-international/</link>
		<comments>http://www.kepeklian.com/blog/2011/07/18/quelle-autorite-pourra-porter-lopendata-international/#comments</comments>
		<pubDate>Mon, 18 Jul 2011 14:06:45 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[Actualités]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[benchmark]]></category>
		<category><![CDATA[politique]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1198</guid>
		<description><![CDATA[Le mouvement est lancé, l&#8217;opendata commence à être compris d&#8217;un certain nombre d&#8217;acteurs de la scène publique. Au niveau d&#8217;une<a href="http://www.kepeklian.com/blog/2011/07/18/quelle-autorite-pourra-porter-lopendata-international/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Le mouvement est lancé, l&#8217;opendata commence à être compris d&#8217;un certain nombre d&#8217;acteurs de la scène publique. Au niveau d&#8217;une quarantaine de pays (voir mon post <a href="http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/">Opendata, une vision de la situation internationale</a>), l&#8217;intérêt suscité se concrétise avec des réalisations plus ou moins significatives. Les plannings sont à peu près connus, et même si la crise frappe à nos portes, on travaille à mettre sur pied ce nouveau pan d&#8217;une économie imaginative et participée.</p>
<p>Or, il me paraît de plus en plus évident que nous avons besoin de croiser nos Opendata respectifs dans un vaste LinkedOpendata. Quelles sont les conditions de son émergence ?</p>
<p>a) Mettre en évidence et partager les bonnes pratiques</p>
<p>Un travail très intéressant est en cours sur le site <a href="https://checklists.opquast.com/opendata/workshop/">https://checklists.opquast.com/opendata/workshop/</a>. Je vous invite à participer.</p>
<p>b) Mettre au point les technologies de l&#8217;interconnexion</p>
<p>Je ne peux que recommander la recherche effectuée dans le projet <a href="http://www.datalift.org/">Datalift</a>.</p>
<p>c) Politiquement, ne faut-il pas aussi une méta-entité indépendante ?</p>
<p>Ca y est, je rêve &#8230; Thomas More aurait bien écrit une page là-dessus, non ? Sérieusement, peut-on penser que les datasets de valeur et portée internationale ne devraient pas être publiés de façon supranationale ? D&#8217;ailleurs, nous avons déjà un exemple &#8230; wikipedia et son alter ego dbpedia ! Pas de régulation autre qu&#8217;une autorégulation, une crowdregulation ? Avez-vous des modèles à proposer ?</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Quelle autorité pourra porter l'Opendata international ?" data-url="http://www.kepeklian.com/blog/2011/07/18/quelle-autorite-pourra-porter-lopendata-international/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/07/18/quelle-autorite-pourra-porter-lopendata-international/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Opendata, désordre d&#8217;URI ?</title>
		<link>http://www.kepeklian.com/blog/2011/07/08/opendata-desordre-duri/</link>
		<comments>http://www.kepeklian.com/blog/2011/07/08/opendata-desordre-duri/#comments</comments>
		<pubDate>Fri, 08 Jul 2011 12:08:53 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[linkingopendata]]></category>
		<category><![CDATA[lod]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1193</guid>
		<description><![CDATA[Dans mon post d&#8217;hier, j&#8217;ai collectionné les URL des sites où de nombreux états commencent à publier leurs datasets opendata.<a href="http://www.kepeklian.com/blog/2011/07/08/opendata-desordre-duri/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Dans mon post d&#8217;hier, j&#8217;ai collectionné les URL des sites où de nombreux états commencent à publier leurs datasets opendata. Si on regarde bien les règles de nommage de ces URL, on s&#8217;aperçoit que le &#8220;DATA.GOV&#8221; a fait école puisque l&#8217;Angleterre a suivi avec son &#8220;DATA.GOV.UK&#8221; lequel a fait école puisque on trouve désormais des &#8220;DATA.GOV.xx&#8221; où xx est le pays comme au, ma, md et sg.</p>
<p>Mais la grosse majorité a choisi de faire autrement. Dommage ! Cela aurait été une bonne façon de faciliter l&#8217;ouverture &#8230; Au lieu de cela, il faut avoir la bonne URL ou bien chercher, et cela peut prendre du temps.</p>
<p>Ce sont les URI qui ne vont pas y trouver leur compte, donc le Linked Open Data. Au moment d&#8217;ouvrir ses données, pourquoi il n&#8217;y a pas de réflexion sur la liaison des données ?</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Opendata, désordre d'URI ?" data-url="http://www.kepeklian.com/blog/2011/07/08/opendata-desordre-duri/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/07/08/opendata-desordre-duri/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Opendata, une vision de la situation internationale</title>
		<link>http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/</link>
		<comments>http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/#comments</comments>
		<pubDate>Wed, 06 Jul 2011 23:57:57 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[linked data]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1161</guid>
		<description><![CDATA[Difficile de dresser une carte internationale de l&#8217;Opendata, mais en fouillant bien &#8230; dans ce monde encore à organiser (vivement<a href="http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Difficile de dresser une carte internationale de l&#8217;Opendata, mais en fouillant bien &#8230; dans ce monde encore à organiser (vivement que <a href="http://datalift.org/">Datalift</a> soit opérationnel !), on peut réussir à extraire de quoi satisfaire la curiosité des ouvreurs de données et autres &#8220;philodates&#8221;.</p>
<p>Vous serez étonnés de voir certains pays être très en avance et d&#8217;autres à la traine &#8230;</p>
<p>Au 6 juillet 2011, voici ce que j&#8217;ai récolté. <em><strong>N&#8217;hésitez pas à m&#8217;envoyer des compléments et vos remarques !</strong></em></p>
<ol>
<li><a href="http://www.openberlin.net/">Allemagne</a> ; 0 datasets &#8211; C&#8217;est la ville de Berlin qui avance le premier pion &#8230; on réfléchit</li>
<li><a href="http://data.gov.uk/">Angleterre</a> ; 5138 datasets primaires; 2012 datasets secondaires &#8211; Pionnier, après les Etats-Unis</li>
<li><a href="http://data.gov.au/">Australie</a> ; 1240 datasets</li>
<li><a href="http://www.ogd2011.at/">Autriche</a> ; 0 datasets mais on en se prépare</li>
<li><a href="http://www.data.gc.ca/">Canada</a> ; 801 datasets</li>
<li><a href="http://dadesobertes.gencat.cat/">Catalogne</a> ; quelques datasets</li>
<li><a href="http://digitaliser.dk/">Danemark</a> ; 0 datasets &#8211; et aussi <a href="http://data.digitaliser.dk/">http://data.digitaliser.dk/</a></li>
<li><a href="http://www.proyectoaporta.es/web/guest/index">Espagne</a> ; 0 datasets &#8211; voir aussi Catalogne et Pays basque</li>
<li><a href="http://www.opendata.ee/en/">Estonie</a> ; 0 datasets &#8211; Le projet se met en place</li>
<li><a href="http://data.gov/">Etats-Unis</a> ; 3301 datasets &#8211; Le pionnier !</li>
<li><a href="http://www.hri.fi/en/">Finlande</a> &#8211; Région d&#8217;Helsinki : 2011, un environnement de test ; 2012, ouverture du service</li>
<li><a href="http://blog.etalab.gouv.fr/">France</a> ; 0 datasets &#8211; On commence par Etalab &#8230; puis viendra data.gouv.fr &#8211; En France, ce sont les villes de Rennes et Paris qui ont exposé les premiers datasets</li>
<li><a href="http://www.geodata.gov.gr/geodata/">Grèce</a> Un premier effort pour libérer les données géospatiales disponibles</li>
<li><a href="http://www.gov.hk/tc/theme/psi/welcome/">Hong Kong</a> ; 0 datasets &#8211; Annonce faite le 31 mars 2011</li>
<li><a href="http://www.siliconrepublic.com/strategy/item/21596-irish-government-called-on/">Irlande</a> ; 75 datasets</li>
<li><a href="http://www.opendatani.info">Irlande du Nord</a> ; 6 datasets</li>
<li><a href="http://www.trentinoopendata.eu/en">Italie</a> ; 220 datasets</a> &#8211; et ses régions : <a href="http://dati.piemonte.it">Piémont</a> ; 230 datasets ; <a href="http://www.datagov.it/">Portail italien</a> et <a href="http://it.ckan.net/">Datasets italiens référencés</a></li>
<li><a href="http://www.opendata.go.ke">Kénya</a> ; 164 datasets</li>
<li><a href="http://data.gov.ma/Pages/Home.aspx">Maroc</a> ; 24 datasets</li>
<li><a href="http://data.gov.md/en">Moldavie</a> ; 132 datasets</li>
<li><a href="http://data.norge.no">Norvège</a> ; 11 datasets</li>
<li><a href="http://www.data.govt.nz/">Nouvelle Zélande</a> ; 594 datasets</li>
<li><a href="http://opendata.euskadi.net">Pays basque</a> ; 1630 datasets</li>
<li><a>Pologne</a> ; 0 datasets &#8211; Annonce le 9 juin 2011 du gouvernement polonais</li>
<li><a href="http://opengovdata.ru">Russie</a> ; 5 datasets</li>
<li><a href="http://data.gov.sg/home.aspx">Singapour</a> ; 5978 datasets</li>
<li><a href="http://www.opengov.se/data">Suède</a> ; 20 datasets</li>
<li><a href="http://data.pm.go.th/">Thaïlande</a> ; 26 datasets</li>
<li><a>Timor-Leste (oriental)</a> ; manque d&#8217;info, mais il semble qu&#8217;il y ait déjà un projet</li>
</ol>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Opendata, une vision de la situation internationale" data-url="http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/07/07/opendata-une-vision-de-la-situation-internationale-2/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Organiser le web des données</title>
		<link>http://www.kepeklian.com/blog/2011/06/25/organiser-le-web-des-donnees/</link>
		<comments>http://www.kepeklian.com/blog/2011/06/25/organiser-le-web-des-donnees/#comments</comments>
		<pubDate>Sat, 25 Jun 2011 08:55:24 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[linked data]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[données]]></category>
		<category><![CDATA[outils]]></category>
		<category><![CDATA[usages]]></category>
		<category><![CDATA[utilisateurs]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1143</guid>
		<description><![CDATA[Qui sera le google du web des données ?
Le web des données s&#8217;organise. Tout le monde en parle, et plusieurs<a href="http://www.kepeklian.com/blog/2011/06/25/organiser-le-web-des-donnees/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Qui sera le google du web des données ?</p>
<p>Le web des données s&#8217;organise. Tout le monde en parle, et plusieurs solutions émergent de ci de là. Mais qu&#8217;est-ce que cela veut dire que le web des données s&#8217;organise ?</p>
<li><strong>Du côté des données </strong>
<ul>
<li> Les données sont-elles plus organisées (au niveau de la donnée elle-même) ?</li>
<li> Les ensembles de données (dataset) sont-ils mieux organisés ?</li>
<li> Les regroupements d&#8217;ensemble de données (data.dot) sont-ils rationnellement structurés ?</li>
<li> Des standards sont-ils reconnus et appliqués significativement ?</li>
</ul>
</li>
<li><strong>Du côté des outils </strong>
<ul>
<li> Les outils de manipulations de données sont-ils diffusés et utilisés largement ?</li>
<li> Les ontologies sont-elles partagées massivement ?</li>
<li> Les alignements sont-ils monnaie courante ?</li>
<li> Les rdfisations et autres triplisarions sont-elles disponibles ?</li>
<li>L&#8217;interconnexion des données a-t-elle cours ?</li>
<li>Les solutions open source de bout en bout sont-elles téléchargeables ?</li>
<li>Les sites d&#8217;hébergement sont-ils opérationnels ?</li>
</ul>
</li>
<li><strong>Du côté des utilisateurs</strong>
<ul>
<li>Est-ce que les enjeux du web des données sont compris ?</li>
<li>Les formations universitaires et les écoles d&#8217;ingénieur prennent-elles en compte le web des données ?</li>
<li>Les entreprises ont-elles des projets dans le web des données ?</li>
<li>Les délivreurs de données ouvertes (open data) ont-ils délivré leurs données ouvertes ?</li>
</ul>
</li>
<li><strong>Du côtés des usages </strong>
<ul>
<li> Est-il facile d&#8217;obtenir des données (pas des données brutes bien sûr) ?</li>
<li> Est-il facile d&#8217;utiliser des données ?</li>
<li> Est-il facile de partager des données ?</li>
<li>Commence-t-on à utiliser le web des données comme Monsieur Jourdain ?</li>
</ul>
<p>Les questions sont nombreuses et je pourrai en ajouter. Globalement, les choses avancent &#8230; et il y a du travail pour tous. Comme toujours, les premiers qui auront investi dans ce vaste monde en tireront le meilleur. Y aura-t-il beaucoup de places dans ce web ? Dans le web des documents, c&#8217;est Google qui a mangé le gâteau en offrant le moteur de recherche, l&#8217;outil qui organise le web des documents.</p>
<p>Ma question est simple : qui sera le google du web des données ? (et je ne veux pas dire que la solution est d&#8217;apporter un moteur de recherche pour le web des données)</li>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Organiser le web des données" data-url="http://www.kepeklian.com/blog/2011/06/25/organiser-le-web-des-donnees/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/06/25/organiser-le-web-des-donnees/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Sémantiser des données brutes</title>
		<link>http://www.kepeklian.com/blog/2011/06/21/semantiser-des-donnees-brutes/</link>
		<comments>http://www.kepeklian.com/blog/2011/06/21/semantiser-des-donnees-brutes/#comments</comments>
		<pubDate>Tue, 21 Jun 2011 00:20:44 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[linked data]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[datalift]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1140</guid>
		<description><![CDATA[Quand on veut se lancer dans le monde du Web des données (alias Web sémantique ou Web 3.0, mais sincèrement<a href="http://www.kepeklian.com/blog/2011/06/21/semantiser-des-donnees-brutes/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Quand on veut se lancer dans le monde du Web des données (alias Web sémantique ou Web 3.0, mais sincèrement il vaut mieux parler de Web des données), le plus simple est de partir de ses données, en commençant par celles qui sont structurées. Prenez donc parmi vos feuilles de calcul, vos documents XML, vos bases de données, etc.</p>
<p>Trouver des vocabulaires (des ontologies) existants qui se rapportent au domaine de vos données ou créer vos vocabulaires. Vous pouvez utiliser</p>
<ul>
<li>le <a href="http://labs.mondeca.com/dataset/lov/index.html">Linked Open Vocabularies</a> (LOV) de Mondéca,</li>
<li>le moteur de recherche <a href="http://swoogle.umbc.edu/">swoogle</a>,</li>
<li>consulter la <a href="http://protegewiki.stanford.edu/wiki/Protege_Ontology_Library">liste publiée par Protégé</a>,</li>
<li>ou <a href="http://www.co-ode.org/ontologies/">celle de Co-ode</a></li>
<li>il doit bien y avoir encore d&#8217;autres outils&#8230; cherchez bien</li>
<li>pour aligner vos ontologies, vous pouvez regarder par exemple <a href="http://www.atl.lmco.com/projects/ontology/">ici</a>.</li>
</ul>
<p>Il faut alors utiliser des &#8220;convertisseurs&#8221; pour transformer les données initiales en données sémantisées. Des bibliothèques commencent à se constituer. Elles sont très inégales.</p>
<ul>
<li><a href="http://simile.mit.edu/wiki/RDFizers">RDFizer</a></li>
<li><a href="http://virtuoso.openlinksw.com/whitepapers/Virtuoso%20Sponger.html">Virtuoso Sponger</a></li>
<li><a href="http://triplify.org/Overview">Triplify</a></li>
<li><a href="http://www.pirrotta.it/giovanni/triplisty/">Triplisty</a></li>
<li>Ici encore, vous en trouverez d&#8217;autres en cherchant&#8230;</li>
</ul>
<p>Dans tous les cas, avancer de façon agile, c&#8217;est à dire mesurée. Cela vous donnera des idées &#8230;</p>
<p>Le projet de recherche et développement <a href="http://www.datalift.org">DataLift</a> réalise une infrastructure open source dont les premiers étages sont consacrés 1) à la sélection d&#8217;ontologie et 2) à la conversion.</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Sémantiser des données brutes" data-url="http://www.kepeklian.com/blog/2011/06/21/semantiser-des-donnees-brutes/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/06/21/semantiser-des-donnees-brutes/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Du Web 2.0 pour anticiper le Web 3.0</title>
		<link>http://www.kepeklian.com/blog/2011/05/13/du-web-2-0-pour-anticiper-le-web-3-0/</link>
		<comments>http://www.kepeklian.com/blog/2011/05/13/du-web-2-0-pour-anticiper-le-web-3-0/#comments</comments>
		<pubDate>Fri, 13 May 2011 01:06:09 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[web 2.0]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[anticipation]]></category>
		<category><![CDATA[débat]]></category>
		<category><![CDATA[sparklingpoint]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1100</guid>
		<description><![CDATA[Jeudi 19 mai 2011, je suis invité par sparklingPoint pour débattre de l&#8217;émergence du Web sémantique dans le monde de<a href="http://www.kepeklian.com/blog/2011/05/13/du-web-2-0-pour-anticiper-le-web-3-0/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Jeudi 19 mai 2011, je suis invité par <a href="http://sparklingpoint.com/networking.html">sparklingPoint</a> pour débattre de l&#8217;émergence du Web sémantique dans le monde de l&#8217;entreprise. SparklingPoint est une communauté d&#8217;échange d&#8217;expériences sur les technologies de l&#8217;information.</p>
<p>Je suis intéressé par le phénomène et l&#8217;usage qui, tous les deux, informent nos décisions d&#8217;adhérer ou de refuser le 3.0. Je suis persuadé que l&#8217;ouverture des données est une chance. Mais adviendra-t-elle ? Comment ? A quelles conditions ?</p>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Du Web 2.0 pour anticiper le Web 3.0" data-url="http://www.kepeklian.com/blog/2011/05/13/du-web-2-0-pour-anticiper-le-web-3-0/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/05/13/du-web-2-0-pour-anticiper-le-web-3-0/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>La réutilisation des données publiques, ça bouge</title>
		<link>http://www.kepeklian.com/blog/2011/03/04/la-reutilisation-des-donnees-publiques-ca-bouge/</link>
		<comments>http://www.kepeklian.com/blog/2011/03/04/la-reutilisation-des-donnees-publiques-ca-bouge/#comments</comments>
		<pubDate>Fri, 04 Mar 2011 18:14:36 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[données publiques]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1062</guid>
		<description><![CDATA[Le monde anglo-saxon s&#8217;est déjà engagé dans cette voie depuis quelques années. Tout le monde observe, on s&#8217;interroge. Les questions<a href="http://www.kepeklian.com/blog/2011/03/04/la-reutilisation-des-donnees-publiques-ca-bouge/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>Le monde anglo-saxon s&#8217;est déjà engagé dans cette voie depuis quelques années. Tout le monde observe, on s&#8217;interroge. Les questions sont techniques, organisationnelles, économiques, normatives&#8230; et tout simplement pratiques.</p>
<p>Et il y a des réponses :</p>
<ul>
<li>techniques : le web des données, l&#8217;open data, les bases non SQL, des projets comme <a href="http://datalift.org/">Datalift</a>, etc.</li>
<li>organisationnelles : la création d&#8217;agences, de portails comme <a href="http://www.data-publica.com/">Data Publica</a>, etc.</li>
<li>économiques : pour l&#8217;instant, ce sont essentiellement les états qui financent, les réutilisateurs privés attendent du gratuit</li>
<li>normatives : le W3C a déjà produit un important travail</li>
<li>pratiques : les usages se cherchent encore, mais des mashups intéressants montrent des pistes prometteuses</li>
</ul>
<p>En France, après l&#8217;<a href="https://www.apiefrance.fr/">APIE</a>, nous avons depuis une semaine <a href="http://www.service-en-ligne.fr/index.php/teleservices/open-data--etalab">Etalab</a> qui font suite à des initiatives locales avant-gardistes à <a href="http://www.data.rennes-metropole.fr/">Rennes</a> et <a href="http://opendata.paris.fr/opendata/jsp/site/Portal.jsp">Paris</a>. Ca bouge aussi à Nantes, Bordeaux, Toulouse, Marseille, Montpellier, Toulon, Le Havre &#8230;</p>
<p>Des conférences sont proposées sur le sujet par différentes organisations, comme par exemple :</p>
<ul>
<li><a href="http://www.semweb.pro/">SemWeb.Pro</a>, une conférence dédiée à l&#8217;univers du Web Sémantique, le lundi 17 janvier 2011</li>
<li><a href="http://calenda.revues.org/nouvelle19009.html">La réutilisation des données publiques : quels défis pour les archives ?</a>, Journée d&#8217;étude, <em>Calenda</em>, le vendredi 11 mars 2011</li>
<li><a href="http://lesplanade.org/picolibre-apero-numerique-du-11-mars-louverture-des-donnees-publiques/">Picolibre</a> (Apéro Numérique) du 11 mars : L’ouverture des données publiques</li>
<li><a href="http://barcamp.org/w/page/35514014/SemanticCampParis3">SemanticCamp</a> à Paris 3 le 16 avril 2011</li>
<li><a href="http://www.afnor.org/liste-des-evenements/agenda/2011/mai/referentiels-et-donnees-d-autorite-a-l-heure-du-web-semantique-journee-annuelle-afnor-bnf-le-27-mai-a-paris">Référentiels et données d’autorité à l’heure du web sémantique</a>, journée annuelle AFNOR/BnF le 27 mai à Paris</li>
</ul>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="La réutilisation des données publiques, ça bouge" data-url="http://www.kepeklian.com/blog/2011/03/04/la-reutilisation-des-donnees-publiques-ca-bouge/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/03/04/la-reutilisation-des-donnees-publiques-ca-bouge/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Quelques données chiffrées sur des datasets du Linking Open Data</title>
		<link>http://www.kepeklian.com/blog/2011/02/21/1011/</link>
		<comments>http://www.kepeklian.com/blog/2011/02/21/1011/#comments</comments>
		<pubDate>Mon, 21 Feb 2011 22:43:11 +0000</pubDate>
		<dc:creator>gabriel</dc:creator>
				<category><![CDATA[opendata]]></category>
		<category><![CDATA[web de données]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[dataset]]></category>
		<category><![CDATA[linkingopendata]]></category>
		<category><![CDATA[lod]]></category>

		<guid isPermaLink="false">http://www.kepeklian.com/blog/?p=1011</guid>
		<description><![CDATA[On me demande souvent des chiffres sur ces fameux datasets qui commencent à peupler le LOD (Linking Open Data). Voici<a href="http://www.kepeklian.com/blog/2011/02/21/1011/" class="searchmore">Read the Rest...</a><div class="clr"></div>]]></description>
			<content:encoded><![CDATA[<p>On me demande souvent des chiffres sur ces fameux datasets qui commencent à peupler le LOD (Linking Open Data). Voici donc quelques statistiques sur des ensembles de données disponibles :</p>
<ul>
<li><a href="http://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/DataSets/Statistics">TaskForces CommunityProjects LinkingOpenData DataSets Statistics</a></li>
<li><a href="http://www4.wiwiss.fu-berlin.de/lodcloud/">Datasets in the next LOD Cloud</a></li>
<li><a href="http://data-gov.tw.rpi.edu/wiki/Data.gov_Catalog">A listing of datasets published at http://data.gov and converted into RDF</a></li>
<li><a href="http://www.researchpipeline.com/mediawiki/index.php?title=Main_Page">Research Pipeline&#8217;s wiki</a></li>
<li><a href="http://lib.stat.cmu.edu/datasets/">StatLib&#8212;Datasets Archive</a></li>
<li><a href="http://lib.stat.cmu.edu/jasadata/">StatLib&#8212;JASA Data Archive</a></li>
</ul>
<p>Voici une <a href="http://data-gov.tw.rpi.edu/sparql">requête SPARQL qui permet d&#8217;interroger le data.gov</a> américain :</p>
<pre>PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;
SELECT ?g ?number_of_triples
WHERE
{GRAPH ?g
{
?s a &lt;http://data-gov.tw.rpi.edu/2009/data-gov-twc.rdf#Dataset&gt; .
?s &lt;http://data-gov.tw.rpi.edu/2009/data-gov-twc.rdf#number_of_triples&gt; ?number_of_triples.
filter ( regex( str(?g) , "Dataset") )
}
}
order by ?g</pre>

	<div style="">
		<a href="http://twitter.com/share" class="twitter-share-button" data-count="vertical" data-text="Quelques données chiffrées sur des datasets du Linking Open Data" data-url="http://www.kepeklian.com/blog/2011/02/21/1011/" >Tweet</a>
	</div>
	<script type="text/javascript" src="http://platform.twitter.com/widgets.js"></script>]]></content:encoded>
			<wfw:commentRss>http://www.kepeklian.com/blog/2011/02/21/1011/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

