Personne contact

Camille Maumet

Participants

Titre

Data about data

Description du projet et des données utilisées

Ce projét est autour de la découvrabilité des données. L’objectif est de répondre aux questions des chercheurs qui souhaitent faire connaître les informations relatives à leurs jeux de données sans pour autant partager les données elles-mêmes. Comment décrire les échantillons ? Quelles informations partager ? Comment indexer ces données ? De même, des questions similaires peuvent se présenter aux experts en science du numérique au moment de sélectionner ou réutiliser un jeu de données.

Résultats attendus

État d’avancement du projet :

0_ Concept - Aucun contenu

Compétences attendues

Biologie; Santé; Ontologies

Outils - logiciels - méthodes

Registres d’ontologies (BioPortal, ontobee , AberOWL, BioSamples), éventuellement OWL/RDF

Liens outils

Rapport d’avancement

   
Objectifs Division en 3 sous projets : 1. Modélisation des échantillons : revue des modèles existants et de leur utilisation en biologie/santé. 2.Discussion structuration des données d’un projet pour communication interne (plate-forme). 3. Amélioration d’import + export en BIDS dans Shanoir
Premiers résultats  
1. Discussion sur les pratiques (sémantique dans les noms de fichiers …) et l’existant (Gene Ontology, etc.). / Exploration de l’ontologie BioSamples. Exploration des ontologies légères BioSchemas (BioSample, Study, Phenotypes).
2. Discussion sur les pratiques internes des plate-formes. / Description des formats de données brutes. / Discussion du cycle de vie d’un projet : acquisition / analyse / publication. / Echange sur le partage de données dans les communautés (partage obligatoire des données au moment de la publication dans une base publique). Echange sur l’utilité de /partager connaître la “richesse” des informations disponibles pour une meilleure utilisation des données existantes / la mise en place de collaborations.
Difficultés techniques Se mettre d’accord sur les objectifs

WrapUp

TODO :