
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Type de données d'intérêt
je voudrais considérer
- Données génétiques (SNP, microsatelites, séquençage du génome entier, RFLP,… )
- Génétique - données phénotypiques (données liées à la maladie, QTL, etc… )
- Annotation et fonction de séquence
- Données transcriptomiques
Je voudrais inclure des données sur tout être vivant (y compris des données de fossiles) et pas seulement des données humaines. Pour éviter les problèmes de sémantique, je laisserais de côté les données épigénétiques.
Question
Quelle quantité (en octets) de ces données est disponible en libre accès en ligne ?
Des difficultés
Je me rends compte qu'il peut être difficile d'obtenir une telle estimation et que l'estimation peut être très inexacte. En outre, le format utilisé pour stocker ces données affectera certainement la relation entre le contenu de l'information et l'utilisation du stockage. Mais si quelqu'un peut donner juste un ordre de grandeur approximatif, une vague intuition, cela aiderait déjà. Est-ce quelques téraoctets ou quelques pétaoctets ou même plus ?
J'apprécierais également un détail de la façon dont vous êtes arrivé à cette estimation. Je suis particulièrement intéressé par la fraction de données humaines (si vous arrivez à des détails aussi fins).