Personne contact

Adrien FOUCAL

Participants

Titre

Full-ChipSeq

Repository du projet sur GitLab

Description du projet et des données utilisées

Un pipeline snakemake pour traiter les données ChIP-seq humaines sur une machine linux. Ce pipeline vous permettra de faire ce qui suit :

Ce pipeline est basé sur le pyflow-ChIP-seq développé par Ming Tang. J’ai reconditionné la plupart des étapes, ajouté et supprimé quelques-unes, créé de nouveaux environnements de conda et regroupé tous les résultats de contrôle de qualité dans multiQC. Ce pipeline devrait être facile à installer avec snakemake et conda présents sur le système. Pour l’instant, il fonctionne sur un cluster de sge.

Résultats attendus

L’objectif est d’apprehender l’installation du pipeline et à quel point il est nécéssaire de modulariser la prise en compte des différents types de données de Chip-Seq (pairted end, single end, CUT&RUN)

État d’avancement du projet :

2 (existence)

Compétences attendues

Du bioinformaticien expérimenté au biologiste qui s’essaye à la ligne de commande

Outils - logiciels - méthodes

Snakemake et Conda

Liens utiles

Repository du projet sur GitLab

Rapport d’avancement

   
Objectifs Définir une approche pour intégrer des données de séquencçage Chip-Seq hétérogène : Single vs Paired end, Chip-seq vs Cut&run
Premiers résultats Feuille de route : L’outil snakemake rend ce genre de gestion possible: Utilisation de fonctions pour la sélection des échantillons en input et règles conditionnelles à tester.
Difficultés techniques Prise en main des pipelines. Travail en amont sur les fichiers de configuration et les données tests

Données partagées en libre accès.