TECHOZYME
« SIZING » EN NGS : LES POINTS CLÉS POUR L'OBTENTION DE RÉSULTATS EXPLOITABLES
INTRODUCTION
—————
Au cours des dernières années, le séquençage haut débit NGS (Next-Generation Sequencing) a révolutionné le monde du séquençage et de la biologie. Les applications du NGS ont permis des avancées importantes et rapides dans de nombreux domaines : diagnostic, microbiologie, épidémiologie, génomique comparative, etc…

Le processus de base de construction d’une banque NGS consiste à fragmenter l’ADN génomique (DNA-Seq), l’ARN ou l’ADNc rétro-transcrit à partir d’ARN (RNA-Seq), à récupérer la fraction comprenant les tailles d’intérêt (« sizing ») et lier des adaptateurs aux extrémités des fragments. Les ADN ainsi préparés sont quantifiés, déposés sur la plateforme NGS, amplifiés et les données de séquences générées analysées. Cette dernière étape peut être longue et fastidieuse, il est donc important d’optimiser chaque étape en amont, afin d’éliminer d’emblée les séquences inutiles.
Workflow pour construire une banque NGS
La préparation de banques de haute qualité a un rôle déterminant pour l’exploitation finale des données (Head et al, 2014*). Le « sizing », pour l’obtention de fragments ayant des tailles adéquates, ainsi que la quantification précise de l’ADN sont des étapes particulièrement critiques et sont détaillées dans ce TechOzyme.
LE « SIZING »
—————
L’étape de fragmentation, réalisée par des méthodes physiques ou enzymatiques, aboutit à un large panel de tailles de fragments. En l’absence d’une sélection fiable des tailles, des séquences inutiles sont générées :
Dimères d’amorces, dimères d’adaptateurs qui peuvent être séquencés de façon préférentielle en raison de leur petite taille
Fragments de taille inférieure à la longueur lue sur la plateforme NGS
La sélection de tailles précises et définies peut être importante dans le cas d’assemblage de nouvelles séquences (séquençage de novo ), etc …. En conséquence, les méthodes de séquençage NGS requièrent des fragments d’ADN de tailles finement sélectionnées pour des performances optimales (séquences utilisables, résultats publiables, …).

Les différentes méthodes de « sizing »
•   Electrophorèse manuelle
Les méthodes traditionnelles manuelles utilisent l’électrophorèse en gel (agarose ou polyacrylamide), avec découpe des bandes d’intérêt après migration. Facilement accessible dans les laboratoires, elle manque de reproductibilité, est longue et fastidieuse et n’est pas adaptée pour l’analyse d’un grand nombre d’échantillons.

•   Billes SPRI (Solid Phase Reversible Immobilization)
Les billes SPRI utilisées pour la purification et la sélection de l’ADN sont recouvertes de groupements carboxyles qui se lient de façon réversible à l'ADN en présence de polyéthylène glycol (PEG) et de sel. Cette approche permet le traitement simultané d’un grand nombre d’échantillons. En contrôlant les concentrations de PEG et de sel, il est possible de sélectionner des fragments d’ADN de taille définie. Mais les gammes de taille des fragments sont souvent trop étendues, notamment pour le séquençage de novo, et contiennent une forte proportion de petits fragments incluant majoritairement les séquences des adaptateurs et peu de séquences utiles.

•   Electrophorèse automatisée
Cette technique a l’avantage par rapport à l’électrophorèse manuelle de programmer la taille des fragments d’ADN et de les collecter de façon automatisée, très rapidement, assurant une précision dans les tailles des fragments collectés et une très bonne reproductibilité. Des appareils tels que le SageELF™ peuvent fractionner un échantillon d’ADN en plusieurs fractions contigües permettant la construction de banques de fragments avec des tailles différentes à partir d’un même échantillon.

Les résultats ci-dessous de l’analyse post-séquençage de la distribution des fragments d’une banque d’ADN génomique de Plasmodium falciparum montrent que le « sizing » avec le système automatisé Pippin™ Prep assure une distribution la plus fine avec un coefficient de variation de 3 - 4 %.
Distribution de fragments d'une banque d'ADN génomique obtenus avec le Pippin™ Prep
Post-sequencing mapped insert-size distributions graphs for Illumina sequencing libraries prepared form P. falciparum genomic DNA with size-cccselection using agarose gel electrophoresis (A), SPRI beads (B) and Pippin Prep (C). Quail, M.A. et al (2012)*
QUESTIONS FRÉQUEMMENT POSÉES
—————
Le « sizing » est-il obligatoire pour toutes les banques NGS ?
La taille des fragments, qui doit être comprise dans une certaine fourchette, est déterminée par les contraintes de la plateforme NGS utilisée et par l’application choisie. Par exemple, pour les banques de type “mate-pair” incluant une circularisation de l’ADN, on privilégie les fragments de grande taille (de 2 à 20 kb) ; pour les banques plus classiques, la taille des fragments se situe généralement entre 200 et 500 pb.

Est-il obligatoire d’utiliser toutes les pistes d’un gel simultanément en électrophorèse automatisée (système Pippin™ Prep ) ?
Avec le système Pippin™ Prep, il est possible d’utiliser seulement une partie des pistes pour un premier run et d’utiliser les pistes restantes ultérieurement. 
LE SAVIEZ-VOUS ?
—————
Pour réaliser un « sizing » optimal, il est nécessaire d’analyser en amont 2 paramètres :

•   La concentration précise de l’ADN : par spectrophotométrie avec le NanoDrop™ ou par fluorimétrie 
•   La qualité de l’ADN en analysant le profil des tailles présentes dans l’échantillon
OUTILS ACCESSIBLES EN LIGNE
—————
RÉFÉRENCES BIBLIOGRAPHIQUES
—————
*Quail, M.A. et al (2012) Evaluation and optimisation of preparative semi-automated electrophoresis systems for Illumina library preparation. Electrophoresis. Accepted article online. doi 10.1002/elps.201200128

Head, S.R et al (2014) Library construction for next-geeration sequening : overviews and challenge. Biotechniques 56:61-77 doi 10.2144/000114133