janvier 28, 2023

7seizh

Dernières nouvelles et nouvelles du monde de 7 Seizh sur les affaires, les sports et la culture. Nouvelles vidéo. Nouvelles des États-Unis, d'Europe, d'Asie-Pacifique, d'Afrique, du Moyen-Orient, d'Amérique.

Nouvel outil de calcul plus précis pour le séquençage d’ARN à lecture longue – ScienceDaily

Au cours du voyage du gène à la protéine, la molécule d’ARN naissante peut être coupée et jointe, ou épissée, de diverses manières avant d’être traduite en une protéine. Ce processus, connu sous le nom d’épissage alternatif, permet à un seul gène de coder plusieurs protéines différentes. L’épissage alternatif se produit dans de nombreux processus biologiques, comme lorsque les cellules souches mûrissent en cellules spécifiques aux tissus. Au cours de la maladie, cependant, l’épissage alternatif peut être désorganisé. Par conséquent, il est important d’examiner le transcriptome, c’est-à-dire toutes les molécules d’ARN pouvant provenir de gènes, pour comprendre la cause profonde de la maladie.

Cependant, il a toujours été difficile de « lire » des molécules d’ARN entières car elles sont généralement longues de milliers de bases. Au lieu de cela, les chercheurs se sont appuyés sur le soi-disant séquençage d’ARN à lecture courte, qui décompose les molécules d’ARN et les séquence en fragments beaucoup plus courts, d’une longueur comprise entre 200 et 600 bases, selon la plate-forme et le protocole. Des programmes informatiques sont ensuite utilisés pour reconstruire la séquence complète des molécules d’ARN. Le séquençage d’ARN à lecture courte peut fournir des données de séquençage très précises, avec un faible taux d’erreur par base d’environ 0,1 % (ce qui signifie qu’une base est mal identifiée pour 1 000 bases séquencées). Cependant, il est limité dans les informations qu’il peut fournir en raison de la courte durée des lectures de séquençage. À bien des égards, le séquençage d’ARN à lecture courte revient à diviser une grande image en plusieurs pièces d’un puzzle de forme et de taille identiques, puis à essayer de reconstituer l’image.

READ  L'artiste Jeff Koons vise à envoyer des sculptures sur la lune sur un atterrisseur lunaire commercial

Récemment, des plateformes « à lecture longue » capables de séquencer des molécules d’ARN sur 10 000 bases de bout en bout sont devenues disponibles. Ces plates-formes ne nécessitent pas que les molécules d’ARN soient décomposées avant de pouvoir être séquencées, mais elles ont un taux d’erreur par base beaucoup plus élevé, généralement compris entre 5% et 20%. Cette limitation connue a gravement entravé l’adoption à grande échelle du séquençage d’ARN à lecture longue. En particulier, le taux d’erreur élevé a rendu difficile la détermination de la viabilité de nouvelles molécules d’ARN précédemment inconnues détectées dans une condition ou une maladie spécifique.

Pour contourner ce problème, des chercheurs de l’hôpital pour enfants de Philadelphie (CHOP) ont développé un nouvel outil informatique capable de détecter et d’identifier plus précisément les molécules d’ARN à partir de données de séquençage d’ARN à lecture longue sujettes aux erreurs. L’outil, nommé ESPRESSO (Error Assessment Tool for Error Statistics for Paste Location Options) a été signalé aujourd’hui dans La science avance.

« Le séquençage d’ARN à lecture longue est une technologie puissante qui nous permettra de détecter la variation de l’ARN dans les maladies génétiques rares et d’autres conditions, telles que le cancer », a déclaré Yi Xing, PhD, directeur du Centre de médecine génomique et informatique du CHOP et senior auteur. en train d’étudier. « Nous sommes peut-être à un point d’inflexion dans la façon dont nous découvrons et analysons les molécules d’ARN. La transition du séquençage d’ARN à lecture courte au séquençage à lecture longue représente un changement technologique passionnant, et des outils informatiques qui interprètent de manière fiable les données de séquençage d’ARN à lecture longue sont nécessaires de toute urgence. »

READ  Un retour lunaire, une lune de Jupiter, la fusée la plus puissante jamais construite et le télescope Webb

ESPRESSO peut détecter et identifier avec précision différentes molécules d’ARN du même gène – connues sous le nom d’isoformes d’ARN – en utilisant uniquement des données de séquençage d’ARN à lecture longue et sujettes aux erreurs. Pour ce faire, l’outil de calcul compare toutes les longues lectures de séquence d’ARN d’un gène donné à son ADN génomique correspondant, puis utilise les schémas d’erreur des longues lectures individuelles pour identifier en toute confiance les jonctions d’épissage – les endroits où une molécule d’ARN naissante a été coupés et joints, ainsi que les isoformes pleine longueur correspondant à l’ARN. En trouvant des régions d’une correspondance parfaite entre les longues lectures d’ARN-seq et l’ADN génomique, ainsi qu’en empruntant des informations sur toutes les longues lectures d’ARN-seq d’un gène, l’outil est capable d’identifier des jonctions d’épissage et des isoformes d’ARN hautement fiables, y compris celles qui n’ont pas été faites. Précédemment documenté dans les bases de données existantes.

Les chercheurs ont évalué les performances d’ESPRESSO à l’aide de données et de données simulées sur de vrais échantillons biologiques. Ils ont constaté qu’ESPRESSO fonctionnait mieux que de nombreux outils actuellement disponibles, à la fois en termes de détection et de quantification des isoformes d’ARN. Les chercheurs ont également généré et analysé plus d’un milliard de lectures d’ARN à longue séquence couvrant 30 tissus humains et trois lignées cellulaires humaines, fournissant une ressource utile pour étudier la variation du transcriptome humain à la résolution des isoformes d’ARN pleine longueur.

« Espresso résout un problème de longue date avec le séquençage de l’ARN à lecture longue et pourrait ouvrir de nouvelles opportunités de découverte », a déclaré le Dr Xing. « Nous prévoyons qu’ESPRESSO sera un outil utile pour les chercheurs pour explorer le répertoire d’ARN des cellules dans divers contextes biomédicaux et cliniques. »

READ  L'image originale de Buzz Aldrin Moon Walk vendue pour 7 700 $ aux enchères

Ce travail a été soutenu en partie par le réseau translationnel d’immuno-oncologie (IOTN) de la Moonshot Cancer Initiative du National Cancer Institute (U01CA233074) et d’autres financements des NIH (R01GM088342, R01GM121827 et R56HG012310), ainsi qu’une subvention de formation des NIH. Génomique computationnelle (T32HG000046).