Des chercheurs ont mis au point des modèles prédictifs basés sur l’ARN qui utilisent l’intelligence artificielle pour déterminer l’activité sur et hors cible des outils CRISPR qui ciblent l’ARN plutôt que l’ADN. Le modèle est conçu pour faciliter le contrôle précis de l’expression des gènes, ce qui pourrait révolutionner le développement de nouvelles thérapies basées sur CRISPR.
Des chercheurs ont mis au point un modèle d’intelligence artificielle, TIGER, qui prédit l’activité sur cible et hors cible des outils CRISPR ciblant l’ARN. Cette innovation, décrite dans une étude publiée dans Nature Biotechnology, permet de concevoir avec précision des ARN guides, de moduler l’expression des gènes et de faire progresser les thérapies basées sur CRISPR.
L’intelligence artificielle peut prédire l’activité sur et hors cible des outils CRISPR qui ciblent l’ARN au lieu de l’ADN, selon une nouvelle recherche publiée aujourd’hui (3 juillet) dans la revue Nature Biotechnology.
L’étude menée par des chercheurs de l’Université de New York, de Columbia Engineering et du New York Genome Center associe un modèle d’apprentissage profond à des écrans CRISPR pour contrôler l’expression des gènes humains de différentes manières, comme si l’on appuyait sur un interrupteur pour les éteindre complètement ou si l’on utilisait un bouton de réglage pour réduire partiellement leur activité. Ces contrôles précis des gènes pourraient être utilisés pour développer de nouvelles thérapies basées sur CRISPR.
CRISPR est une technologie d’édition de gènes qui a de nombreuses applications en biomédecine et au-delà, du traitement de l’anémie falciforme à la fabrication de feuilles de moutarde plus savoureuses. Elle fonctionne souvent en ciblant l’ADN à l’aide d’une enzyme appelée Cas9. Ces dernières années, les scientifiques ont découvert un autre type de CRISPR qui cible l’ARN à l’aide d’une enzyme appelée Cas13.
Les CRISPR ciblant l’ARN peuvent être utilisés dans un large éventail d’applications, notamment l’édition de l’ARN, l’élimination de l’ARN pour bloquer l’expression d’un gène particulier et le criblage à haut débit pour déterminer les candidats médicaments prometteurs. Des chercheurs de l’Université de New York et du New York Genome Center ont créé une plateforme de criblage CRISPR ciblant l’ARN et utilisant Cas13 pour mieux comprendre la régulation de l’ARN et identifier la fonction des ARN non codants. L’ARN étant le principal matériel génétique des virus, notamment du SRAS-CoV-2 et de la grippe, les CRISPR ciblant l’ARN sont également prometteurs pour le développement de nouvelles méthodes de prévention ou de traitement des infections virales. Par ailleurs, dans les cellules humaines, lorsqu’un gène est exprimé, l’une des premières étapes est la création d’ARN à partir de l’ADN du génome.
L’un des principaux objectifs de l’étude est de maximiser l’activité des CRISPR ciblant l’ARN sur l’ARN cible prévu et de minimiser l’activité sur d’autres ARN qui pourraient avoir des effets secondaires préjudiciables pour la cellule. L’activité hors cible comprend à la fois les inadéquations entre l’ARN guide et l’ARN cible, ainsi que les mutations d’insertion et de délétion. Les études antérieures sur les CRISPR ciblant l’ARN se sont concentrées uniquement sur l’activité sur la cible et les inadéquations ; la prédiction de l’activité hors cible, en particulier les mutations d’insertion et de délétion, n’a pas fait l’objet d’études approfondies. Dans les populations humaines, environ une mutation sur cinq est une insertion ou une délétion ; il s’agit donc d’un type important de cibles potentielles à prendre en compte pour la conception des CRISPR.
« À l’instar des CRISPR ciblant l’ADN tels que Cas9, nous prévoyons que les CRISPR ciblant l’ARN tels que Cas13 auront un impact considérable sur la biologie moléculaire et les applications biomédicales dans les années à venir », a déclaré Neville Sanjana, professeur agrégé de biologie à l’Université de New York, professeur agrégé de neurosciences et de physiologie à l’École de médecine Grossman de l’Université de New York, membre de la faculté principale du New York Genome Center et coauteur principal de l’étude. « La prédiction précise des guides et l’identification hors cible seront d’une grande valeur pour ce nouveau domaine de développement et pour les thérapies.
Dans leur étude parue dans Nature Biotechnology, Sanjana et ses collègues ont effectué une série de criblages CRISPR de ciblage de l’ARN dans des cellules humaines. Ils ont mesuré l’activité de 200 000 ARN guides ciblant des gènes essentiels dans les cellules humaines, y compris les ARN guides « parfaitement adaptés » et les désadaptations, insertions et suppressions hors cible.
Le laboratoire de Sanjana s’est associé à celui de David Knowles, expert en apprentissage automatique, pour concevoir un modèle d’apprentissage profond baptisé TIGER (Targeted Inhibition of Gene Expression via guide RNA design), qui a été entraîné à partir des données issues des cribles CRISPR. En comparant les prédictions générées par le modèle d’apprentissage profond et les tests en laboratoire sur des cellules humaines, TIGER a été capable de prédire l’activité sur cible et hors cible, surpassant les modèles précédents développés pour la conception de guides sur cible Cas13 et fournissant le premier outil de prédiction de l’activité hors cible des CRISPR ciblant l’ARN.
« L’apprentissage automatique et l’apprentissage profond montrent leur force en génomique parce qu’ils peuvent tirer parti des énormes ensembles de données qui peuvent désormais être générés par les expériences modernes à haut débit. Il est important de noter que nous avons également pu utiliser un « apprentissage automatique interprétable » pour comprendre pourquoi le modèle prédit qu’un guide spécifique fonctionnera bien », a déclaré Knowles, professeur adjoint d’informatique et de biologie des systèmes à Columbia Engineering, membre de la faculté principale du New York Genome Center et coauteur principal de l’étude.
« Nos recherches antérieures ont montré comment concevoir des guides Cas13 capables d’éliminer un ARN particulier. Avec TIGER, nous pouvons maintenant concevoir des guides Cas13 qui atteignent un équilibre entre l’élimination sur cible et l’évitement de l’activité hors cible », a déclaré Hans-Hermann (Harm) Wessels, coauteur de l’étude et scientifique principal au New York Genome Center, qui était auparavant chercheur postdoctoral dans le laboratoire de Sanjana.
Les chercheurs ont également démontré que les prédictions hors cible de TIGER peuvent être utilisées pour moduler précisément le dosage des gènes – la quantité d’un gène particulier qui est exprimée – en permettant l’inhibition partielle de l’expression des gènes dans les cellules avec des guides de mésappariement. Cela peut être utile pour les maladies dans lesquelles il y a trop de copies d’un gène, comme le syndrome de Down, certaines formes de schizophrénie, la maladie de Charcot-Marie-Tooth (une maladie nerveuse héréditaire), ou dans les cancers où l’expression aberrante d’un gène peut conduire à une croissance incontrôlée de la tumeur.
Notre modèle d’apprentissage profond peut nous indiquer non seulement comment concevoir un ARN guide qui supprime complètement un transcrit, mais aussi comment le « régler », par exemple en lui faisant produire seulement 70 % du transcrit d’un gène spécifique », a déclaré Andrew Stirn, étudiant en doctorat à Columbia Engineering et au New York Genome Center, et coauteur de l’étude.
En associant l’intelligence artificielle à un écran CRISPR ciblant l’ARN, les chercheurs estiment que les prédictions de TIGER permettront d’éviter une activité CRISPR hors cible indésirable et de stimuler le développement d’une nouvelle génération de thérapies ciblant l’ARN.
« À mesure que nous recueillons de plus grands ensembles de données à partir des cribles CRISPR, les possibilités d’appliquer des modèles d’apprentissage automatique sophistiqués augmentent rapidement. Nous avons la chance d’avoir le laboratoire de David à côté du nôtre pour faciliter cette merveilleuse collaboration interdisciplinaire. Grâce à TIGER, nous pouvons prédire les cibles non ciblées et moduler avec précision le dosage des gènes, ce qui ouvre la voie à de nouvelles applications passionnantes pour les CRISPR ciblant l’ARN dans le domaine de la biomédecine », a déclaré Sanjana.
Référence : 3 juillet 2023, Nature Biotechnology.
DOI: 10.1038/s41587-023-01830-8
Les autres auteurs de l’étude sont Alejandro Méndez-Mancilla et Sydney K. Hart de l’Université de New York et du Centre de génomique de New York, et Eric J. Kim de l’Université de Columbia. La recherche a été soutenue par des subventions des National Institutes of Health (DP2HG010099, R01CA218668, R01GM138635), de la DARPA (D18AP00053), de l’Institut de recherche sur le cancer et de la Fondation Simons pour l’initiative de recherche sur l’autisme.