Le Center for Advanced Systems Understanding et les Sandia National Laboratories ont développé les Materials Learning Algorithms (MALA), une méthode de simulation basée sur l’apprentissage automatique pour la prédiction de la structure électronique. MALA surpasse les méthodes traditionnelles en intégrant l’apprentissage automatique aux algorithmes physiques, ce qui permet d’accélérer de plus de 1 000 fois la vitesse des petits systèmes et de simuler avec précision des systèmes à grande échelle de plus de 100 000 atomes. Cette innovation devrait révolutionner la recherche appliquée et est hautement compatible avec les systèmes de calcul à haute performance.
L’approche de l’apprentissage profond permet de calculer avec précision la structure électronique à grande échelle.
L’arrangement des électrons dans la matière, connu sous le nom de structure électronique, joue un rôle crucial dans la recherche fondamentale mais aussi dans la recherche appliquée telle que la conception de médicaments et le stockage de l’énergie. Cependant, l’absence d’une technique de simulation offrant à la fois une grande fidélité et une évolutivité sur différentes échelles de temps et de longueur a longtemps été un obstacle au progrès de ces technologies. Des chercheurs du Center for Advanced Systems Understanding (CASUS) du Helmholtz-Zentrum Dresden-Rossendorf (HZDR) à Görlitz, en Allemagne, et des Sandia National Laboratories à Albuquerque, au Nouveau-Mexique, aux États-Unis, viennent de mettre au point une méthode de simulation basée sur l’apprentissage automatique (npj Computational Materials, DOI : 10.1038/s41524-023-01070-z) qui supplante les techniques traditionnelles de simulation de la structure électronique. Leur logiciel Materials Learning Algorithms (MALA) permet d’accéder à des échelles de longueur jusqu’alors inaccessibles.
Les électrons sont des particules élémentaires d’une importance fondamentale. Leurs interactions mécaniques quantiques entre eux et avec les noyaux atomiques donnent lieu à une multitude de phénomènes observés en chimie et en science des matériaux. La compréhension et le contrôle de la structure électronique de la matière permettent de mieux comprendre la réactivité des molécules, la structure et le transport de l’énergie au sein des planètes, ainsi que les mécanismes de défaillance des matériaux.
Les défis scientifiques sont de plus en plus souvent relevés par le biais de la modélisation et de la simulation informatiques, en tirant parti des capacités de calcul à haute performance. Cependant, un obstacle important à la réalisation de simulations réalistes avec une précision quantique est l’absence d’une technique de modélisation prédictive combinant une grande précision et une évolutivité sur différentes échelles de longueur et de temps. Les méthodes classiques de simulation atomistique peuvent traiter des systèmes complexes et de grande taille, mais leur omission de la structure électronique quantique limite leur applicabilité. À l’inverse, les méthodes de simulation qui ne reposent pas sur des hypothèses, telles que la modélisation empirique et l’ajustement des paramètres (méthodes des premiers principes), offrent une grande fidélité, mais sont gourmandes en ressources informatiques. Par exemple, la théorie de la fonctionnelle de la densité (DFT), une méthode de premier principe largement utilisée, présente une échelle cubique avec la taille du système, ce qui limite ses capacités prédictives aux petites échelles.
Instantané d’une simulation par apprentissage profond de plus de 10 000 atomes de béryllium. La distribution des électrons dans ce matériau est représentée par des nuages de points rouges (électrons délocalisés) et bleus (électrons situés près des noyaux atomiques). Cette simulation n’est pas réalisable à l’aide d’un calcul DFT conventionnel. Grâce à MALA, elle a été réalisée en 5 minutes environ en utilisant seulement 150 unités centrales de traitement. Des filtres graphiques ont été utilisés pour améliorer l’intelligibilité de la simulation. Les zones blanches au niveau des franges sont également dues aux filtres. Le schéma à l’arrière-plan montre comment fonctionne l’apprentissage en profondeur. Crédit : HZDR / CASUS
Sommaire
Approche hybride basée sur l’apprentissage profond
L’équipe de chercheurs vient de présenter une nouvelle méthode de simulation appelée pile logicielle MALA (Materials Learning Algorithms). En informatique, une pile logicielle est un ensemble d’algorithmes et de composants logiciels qui sont combinés pour créer une application logicielle permettant de résoudre un problème particulier.
Lenz Fiedler, doctorant et développeur clé de MALA à CASUS, explique : « MALA intègre l’apprentissage automatique à des approches basées sur la physique pour prédire la structure électronique des matériaux. Il emploie une approche hybride, utilisant une méthode d’apprentissage automatique établie appelée apprentissage profond pour prédire avec précision les quantités locales, complétée par des algorithmes physiques pour calculer les quantités globales d’intérêt ».
La pile logicielle MALA prend en entrée la disposition des atomes dans l’espace et génère des empreintes digitales connues sous le nom de composantes du bispectre, qui codent la disposition spatiale des atomes autour d’un point de grille cartésien. Le modèle d’apprentissage automatique de MALA est entraîné à prédire la structure électronique sur la base de ce voisinage atomique. Un avantage significatif de MALA est la capacité de son modèle d’apprentissage automatique à être indépendant de la taille du système, ce qui lui permet d’être entraîné sur des données provenant de petits systèmes et d’être déployé à n’importe quelle échelle.
Dans leur publication, l’équipe de chercheurs a mis en évidence l’efficacité remarquable de cette stratégie. Ils ont obtenu une accélération de plus de 1 000 fois pour des systèmes de plus petite taille, composés de quelques milliers d’atomes, par rapport aux algorithmes conventionnels. En outre, l’équipe a démontré la capacité de MALA à effectuer avec précision des calculs de structure électronique à grande échelle, impliquant plus de 100 000 atomes. Cette prouesse a été réalisée avec un effort de calcul modeste, révélant ainsi les limites des codes DFT conventionnels.
Attila Cangi, chef intérimaire du département « Matière dans des conditions extrêmes » au CASUS, explique : « Au fur et à mesure que la taille du système augmente et qu’il y a de plus en plus d’atomes, le système devient plus complexe : « Au fur et à mesure que la taille du système augmente et que davantage d’atomes sont impliqués, les calculs DFT deviennent impraticables, alors que l’avantage de MALA en termes de vitesse ne cesse de croître. La principale avancée de MALA réside dans sa capacité à opérer sur des environnements atomiques locaux, ce qui permet des prédictions numériques précises qui sont très peu affectées par la taille du système. Cette réalisation révolutionnaire ouvre des possibilités de calcul qui étaient autrefois considérées comme inaccessibles ».
Un coup de pouce attendu pour la recherche appliquée
Cangi vise à repousser les limites des calculs de structure électronique en tirant parti de l’apprentissage automatique : « Nous prévoyons que MALA déclenchera une transformation des calculs de structure électronique, car nous disposons désormais d’une méthode permettant de simuler des systèmes beaucoup plus grands à une vitesse sans précédent. À l’avenir, les chercheurs pourront relever un large éventail de défis sociétaux en s’appuyant sur une base de référence considérablement améliorée, notamment en développant de nouveaux vaccins et de nouveaux matériaux pour le stockage de l’énergie, en réalisant des simulations à grande échelle de dispositifs semi-conducteurs, en étudiant les défauts des matériaux et en explorant les réactions chimiques permettant de convertir le gaz à effet de serre atmosphérique qu’est le dioxyde de carbone en minéraux respectueux du climat. »
En outre, l’approche de MALA est particulièrement adaptée au calcul à haute performance (HPC). À mesure que la taille du système augmente, MALA permet un traitement indépendant sur la grille de calcul qu’il utilise, ce qui permet d’exploiter efficacement les ressources HPC, en particulier les unités de traitement graphique.
Siva Rajamanickam, scientifique et expert en informatique parallèle aux Sandia National Laboratories, explique : « L’algorithme de MALA pour les calculs de structure électronique s’adapte bien aux systèmes HPC modernes dotés d’accélérateurs distribués. La capacité de décomposer le travail et d’exécuter en parallèle différents points de grille sur différents accélérateurs fait de MALA un outil idéal pour l’apprentissage automatique évolutif sur les ressources HPC, ce qui se traduit par une vitesse et une efficacité inégalées dans les calculs de structure électronique ».
Référence : « Predicting electronic structures at any length scale with machine learning » par Lenz Fiedler, Normand A. Modine, Steve Schmerler, Dayton J. Vogel, Gabriel A. Popoola, Aidan P. Thompson, Sivasankaran Rajamanickam et Attila Cangi, 27 juin 2023, npj Computational Materials.
DOI: 10.1038/s41524-023-01070-z
Outre les partenaires en développement HZDR et Sandia National Laboratories, MALA est déjà utilisé par des institutions et des entreprises telles que le Georgia Institute of Technology, la North Carolina A&T State University, Sambanova Systems Inc. et Nvidia Corp.