A quand l'introduction de l'enseignement de la Bioinformatique et de la Génomique à l'université
A ce jour (Juin 2016) l’Université tunisienne n’a pas encore introduit dans son cursus, l’enseignement des domaines aussi stratégiques que ceux de la Bioinformatique et de la Génomique. Ces domaines sont devenus incontournables depuis des années dans les Universités et Instituts de recherches du monde développé. Ce n’est pas par manque de conscience des collègues chercheurs impliqués dans ces domaines en Tunisie, c’est apparemment au niveau décisionnel que l’incompréhension persiste.
Un master (M1 et M2) de bioinformatique a été créé, en 2004-2006, au Centre d’informatique de l’Université de la Manouba en coopération avec l’Institut Pasteur de Tunis. Ce master a permis la formation de deux promotions de 20 à 25 étudiants. L’initiative a été arrêtée par manque de financement, malgré la demande des équipes de recherche. Des ateliers théoriques et pratiques de courte durée ont été organisés à plusieurs reprises à l’initiative des Laboratoires de Recherche de l’Institut Pasteur de Tunis en coopération avec le CBS et des équipes internationales dont celles de l’Institut Pasteur de Paris. Ces formations ont permis une mise à niveau des chercheurs en biologie, génétique, biochimie, microbiologie, mais n’ont pas pallié le manque d’une formation approfondie dans les domaines de la bioinformatique, génomique et protéomique, destinée aux jeunes chercheurs en bioinformatique médicale, épidémiologie, maladies génétiques et ou métaboliques.
Un pan entier des connaissances acquises pendant ces 20 dernières années dans les domaines de la Bioinformatique et de la Génomique manque aux Etudiants diplômés dans le domaine biomédical des Universités tunisiennes. En conséquence, parmi eux ceux qui cherchent à poursuivre leur doctorat ou Post-doctorat dans des Instituts de recherche à l’étranger, ne sont potentiellement pas acceptables pour poursuivre leur recherche dans les Laboratoires de ces Instituts. De même ce manque de compétence est handicapant pour toute demande de financement de projets collaboratifs dans les domaines de la Biologie.
Il devient très urgent de remédier à cette situation et d’introduire un enseignement régulier au moins dans une des Universités tunisiennes et de procéder à des formations courtes et spécifiques dans les Instituts de Recherche qui en ont besoin. Une formation large intégrant la bioinformatique avec les biostatistiques et les biomathématiques serait aussi nécessaire et utile dans les Universités dotées d’un centre d’informatique et de compétences de base.
Dans ce qui suit nous avons essayé de donner une idée sur ces domaines scientifiques en termes simples, en espérant que les décideurs prennent conscience de l’importance scientifique de ces domaines et se rendent compte du retard pris par les Institutions tunisiennes. Il est temps de renforcer la capacité de formation en Bioinformatique et Génomique en Tunisie.
Les Génomes
Le premier génome complètement séquencé, une bactérie Haemophilus influenzae responsable entre autres des otites moyennes aigues et des méningites, date de 1995. Depuis cette date, des milliers de génomes d’espèces différentes ont été complètement ou partiellement séquencés.
Le génome d’un organisme est l’ensemble de son matériel génétique et correspond généralement à son ADN. Il contient à la fois les séquences codantes, c’est-à-dire celles qui codent pour des protéines, et les séquences non codantes. Le génome est représenté par une suite de 4 bases (lettres) appelées nucléotides (A: Adénine, C: Cytosine, G: Guanine et T:Thymine). Le séquençage de l’ADN d’un organisme donné permet d’avoir l’enchaînement de l’ensemble de ses 4 bases et donc de définir sa taille. Les tailles sont variables selon les organismes. Ainsi, par exemple l’ADN humain, dont la première version a été publiée en 2001, est composé d’environ 3,4 milliards de nucléotides alors que le génome de la bactérie Haemophilus influenzae citée plus haut est d’environ 1,86 millions de nucléotides. Le génome humain contient environ 24000 gènes alors que la bactérie citée plus haut contient environ 1700 gènes. Les gènes sont situés d’une certaine façon sur la séquence d’un organisme donné. De même les génomes de tous les êtres humains par exemple ne sont pas identiques. Il existe une variabilité entre ces génomes, due entre autres à l’état de la santé de la personne ou à son histoire évolutive par exemple.
Actuellement, plusieurs programmes de séquençage ciblés, relatifs à des questions spécifiques et d’intérêts divers, sont en cours de réalisation.
À titre d’exemples, on peut citer des projets de séquençage en rapport avec la santé humaine:
- Le projet 1000 Génomes humains (en réalités beaucoup plus que 1000 et appartenant à plusieurs populations) dont l’objectif essentiel est d’étudier la variabilité génétique chez l’homme (http://www.1000genomes.org/).
- Le projet de l’Atlas génomique des cancers (https://icgc.org/), qui s’intéresse à plus de 50 types de cancers.
- Le projet Microbiome humain (http://commonfund.nih.gov/hmp/) dont l’objectif est d’étudier et de caractériser les microbes qu’on trouve dans le corps humain.
Des projets similaires existent dans les domaines agricole, biotechnologique et industriel. Plusieurs génomes de plantes utiles sont disponibles et déjà exploités pour l’amélioration génétique du blé, orge, riz, maïs, colza, soja, rosier et autres espèces agronomiques. Les petits génomes des microorganismes pathogènes et/ou saprophytes (bactéries, virus, champignons et parasites) sont séquencés en plusieurs exemplaires et leur variabilité et leur virulence sont de mieux en mieux connues. La recherche de nouvelles thérapies et les méthodes de lutte anti-infectieuse grâce à l’étude des génomes, sont totalement innovées.
À ce jour, il y a plus de 5000 génomes complètement séquencés et plus de 50000 génomes partiellement séquencés et concernent des organismes aussi divers que des animaux, des plantes, des bactéries et des virus. Ces organismes ont été choisis pour leurs intérêts scientifiques, médicaux, agricoles, biotechnologiques ou environnementaux. Leur séquençage a généré une masse importante de données librement accessibles aux chercheurs du monde entier. Depuis le premier génome séquencé, les connaissances concernant ces milliers de génomes s’accumulent exponentiellement d’année en année.
La disponibilité des données publiques de ces milliers de génomes a ouvert des pans entiers de nouvelles recherches fondamentales et appliquées impliquant à la fois des compétences de Biologistes, de Mathématiciens, de Statisticiens et d’Informaticiens.
Les connaissances acquises sur l’organisation et les structures des génomes (Eucaryotes et Procaryotes) ont des applications pratiques aussi bien pour la santé de l’Homme que pour les applications biotechnologiques relatives aux vivants (animaux et plantes).
Le développement de la génomique a impliqué des avancés technologiques rendant le séquençage plus facile, plus efficace et surtout à des coûts modestes. L’analyse des données génomiques a nécessité le développement de méthodes et des outils impliquant des Mathématiciens, des Statisticiens et des Informaticiens donnant naissance à un nouveau domaine multidisciplinaire appelé Bioinformatique.
Bioinformatique
Pour décoder ces données génomiques et en extraire des connaissances biologiques, on a besoin de la Bioinformatique. C’est un domaine de recherche en plein développement qui est à l’intersection des Mathématiques, des Statistiques et de l’Informatique dont l’objectif essentiel est de répondre à des questions biologiques en utilisant les séquences et les informations biologiques relatives à ces séquences.
Les analyses bioinformatiques permettent d’extraire les gènes/protéines d’une espèce séquencée, de comparer les contenus des différents génomes, d’étudier leurs structures, d’établir ce qui leur est commun et ce qui les différencie. Les objectifs de ces analyses tendent à déterminer la fonction de chacun des gènes de ces espèces. Les analyses s’effectuent au niveau global mais aussi au niveau des variations qu’on peut observer sur un ou plusieurs nucléotides d’un gène donné. Ces variations peuvent être une indication intéressante sur une maladie donnée. L’analyse bioinformatique des génomes
ne se limite plus à l’étude des gènes, leur interaction et leur régulation, mais aussi à l’analyse fonctionnelle des voies métaboliques et aux clusters de gènes de structure, de virulence ainsi qu’aux gènes mobiles, plasmides et transposons, entre organismes différents.
Pour l’analyse des génomes, l’apport des mathématiciens et des statisticiens est fondamental en algorithmes pour répondre à des questions que les biologistes se posent à partir de ces données. Les informaticiens, en plus de la gestion de ces données et de leur distribution, ont surtout écrit des programmes utilisables par les biologistes et les spécialistes des analyses des données.
De nombreux projets de recherche ont ainsi été initiés pour utiliser les données publiques et en extraire de nouvelles connaissances. Les mathématiciens, les statisticiens et les informaticiens ont trouvé des nouveaux sujets de recherche passionnants pour proposer des solutions à des questions biologiques de plus en plus nombreuses et pertinentes au fur et à mesure que s’accumulent les connaissances acquises des données génomiques. Comme on le voit, les publications se comptent en milliers et leur croissance est presque exponentielle jusqu’en 2014. Depuis la décroissant qu’on observe est due à la spécialisation en bioinformatique : « Computational biology », « Cancer informatics », « Medical genomic »,... qui commencent à s’introduire dans la littérature. Cette spécialisation de la bioinformatique est une adaptation naturelle aux programmes futuristes des centres de séquençages de biopsies cancéreuses et/ou des souches infectieuses isolées dans les centres hospitaliers, avec toujours en perspectives une meilleure thérapie au profit des patients
On voit ainsi que ce domaine de recherche utilisant les données génomiques profite aussi bien aux biologistes, aux cliniciens qu’aux mathématiciens, statisticiens et informaticiens.
Malgré cette intense activité scientifique reflétée par ces publications, déployée partout dans le monde, l’Université tunisienne est restée en dehors de ces développements et a de facto sous-estimé l’enseignement et la formation de ses étudiants dans ces domaines. Ceci a malheureusement comme conséquence la non-conformité de nos étudiants diplômés aux niveaux requis pour pratiquement tous les domaines concernant la Biologie à cause de l’absence de compétence dans le domaine de la Bioinformatique et de la Génomique. Rien n’est gagné ou perdu d’avance, la formation et la mise à niveau régulière et continue est nécessaire dans toutes les disciplines universitaires. Ce retard scientifique peut être réduit en instaurant des formations de qualité dans les nouveaux domaines de l'exploitation des « Big Data Biologiques » par les études bioinformatiques.
Perspectives
Il est incontestable que depuis le premier séquençage complet d’une bactérie, la génomique a été utilisée pour investiguer la biologie des bactéries pathogènes et leurs évolutions. Les séquences de ces génomes ont fourni des informations sur le répertoire des gènes déterminants pour la virulence et les facteurs d’interaction avec l’hôte. Les analyses comparatives de ces génomes ont permis de proposer des hypothèses pour expliquer l’évolution de ces bactéries les conduisant à devenir pathogènes.
Le développement du séquençage à haut débit du au coût de plus en plus réduit et aux méthodes efficaces pour le traitement initial de ces données (assemblage et prédiction des gènes), a permis d’étudier beaucoup plus finement les relations phylogénétiques des bactéries pathogènes avec des conséquences bénéfiques pour la microbiologie clinique permettant un suivi efficace des épidémies à l’intérieur des hôpitaux et entre les continents. Il est attendu que ce séquençage permettra une meilleure compréhension de la résistance aux antibiotiques, de la virulence et de la transmission des bactéries pathogènes.
Pour les maladies génétiques et métaboliques, les analyses des variants à partir des centaines de génomes permettent de cerner les altérations de certains gènes responsables de ces maladies. Ce type d’étude prépare, dans un avenir proche, une avancée rapide vers des thérapies ciblées plus adaptées à chaque patient. Les centres hospitaliers engagés dans les grands programmes de recherche en génomique et bioinformatique des maladies infectieuses, maladies génétiques, métaboliques et cancéreuses ; sont assurés de leurs réussites futures. Plusieurs immunothérapies anticancéreuses actuelles proviennent déjà de ces nouveaux projets et concepts de recherche.
Ces études ont donné lieu à ce qui est appelé la Médecine génomique dont les applications les plus attendus concerne les bénéfices qu’on peut tirer de la génomique pour la santé de l’homme : mieux comprendre le génome humain, comment il fonctionne et comment il interagit avec les pathogènes.
Des applications similaires concernent les applications agricoles et biotechnologiques, font partie des avancées récentes dans ces domaines. Les méthodes de croisement et de sélection classiques de variétés et d’espèces végétales sont longues et nécessitent un temps parfois indéterminé. L’étude des génomes des espèces agronomiques et/ou sauvages apporte un complément d’information nécessaire à la sélection de variétés utiles plus rentables ou plus résistantes aux contraintes environnementales.
Enfin les progrès technologiques permettent de séquencer des espèces disparues depuis longtemps à partir de fragments d’os retrouvés dans les sédiments ou dans les permafrost en Sibérie : c’est la naissance de la paléogénomique : la science des fossiles et des traces de vie du passé. Ainsi on a pu réétudier l’histoire de l’évolution de l’Homme et sa migration. La séquence de DNA humain le plus ancien date de 430000 années et provient d’un fossile trouvé à Sima de los Huesos en Espagne. À la lumière de cette découverte récente l’histoire de l’homme est entrain d’être réécrite pour retrouver « l’homo antecessor » qui peut être notre ancêtre commun. L’évolution de l’homme et celle de son génome déterminent les limites de son adaptation et de sa résistance aux événements climatiques ainsi que l’origine des maladies génétiques actuelles.
Enfin, il est important de noter que les analyses bioinformatiques ont déjà permis d’optimiser les expériences humides dans les laboratoires permettant ainsi de réduire le coût et le temps du travail expérimental. Certains chercheurs prédisent qu’à court terme, les activités bioinformatiques vont prédominer les activités humides de laboratoire dans les domaines de la Biologie, réduisant le rôle expérimental de laboratoire à la vérification de modèles proposés par les analyses bioinformatiques.
Ces exemples montrent le large spectre de l’utilisation et de l’intérêt de la génomique.
Ceci est devenu possible grâce à la Bioinformatique qui a permis l’analyse et la comparaison de ces données génomiques selon le thème de recherche considéré.
Des méthodes de comparaison de séquences, de recherche de similarité entre séquences, de construction phylogénétique entre gènes et entre espèces ont été mises au point par les mathématiciens et les statisticiens et sont mis en oeuvre sous forme de programmes informatiques.
Il est important de souligner l’aspect public des données génomiques et des méthodes et outils bioinformatiques permettant ainsi à chaque chercheur d’en disposer quels que soient son Institution et son pays de travail. Cette collaboration universelle explique en partie l’évolution fulgurante de ces domaines.
Ces données génomiques vont être de plus en plus associées à diverses données cliniques et environnementales pour constituer ce qui est appelé le « Big Data Biologique». Elles vont impliquer un profond et irréversible changement dans les domaines de la biologie, de la médecine et en biotechnologie. L’intégration de toutes ces données va impacter non seulement la recherche mais aussi le traitement des maladies infectieuses et génétiques. Il est donc important de disposer des compétences nécessaires pour l’exploitation et l’analyse de ces données.
L’aperçu présenté ci-dessus montre l’étendu des intérêts scientifiques et pratiques pour les Biologistes, les Mathématiciens, les Statisticiens et les Informations pour l’exploration et les découvertes ainsi que pour les applications pratiques à intérêts économiques, médicaux et biotechnologiques.
Peut-on continuer à ignorer ces domaines dans l’Université et les Instituts de Recherche Biomédicales tunisiennes? Il est urgent de mettre en place un enseignement intensif de haut niveau permettant de combler cette faille et de rattraper les retards accumulés. La création de nouvelles filières de formation de compétences est toujours moins couteuse que l’ignorance.
Fredj Tekaia
Ingénieur de Recherche
Institut Pasteur
Paris, France
Abdellatif Boudabous
Professeur
Laboratoire des Microorganismes et Biomolécules Actives,
Faculté des Sciences de Tunis, Université Tunis El Manar , Tunis, Tunisie.
Autres références
-Liste de cours en « Bioinformatique et Génomique » organisés dans différends Institutions de recherche. Les documents des conférences sont téléchargeables:
http://webext.pasteur.fr/tekaia/BCGA_WProgs.html
-Statistiques sur les génomes : Genome OnLine Database (GOLD) : http://www.genomesonline.org/
-Données génomiques accessibles : http://www.ncbi.nlm.nih.gov/genome/
-Personal Genome Project (PGP) : http://www.personalgenomes.org/
- Ecrire un commentaire
- Commenter
Merci cher collègues pour cet article. Je suis professeur hospitalo-universitaire à l'Université Tunis El Manar. Je suis passionné d'ingénierie de la formation. J'atteste que nous avons tous les ingrédients nécessaires à la réalisation des objectifs proposés dans votre article. Un seul mot d'ordre : mutualisation des moyens.
Bravo pour votre article qui attire l'attention sur les carences de notre Université. L'Université tunisienne est en sommeil profond (pour ne pas dire en léthargie) et n'élabore aucune stratégie de mise à niveau de son enseignement, tenant compte des avancées scientifique. Il n'y a pas que l'enseignement de la génomique et la bioinformatique qui manque mais celui aussi les neurosciences cognitives, alors qu'on a prédit que le 21ème siècle est celui du cerveau.
Je remercie mes chers collègues pour leur article. Nous sommes tout à fait d'accord avec vos idées de mettre en place ces nouvelles technologies dans les universités Tunisiennes. Le ministère de tutelle doit investir dans l'installation des NGS (New Generation Sequencing) afin de former de futurs enseignants chercheurs dans ces domaines de pointe. Néanmoins je dois préciser que nous avons introduit dans notre institut (Institut Supérieur de Biotechnologie Sidi Thabet) l'enseignement de génomique structurale et fonctionnelle depuis 4 ans même au niveau de la licence Fondamentale . D'ailleurs, Monsieur Fredj Tekaia a contribué à cet enseignement il y a deux ans au niveau du mastère recherche. Il ne faut pas à mon sens généraliser mais nous œuvrons tous pour que ces enseignements aient leur place dans le cursus universitaire.
Merci pour ces propos, Je partage vos avis. Il est grand temps de revoir sérieusement nos programmes d'enseignement supérieur et de recherche scientifique pour ne pas accumuler davantage du retard. Messaoud MARS