Le séquençage du génome du rosier : pourquoi faire ?

Jean-Claude Caissard

Depuis plus de 50 000 ans, l’espèce humaine cherche à domestiquer et améliorer les plantes pour se nourrir, pour se soigner et, plus tardivement, pour embellir son environnement. Même si la compréhension des mécanismes biologiques et génétiques de cette sélection est récente, les principes de base de l’amélioration variétale n’ont jamais changé : il faut une variation naturelle importante et une sélection des individus aux traits les plus intéressants. Dans un premier temps, l’Homme a simplement sélectionné des variations naturelles, c’est-à-dire des mutations spontanées sur des individus ou sur des rameaux (sport des roses moussues par exemple).

Rosa chinensis 'old blush' - © J.-C. CaissardDepuis le XVIIIe siècle, les sélectionneurs et obtenteurs cherchent à augmenter la variabilité naturelle par hybridation ou par augmentation des mutations[1]. Depuis le XXe siècle, ils essaient de diriger les croisements par pollinisation manuelle, mettant ainsi en place des schémas de sélection et des arbres généalogiques de plus en plus complexes. Lorsque les traits souhaités ont une hérédité difficile à prévoir, l’augmentation des connaissances génétiques devient un enjeu majeur. Par exemple, dans un croisement entre deux roses parfumées, seule une petite proportion des descendants sera parfumée. De plus, ces descendants auront vraisemblablement des profils de parfum différents des parents. Dans les plantes de grandes cultures, l’augmentation des connaissances est depuis longtemps basée sur la modélisation des croisements au niveau génétique, sur la cartographie par marqueurs génétiques et sur le séquençage des génomes. C’est le cas par exemple des génomes du riz, du maïs, du sorgho, de la tomate, de la pomme de terre, du cacao, de la vigne, du peuplier et, plus proche des roses, de celui des fraises des bois, du pommier et de la pêche. Jusqu’à aujourd’hui aucun génome de plante ornementale n’a été séquencé, celui de la rose pourrait donc être le premier.

 

Un génome, qu’est-ce que c’est ?

Toutes les cellules d’un être vivant contiennent un jeu de chromosomes identiques disposés par paires. Il y a ainsi par exemple 23 paires de chromosomes (on écrit 2n=46) dans chacune des 100 000 milliards de cellules qui constituent un être humain. La plante modèle Arabidopsis thaliana est à 2n=10. Un jeu de n chromosomes provient du père alors que l’autre jeu provient de la mère. On peut assimiler ces jeux à des dictionnaires, chacun contient des définitions, mais d’un éditeur à l’autre, il peut y avoir des différences dans les définitions voire même, exceptionnellement, des mots manquants. Si les deux jeux n de chromosomes sont différents, on parle d’un individu hétérozygote alors que s’ils sont strictement identiques, on parle d’un individu homozygote. Chez les plantes, cela peut être le cas lors d’une autopollinisation par exemple. Chaque mot de ces dictionnaires correspond à un gène et chaque définition à un allèle de ce gène. Prenons un mot simple, le mot « couleur » par exemple. Dans deux dictionnaires différents on va trouver deux définitions formulées différemment : « sensation que produit sur l'organe de la vue la lumière diversement réfléchie par les corps » (Littré) ; « sensation résultant de l'impression produite sur l'œil par une lumière émise par une source et reçue directement ou après avoir interagi avec un corps non lumineux » (Larousse). Il s’agit bien du même mot avec deux définitions, du même gène avec deux allèles. Parfois, l’allèle peut diverger grandement des autres même s’il garde globalement le même sens « qualité de la lumière que renvoie un objet et qui permet à l'œil de le distinguer des autres objets, indépendamment de sa nature et de sa forme » (CNRTL). L’image s’arrête-là, car un jeu de chromosome est bien plus que cela : il contient certes les gènes mais aussi des informations permettant un certain degré d’auto-organisation et de régulation. Ainsi, même si toutes les cellules contiennent toutes les informations, elles ne les utilisent pas toutes, comme chacun d’entre nous n’utilise pas tous les mots du dictionnaire. Ces différences d’utilisation font qu’une cellule de foie n’est pas la même qu’un globule blanc ou qu’une cellule du cerveau ; ces différenciations cellulaires vont permettre le développement et le fonctionnement coordonné des individus. Chez les plantes, on considère qu’il suffit de plusieurs dizaines de catégories de cellules pour construire un individu. Comparé à d’autres organes, le pétale par exemple, contient peu de types cellulaires, en particulier un épiderme supérieur, un parenchyme et un épiderme inférieur. Le support physique de ces informations est la molécule d’ADN (acide désoxyribonucléique) avec sa célèbre structure de deux brins complémentaires agencés en double hélice. Chaque brin est un enchaînement de molécules simples nommées bases nucléotidiques. Ces bases ne sont que de quatre types : l’adénine, la thymine, la guanine et la cytosine, respectivement abrégées A, T, G et C. Ces bases sont disposées face à face : un A sur un brin correspond à un T sur l’autre, et un G sur un brin à un C sur l’autre. On trouve par exemple 110 000 000 bases sur les n chromosomes d’A. thaliana, 3 400 000 000 chez l’Homme, 12 100 000 chez la levure de bière ou encore 460 000 000 chez la rose. Cet enchaînement peut paraître aléatoire alors qu’il est grandement ordonné et qu’une seule erreur, si elle est mal placée, peut produire une maladie génétique dramatique. La séquence d’un génome est une liste ordonnée de ces bases sur chaque chromosome, c’est donc un enchaînement linéaire ATTGCCGATGGGATAGG… Cette molécule contient tous les gènes dispersés au milieu de fragments de séquences qui ne servent parfois à rien, ou parfois à la régulation des gènes et de leur lecture. Si la cellule reconnaît parfaitement les gènes dans cet enchaînement brut, le chercheur peut parfois s’y perdre et toute son activité va alors se tourner vers l’annotation de cette séquence d’ADN. L’annotation structurale consiste à positionner les gènes, leur début, leur fin et, parfois, des fragments de séquences potentiellement capables de les réguler. L’annotation fonctionnelle consiste à leur donner un nom et un rôle probable. Tout ceci se fait à l’aide d’algorithmes informatiques. Par exemple, si l’algorithme découvre un enchaînement ATG, il positionne le début d’une séquence codante d’un gène. Il arrêtera cette séquence lorsqu’il trouvera TAA, TAG ou TGA. Les gènes contiennent en effet des séquences codant pour la fabrication d’une protéine : chaque acide aminé constituant la protéine est codé par un groupe de trois bases nommé « codon ». Le codon ATG code pour une méthionine qui est quasiment toujours le premier acide aminé d’une protéine. Les codons TAA, TAG ou TGA ne codent pour rien, on les nomme « codons stop ». La carte encyclopédique d’ADN obtenue donnera aux chercheurs des pistes pour comprendre telle ou telle fonction, tel ou tel trait anatomique. Il ne s’agira en effet que de pistes, car les algorithmes fonctionnent par comparaison avec d’autres génomes et souvent un même gène peut avoir une fonction très différente d’une espèce à l’autre : chaque fonction devra donc être vérifiée par une équipe de recherche. Le travail est immense ; le génome humain contenant environ 22 000 gènes, celui d’A. thaliana, 26 000, et celui d’une paramécie, 40 000, par exemple, on comprend aisément la difficulté d’étudier leurs nombreuses fonctions et leurs multiples interactions.



Le génome de la rose et les intérêts scientifiques

La rose est une plante ornementale et une plante à parfum. Son génome sera le premier séquencé pour ces seules raisons. Comme pour tous les autres séquençages, il s’agira d’ouvrir une porte vers un monde nouveau. Cette séquence fournira des pistes et des outils pour étudier la couleur des fleurs (la rose présente beaucoup de variations de couleur), leur parfum (la rose contient les trois grandes familles de composés volatils), la duplicature (des fleurs simples aux fleurs doubles avec tous les intermédiaires), la remontance (floraisons multiples des roses chinoises), la taille des pétales (de R. banksiae à R. gigantea), les stress biotiques et abiotiques (pucerons, marsonia, sécheresse…), le débourrement des bourgeons, l’architecture végétative, la méiose, leur histoire sauvage et domestique et donc leur généalogie etc…  L’expérience montre que le séquençage d’un génome amène toujours plus d’équipes de recherche à travailler sur la plante concernée. Le gain de connaissances sur cette plante devient alors exponentiel. Un premier intérêt scientifique sera de disposer de la structure de l’information. C’est un intérêt purement descriptif mais toutes les disciplines scientifiques ont besoin d’inventaires. Il sera ainsi possible de connaître le nombre total de gènes, leurs tailles, leurs positions sur les chromosomes, leurs répétitions, leurs regroupements avec d’autres gènes… Ce type d’information a déjà ménagé des surprises par le passé ; on attendait par exemple 100 000 gènes dans le génome humain alors qu’on en a finalement dénombré entre 20 000 et 30 000. Un deuxième intérêt scientifique est la découverte et la description de nouvelles fonctions biologiques. Ces dix dernières années, la génétique a fait un bond dans les connaissances en décrivant des mécanismes complexes de régulation de l’expression génique (micro ARN, méthylations, régulations introniques…). Ces mécanismes, dits épigénétiques, sont encore à l’étude et de nombreux aspects de leur fonctionnement sont encore à découvrir. Dans les domaines du métabolisme spécialisé[2] par exemple, très peu de facteurs de transcription, c’est-à-dire de protéines codées par des gènes régulant d’autres gènes, sont décrits. Sur les centaines à découvrir, pas plus de cinq sont connus. Il s’agit par exemple du gène ODORANT1 régulant le fonctionnement d’une dizaine de gènes impliqués dans le caractère parfumé des pétunias. Chez la rose, tout est encore à faire car aucun gène de ce type n’a été caractérisé. Un troisième intérêt scientifique est la compréhension de l’évolution des espèces sauvages, la révision de la classification botanique des roses, et la reconstitution de la généalogie des variétés de nos jardins. Chez l’Homme par exemple, on a découvert des traces d’ADN interprétées comme provenant de l’Homme de Néanderthal. Chez le riz, l’odeur de la variété ‘Basmati’ a été expliquée, l’origine géographique de la mutation correspondante a été découverte et l’allèle a pu être suivi dans la généalogie des variétés actuelles. Enfin, le génome donnant accès à tous les gènes, les classifications sur la base des phylogénies moléculaires peuvent être affinées, ce qui commence à se faire chez les Rosacées avec les génomes de la fraise, du pommier et du pêcher. On admettait généralement que l’évolution suivait un processus arborescent, par ramifications successives de lignées soumises à la sélection naturelle. On reconnaît aujourd’hui, en particulier chez les plantes, l’efficacité d’un mode non arborescent d’apparition des espèces, par hybridation : des phénomènes de ce type ont vraisemblablement été à l’origine de la très grande diversité des espèces de rosier. Séquencer les génomes, les comparer, permettrait de mieux décrire ces hybridations fondatrices et donc de mieux comprendre les classifications actuelles. Enfin, ce génome fournira un outil puissant d’identification rapide des gènes et surtout un support aux études fonctionnelles. Dans les premiers temps de la biologie moléculaire, il fallait plusieurs années pour cloner un gène, avec la séquence du génome, ce temps est réduit à quelques jours. Les hypothèses de fonctionnalités peuvent donc être testées rapidement. Elles peuvent aussi être plus nombreuses et plus osées. Il est par exemple possible d’envisager l’étude d’une famille complète de gènes ou de rechercher la fonctionnalité des allèles d’un même gène dans plusieurs variétés. C’est ce qui est en cours dans les équipes de recherche à l’ENS de Lyon et à l’Université de Saint-Etienne pour expliquer le contrôle du nombre de pétales dans les fleurs de rosier ou le contrôle génétique de la production des constituants majeur du parfum de la Rose.

 


[1] Une mutation correspond à une modification de la séquence d’ADN. Si la mutation est viable, les individus mutants peuvent présenter des variations physiologiques ou morphologiques intéressantes pour la création variétale ou l’adaptation de la plante à son milieu. La multiplication, naturelle ou artificielle, du mutant donne alors soit directement une nouvelle variété, soit un géniteur utilisé dans de nouveaux croisements.

[2] Le métabolisme spécialisé (anciennement baptisé métabolisme secondaire) est un métabolisme qui diffère d’une espèce à l’autre. Il s’agit par exemple du métabolisme qui conduit à différents pigments, à différents parfums ou aux différentes molécules toxiques car liées à la défense. Il s’oppose au métabolisme général (anciennement nommé métabolisme primaire) qui inclut par exemple la respiration cellulaire, la dégradation des sucres et la fabrication des lipides, et qui est quasiment identique chez tous les êtres vivants..

 

 


Le génome de la rose et les intérêts économiques

Jusqu’à maintenant le séquençage pouvait répondre à des arguments financiers comme breveter le vivant par exemple. Beaucoup d’entreprises ont donc souhaité faire partie de l’aventure. Leur lobbying a permis de faire passer ce concept au niveau américain et européen et le brevetage du vivant est désormais autorisé : toute nouvelle utilisation d’une séquence d’ADN peut faire l’objet d’un brevet. Néanmoins, la résistance du public et de nombreux chercheurs fait que ces directives ne sont pas encore retranscrites dans le droit de chaque pays européen. En ce qui concerne le séquençage du génome du rosier, l’initiative vient des laboratoires publics français avec, entre autres, des fonds de l’INRA et de la Région « Pays de la Loire » avec le soutien du Pôle de Compétitivité « Végépolys ». Le Groupe National travaillant sur la Rose joue ici un rôle important en initiant et en coordonnant l’effort international. A terme, la séquence du génome sera librement accessible sur internet. Cette séquence pourra être utilisée pour améliorer ou fabriquer un certain nombre d’outils de  sélection. L’aide à la sélection par marqueurs moléculaires est l’un de ces outils. Les cartes génétiques actuellement disponibles, grâce par exemple aux travaux de l’INRA d’Angers, en collaboration avec l’unité BVpam de l’université de Saint-Etienne, peuvent déjà servir à développer de tels outils sur le parfum ou la remontance par exemple. La séquence d’ADN permettra de développer plus de marqueurs et plus vite. L’idée est d’associer un fragment d’ADN (dans le cas le plus simple, un allèle) à un trait sélectionnable. L’outil consiste en un kit qui permet de détecter rapidement la présence de ce fragment dans une descendance, tout comme les kits qui permettent d’anticiper la probabilité de certaines maladies génétiques chez l’Homme. Chez la rose, on peut par exemple envisager de détecter le fragment d’ADN sur les premières feuilles des germinations et d’associer cette présence à un pourcentage de chance pour que la plante adulte soit remontante, et/ou double, et/ou parfumée, et/ou résistante à une maladie. On peut donc raisonnablement imaginer un tri d’une centaine de germinations en un mois et donc un gain d’argent, de place et de temps considérables. Ce type de sélection assistée par marqueurs est déjà utilisé pour des croisements d’animaux d’élevage et chez des plantes de grandes cultures. Chez les Rosacées, elle est utilisée chez le pommier et des essais d’introgression de la résistance au marsonia des rosiers ont été réalisés en Allemagne. Chez les pétunias, un modèle de fleur électronique a été réalisé. Les voies de biosynthèse des composés odorants ont été modélisées par une série de valeurs représentant leur efficacité et leur rapidité. Le modèle permet de prévoir le profil odorant du pétunia en modifiant telle ou telle valeur de façon informatique. Il permettra donc d’orienter les schémas de sélection. Si des allèles des gènes de ces voies sont utilisés comme marqueurs, il sera possible de mettre en place une sélection assistée chez cette espèce. On peut imaginer une démarche identique chez la rose. De plus, aujourd'hui, sur les grandes cultures et chez les animaux, les chercheurs proposent de nouvelles approches qui ne s'intéressent plus uniquement à quelques allèles, mais à une multitude en prenant en compte l'ensemble du génome. On parle de sélection génomique. La séquence du génome ouvre la voie vers de telles approches à long terme. Le deuxième champ d’application concerne la protection des obtentions variétales. Cette application est déjà possible en utilisant les cartes existantes mais le séquençage du génome permettra de mettre au point des sondes plus rapidement. Un obtenteur aura les moyens de réaliser une empreinte génétique fiable de ses variétés et donc une preuve juridique peu discutable. Le problème dans ce type de démarche n’est plus d’ordre technologique mais d’ordre logistique pour mettre en place un organe de contrôle de la concurrence. La séquence d’ADN du rosier donnera accès à des gènes encore inconnus chez les espèces déjà séquencées ; ces gènes pourraient avoir des fonctions exploitables dans des domaines agro-alimentaires, médicaux, pharmaceutiques. Séquencer le génome c’est ouvrir une fenêtre sur la diversité des fonctions biologiques qui caractérisent un organisme (par exemple, qu’est ce que c’est que l’épine de la rose du Petit Prince ?) et c’est rendre possible leur compréhension (quels sont les gènes qui la font, comment gouvernent-ils la croissance et la différenciation de l’épiderme de la tige pour former cette structure défensive ?), mais c’est aussi se donner la possibilité d’exploiter cette diversité pour des fins que nous estimerons utiles, bien qu’il soit impossible de prédire comment aujourd’hui.

 

Une séquence pour très bientôt ?

Le Groupe National Rose souhaite obtenir une première version de la séquence d’ADN pour 2013. La variété choisie est R. chinensis ‘Old Blush’ pour plusieurs raisons. L’argument majeur est qu’elle est diploïde. Il est en effet difficile d’imaginer le séquençage d’une rose tétraploïde qui présenterait deux fois plus d’ADN à séquencer, compliquant la tâche d’assemblage de ce génome. Cette rose est aussi un ancêtre important des roses modernes, elle est facilement cultivable en serre et in vitro et elle est remontante, ce qui permet de travailler toute l’année en serre. Cette première séquence d’ADN, même si elle présente des zones d’incertitudes, sera comme une photo satellite d’une Terra Incognita. Elle fournira des indications précieuses pour une exploration du génome, pour une cartographie plus précise et pour un bond en avant gigantesque dans le domaine des plantes ornementales. Ce qui est en jeu ici, c’est de faire de la Reine des fleurs un « Modèle » incontournable de l’horticulture.

Cet article explique les raisons du travail du Groupe National Rose regroupant presque dix laboratoires français travaillant sur la rose. Ce Groupe s’est donné pour objectif d’obtenir une première version de la séquence du génome du rosier pour 2013. Il associe des dizaines de chercheurs et d’étudiants qui ne peuvent pas tous être cités ici mais qui sont bien sûr pleinement remerciés. Le pilotage du projet sera assuré par les équipes de Mohammed Bendahmane et de Fabrice Foucher.

auteurs de l'article : Jean-Claude Caissard1, Annick Dubois2, Sylvie Baudino1, Olivier Raymond2, Philippe Vergne2, Manuel Le Bris3, Latifa Hamama4 Laurence Hibrand4, Fabrice Foucher4, Mohammed Bendhamane2

 

1Laboratoire de Biotechnologies Végétales appliquées aux Plantes Aromatiques et Médicinales (EA 3061) Université Jean Monnet, Université de Lyon, 23 rue du Dr Michelon, 42023 Saint-Etienne cedex 2
2Laboratoire Reproduction et Développement des Plantes (UMR INRA 879 - CNRS 5667 - Université Lyon 1 - ENSL) Ecole Normale Supérieure de Lyon, 46 Allée d’Italie, 69364 Lyon cedex 7
3Institut Méditerranéen de Biodiversité et d’Ecologie marine et continentale (UMR CNRS 7263 - IRD 237 - Université Aix-Marseille) Campus St Jérôme, Avenue Escadrille Normandie Niémen, Case 422, 13397 Marseille cedex 20
4Institut de Recherche en Horticulture et Semences (UMR INRA/Agrocampus ouest/Université d'Angers 1345), Centre INRA, 42 rue Georges Morel, 49071 Beaucouzé cedex

mars-avril 2013