GENES ET GENOME - LECTURE

 

À la différence des Procaryotes, les organismes eucaryotes sont caractérisés par la présence de plusieurs chromosomes et leur ADN est séparé du cytoplasme par la membrane nucléaire. Chez les Eucaryotes le grand nombre de chromosomes semble en rapport avec le nombre de gènes constituant un génome plus important et plus complexe que celui des Procaryotes.

 

Chromosomes et chromatine

 

L’ADN eucaryote est compacté sous la forme de chromosomes. La structure des chromosomes est la conséquence d'une série de procédures par lesquelles un très long brin d’ADN, de 2 nanomètres d’épaisseur, est condensé. La forme finale est un chromosome de 1 400 nanomètres d’épaisseur. Le premier niveau de compactage est réalisé grâce à l’action d’une série de protéines, les histones. Les histones se lient à la double hélice d’ADN et l’enveloppent dans une série d’unités discrètes, les nucléosomes, comme un collier de perles. À ce point, l’épaisseur du chromosome est d’environ 11 nanomètres. La phase suivante consiste à replier une série de nucléosomes dans une fibre de chromatine plus compacte (la chromatine est l’ensemble de l’ADN et des protéines qui l’enveloppent). Cette fibre a une épaisseur d’environ 30 nanomètres. Des portions différentes de la fibre de chromatine sont ensuite disposées dans une série de semi-ellipses, rangées l’une à côté de l’autre. L’épaisseur du chromosome atteint alors 300 nanomètres. Les semi-ellipses sont ensuite condensées pour former une structure de 700 nanomètres d’épaisseur, qui représente l’état normal de la chromatine au repos (c'est-à-dire quand la cellule ne se divise pas). Enfin, la chromatine condensée est empaquetée une nouvelle fois dans la forme du chromosome en métaphase (pendant la division cellulaire), avec une épaisseur typique de 1 400 nanomètres.

 

L’organisation des gènes

 

Comment sont organisés les gènes à l’intérieur du génome eucaryote ? À la différence des Procaryotes, les Eucaryotes ne présentent généralement pas de structure formée d'opérons. Les gènes impliqués dans les mêmes voies métaboliques se trouvent en des points disparates du génome, souvent dans des chromosomes différents. Peut-être cela est-il dû au fait que les voies métaboliques eucaryotes sont plus complexes et qu’elles dépendent des mêmes enzymes pour des fonctions différentes, dans des localisations cellulaires différentes et dans des temps d’intervention différents. Il devient dès lors avantageux de réguler les différents gènes de façon indépendante, et non pas comme une unité compacte du type de l'opéron.

 

Familles de gènes

 

Un phénomène typique du génome eucaryote est la présence de ce qu’on appelle les familles de gènes. Elles sont constituées de gènes dont la séquence est à ce point semblable que les biologistes estiment qu’ils proviennent de la duplication d’un seul gène ancestral. L’une des familles de gènes les plus étudiées est celle des globines, un groupe assez commun de protéines respiratoires qui ont un rôle important dans le transport des gaz. Cette famille inclut les hémoglobines, les myoglobines et les leghémoglobine des plantes et des Bactéries. Chez les êtres humains, il existe 11 gènes différents dont la séquence des bases montre qu’ils font partie de cette famille. Cinq de ces gènes se trouvent dans le chromosome 16, les six autres sont localisés dans le chromosome 11. Les chaînes des acides aminés de la protéine codée par ces gènes se lient pour former la molécule d’hémoglobine, responsable du transport de l’oxygène et du gaz carbonique dans le sang d’un individu adulte. Les gènes présents dans le chromosome 16 codent pour différentes variantes de la globine a, tandis que les gènes présents dans le chromosome 11 codent pour différentes formes de globine b. Certaines de ces variantes sont utilisées par l’organisme dans des phases différentes de son développement. Par exemple, certaines formes d’hémoglobine ne sont produites que dans l’embryon, d’autres sont typiques du fœtus immédiatement avant la naissance. Certaines versions des chaînes d’acides aminés codées par cette famille de gènes ne sont pas actives, et les séquences correspondantes dans la molécule d’ADN sont connues sous le nom de pseudogènes. Les pseudogènes représentent des formes ancestrales de gènes de la famille, qui ne peuvent plus être utilisées. De nouvelles mutations peuvent se produire dans un des gènes répliqués au cours de l’évolution, sans pour autant être éliminées, car les autres membres de la famille de gènes continuent d'exercer leurs fonctions vitales pour l’organisme. Cela permet au gène répliqué de se développer par accumulation de mutations. Si ces mutations se révèlent avantageuses dans un milieu donné, ou à un stade donné du développement, le gène peut même recevoir une autre fonction, toujours liée à la précédente cependant. Beaucoup de biologistes moléculaires estiment que ce mécanisme d’évolution par duplication et divergence à l’intérieur des familles de gènes est l'une des causes principales de l'apparition de nouvelles fonctions, qui se produit sur plusieurs millions d’années. Par exemple, on pense que la famille de la globine est le résultat d'au moins 10 duplications, qui ont eu lieu au cours des centaines de millions d’années écoulées.

 

Les gènes chez les Eucaryotes : exons et introns

 

Le gène eucaryote présente une structure beaucoup plus complexe que son équivalent procaryote. Normalement, les régions en amont et en aval de la séquence qui code pour la protéine sont importantes pour la régulation des activités du gène. Souvent, chacune de ces séquences est responsable de l’activation du gène dans des circonstances différentes. Par exemple, certains gènes ne doivent être activés qu'à certains stades du développement d’un organisme, ou bien seulement dans certains types de cellules, ou bien encore en réponse à des conditions extérieures données (telles que, par exemple, un stress thermique). Les différentes séquences d'activation du gène répondent à des signaux intracellulaires spécifiques, de sorte que le gène n’est transcrit qu'au moment et à l'endroit voulus. Beaucoup de gènes doivent être en mesure de répondre à des impulsions différentes, et sont donc dotés de séquences d'activation différentes, Chacune de ces séquences díactivation est spécifique pour une stimulation donnée. La structure interne du gène n’est pas moins complexe. Souvent, un gène eucaryote est interrompu par une ou plusieurs séquences qui ne codent aucune partie du produit protéique final. Ces régions sont dites introns, tandis que les séquences codantes sont dites exons. Les introns font partie intégrante des segments d’ADN transcrits par l’ARN-polymérase, mais ils sont ensuite éliminés pendant le processus de synthèse de l’ARNm, dit mature, qui sera transporté du noyau au cytoplasme, puis traduit par les ribosomes. La biologie moléculaire ne connaît pas encore la fonction précise des introns, même si de nombreuses explications en ont été proposées, en relation avec la structure discontinue de l’ADN. Remarquons que chaque exon correspond souvent au domaine fonctionnel de la protéine finale, c'est-à-dire à une partie de la protéine ayant une fonction particulière. Potentiellement, les exons de différentes protéines peuvent être mélangés pour créer de nouvelles protéines, codées par des segments de gènes différents. En outre, les introns, absents chez les Procaryotes, sont présents toutefois chez les Archéobactéries, ce qui jette une lumière importante sur la compréhension des relations phylogénétiques formant la base de l’arbre de la vie (phylogenèse).

 

GÈNES ET ENVIRONNEMENT

 

L’information contenue dans les séquences des gènes qui constituent un génome est souvent comparée à un projet de construction d'un organisme, qu’il s'agisse d'une plante, d'un champignon, ou d'un animal. En réalité, tout être vivant est le résultat d’une interaction complexe et continue entre les gènes et l'environnement, et toute tentative de comprendre l’évolution biologique doit tenir compte de ce fait fondamental.

L’action de certains gènes est complètement indépendante des influences de l'environnement. Par exemple, la couleur des yeux chez l’homme ne dépend pas de la température, de l’alimentation ou de toute autre caractéristique de l'environnement où vit l’individu.

Il existe, cependant, de nombreux gènes programmés pour répondre spécifiquement à certaines conditions de l'environnement. Par exemple, certains Insectes ont la possibilité de développer ou de ne pas développer leurs ailes. Le développement des ailes est une option métaboliquement coûteuse pour l’organisme, mais il offre l’avantage de pouvoir agrandir considérablement le rayon d’action d’un individu pour la recherche de nourriture. Les gènes qui contrôlent le développement des ailes chez certaines espèces de grillons, par exemple, répondent à l’abondance de ressources. Si l’insecte continue de trouver suffisamment de nourriture dans les alentours immédiats, les ailes ne se développeront pas, ce qui permettra de faire des économies d'énergie, au profit de la phase de reproduction. Si, par contre, la nourriture commence à manquer, tout le développement de l’insecte sera consacré à la création d’ailes. L’individu pourra par conséquent quitter l'environnement défavorable dans lequel il se trouve, et chercher des lieux plus satisfaisants.

Un comportement semblable des gènes peut être observé également chez certaines espèces de plantes. Un exemple typique est représenté par ce qu’on appelle mécanisme de « réponse à l’ombre ». Si une plante croît dans une zone où la végétation environnante est dispersée, elle tendra à fleurir relativement tard, augmentant entre-temps le nombre de ses développements collatéraux, qui produiront plus de fruits après la période de floraison. Cela est rendu possible par l’abondance de lumière, la principale source d'énergie des végétaux. Si, par contre, une plante jeune se trouve dans l’ombre d’autres plantes, elle tend à éliminer la production de branches latérales et à croître très rapidement en direction verticale, accélérant son temps de floraison. Ce « comportement » permet à la plante d’accomplir son cycle vital avant d’être complètement éliminée par la concurrence de ses voisins. Comment la plante sait-elle que la compétition est en train de devenir intolérable ? Certains gènes spéciaux codent pour une série de molécules connues sous le nom de phytochromes. Ces protéines sont à même de mesurer la quantité et la qualité (la couleur) de la lumière incidente. Si les caractéristiques de la lumière qui parvient aux feuilles ne sont pas les caractéristiques correctes, les phytochromes déclenchent une réaction en chaîne qui active une série d’autres gènes, qui commandent les réactions morphologiques qu’on vient de décrire.

Les gènes impliqués dans ce type de réponse aux changements de l’environnement sont des gènes régulateurs, souvent dits « gènes pour la plasticité phénotypique », terme technique indiquant la capacité d’une plante ou d’un animal à répondre de façon sélective à des stimuli donnés par l’environnement. La recherche touchant la plasticité phénotypique est l’un des domaines les plus actifs de la biologie de l’évolution moderne.

 

 

L’ADN RECOMBINÉ

NAISSANCE DU GÉNIE GÉNÉTIQUE

 

Le génie génétique est un domaine d'application de la génétique qui comprend un ensemble de techniques ayant pour but de manipuler des organismes vivants (qu'il s'agisse de Bactéries, de plantes, ou d'animaux), en en modifiant le patrimoine génétique. L’origine du génie génétique, en tant que tel, remonte au Néolithique et coïncide avec le début des pratiques d'agriculture et d’apprivoisement des animaux par nos ancêtres.

À travers le processus de sélection artificielle, l’homme est parvenu à obtenir des produits végétaux économiquement intéressants et très diversifiés comme le blé, les pommes de terre, ou les brocolis, ainsi que des animaux très importants pour notre industrie alimentaire tels que la vache ou le porc. Les compagnons les plus présents dans notre vie quotidienne aussi, tels que les chiens et les chats, sont le résultat de la sélection artificielle. Tous ces organismes sont radicalement différents de leurs ancêtres sauvages, aussi bien dans leur l'aspect extérieur (phénotype) que dans leur patrimoine génétique (génotype). Mais cette diversité a été obtenue simplement en exploitant les variations qui se produisent de façon aléatoire dans la nature, et en les recombinant grâce à un choix soigné de croisements opportuns.

Un exemple de sélection artificielle est fourni par les expériences de laboratoire qui, en très peu de jours, permettent d’obtenir des Bactéries résistant à un antibiotique donné. Une culture de la Bactérie gastro-intestinale Escherichia Coli est exposée à un agent mutagène, puis est semée sur deux plaques d’agar (une substance qui peut être utilisée par les Bactéries comme source alimentaire). L’une des deux plaques contient aussi un puissant antibiotique, la streptomycine, capable de tuer les cellules bactériennes normales. Sur la plaque d’agar pur, les Bactéries se développent partout en de nombreuses colonies. Sur la plaque contenant aussi l’antibiotique, en revanche, seuls les rares mutants qui ont développé l'aptitude à résister à la streptomycine parviennent à survivre et à se reproduire. C'est ainsi qu'une nouvelle souche d’Escherichia Coli a été obtenue par sélection artificielle.

L’amélioration par sélection, la seule méthode dont nos ancêtres disposaient pour manipuler d’autres êtres vivants, est devenue obsolète vers la moitié des années 70, avec l'avènement du génie génétique moderne. Pour la première fois, il fut possible d’isoler, de manipuler et de réinsérer des morceaux d’ADN de n'importe quelle origine dans un organisme quel qu'il soit, par exemple d’une Bactérie à une plante, ou inversement. Cela a été possible grâce à la découverte d’une classe particulière de protéines, dites enzymes de restriction, et au rôle qu’elles jouent dans la défense naturelle des Bactéries contre leurs parasites (notamment les bactériophages).

 

LES ENZYMES DE RESTRICTION

 

Les Bactéries, organismes unicellulaires appartenant au règne des protistes, subissent des attaques de parasites, tout comme les plantes, les animaux et l’homme. Les parasites bactériens sont appelés bactériophages (littéralement « mangeurs de Bactéries ») ou simplement phages.

Au cours des années 70, on découvrit que certains phages ne réussissent à attaquer efficacement que les Bactéries appartenant à la souche sur laquelle ils se sont développés durant la génération précédente. Ce phénomène ne pouvait pas être interprété par l’apparition de mutations, car si les phages s’étaient développés alternativement sur deux souches d’Escherichia coli, ils acquéraient à chaque génération l'aptitude à attaquer la dernière souche parasitée, mais ils oubliaient mystérieusement la façon d’attaquer la souche précédente. Ces observations furent enfin expliquées par la découverte des enzymes de restriction. Ces enzymes constituent de véritables défenses antivirales qui aident la Bactérie à survivre à l’attaque des phages.

Une enzyme de restriction typique est capable de reconnaître une séquence d’ADN spécifique en palindrome, et de la couper. L’ADN du phage est donc coupé par les enzymes de restriction, et il ne peut donner naissance à de nouveaux phages.

Pourquoi l’enzyme de restriction ne coupe-t-elle pas l’ADN de la Bactérie, commettant de cette façon une sorte de suicide cellulaire ? L’ADN de chaque souche de Bactéries est protégé par un processus de modification chimique spécial (méthylation), précisément dans les zones qui seraient coupées par l’enzyme. Lorsque l’enzyme rencontre les zones méthylées, elle laisse l’ADN intact. Chaque souche bactérienne possède un modèle de méthylation spécifique dont héritent les générations de Bactéries suivantes. Les quelques phages à même de survivre et de se reproduire dans ces conditions, héritent du modèle de méthylation de la Bactérie qu’ils ont réussi à infecter, et sont donc protégés contres les attaques éventuelles des enzymes de restriction de la même souche bactérienne, du moins tant qu'ils continuent à se développer sur cette souche. Lorsqu’ils en envahissent une autre, ils acquièrent le modèle de méthylation de la nouvelle souche, perdant en même temps le modèle de la première souche.

 

L’ADN RECOMBINÉ

 

Les biologistes ont exploité l’existence de différents types d’enzymes de restriction, chacune en mesure de couper des séquences différentes et spécifiques d’ADN, pour produire de l’ADN recombiné. L’ADN recombiné est un ensemble de molécules hybrides d’ADN, se formant à partir de la fusion de matériel génétique provenant d’espèces différentes. Une fois créé, il peut être introduit dans d’autres organismes choisis par les enzymes de restriction.

Pour commencer, l’ADN de deux organismes différents est coupé par la même enzyme de restriction. Les deux fragments obtenus sont généralement caractérisés par des « extrémités collantes » compatibles. Cela se produit parce que les enzymes coupent l’ADN de façon à ne laisser qu'une hélice ouverte aux extrémités de chaque segment en double hélice. Ces extrémités libres d’ADN complémentaire sont donc en mesure de s’aligner et de s’apparier, en respectant les règles d’appariement des bases nucléotidiques (voir double hélice). Une fois que les deux fragments d’ADN se sont réunis grâce à l’appariement de leurs extrémités respectives, une enzyme spéciale, dite ADN-ligase, recolle les deux fragments, créant de la sorte une nouvelle molécule d’ADN recombiné qui, auparavant, n’existait pas dans la nature.

 

 

ISOLEMENT DES GÈNES

 

Comment trouve-t-on un gène parmi les dizaines ou les centaines de milliers présents dans chaque organisme ?

La première phase pour isoler un nouveau gène est d’obtenir une « sonde » spécifique. Généralement, la sonde est constituée de l’ADN d’un gène homologue (on peut, par exemple, créer des gènes semblables à celui qui code pour l’hémoglobine humaine dans d’autres organismes) ou d’ADNc, c'est-à-dire d'une copie de l’ARN produit par le gène en question sous forme d’ADN complémentaire.

Une fois la sonde obtenue, celle-ci peut être marquée par des procédures qui utilisent des nucléotides contenant le radio-isotope du phosphore (P32). Une fois marquée, la sonde peut être utilisée dans la technique d’hybridation, qui permet à des molécules d’ADN semblables de se reconnaître. L’utilisation de la sonde pour l’isolement d’un gène donné est liée à la possibilité de rassembler, dans une série de fragments d’ADN, tout le génome de l’organisme qu’on veut étudier. On parle, dans ce cas, d'une bibliothèque de gènes.

Les fragments d’ADN génomiques sont obtenus au moyen d'enzymes de restriction. Ces mêmes enzymes sont utilisées pour couper l’ADN d’un bactériophage ou d’un plasmide, employés tous les deux comme vecteurs. Les deux types de fragments sont ensuite liés l'un à l'autre (en utilisant l’enzyme ADN-ligase) et incorporés, par exemple, dans une série de vecteurs phages (voir transduction), qu'on a laissés se développer dans des cultures bactériennes sur un substrat dur. Chaque phage recombiné se reproduit en créant une plage de lyse, visible sur le tapis bactérien, qui correspond à une région de Bactéries lysées. Mais, surtout, chaque phage recombiné abrite, à l’intérieur de son génome, un fragment d’ADN exogène correspondant à une région particulière du chromosome de l’organisme en cours d’analyse. Ces collections de phages recombinés constituent une librairie génomique.

À ce point, la seule chose que le chercheur a à faire est d’utiliser la sonde pour chercher dans la librairie génomique le phage recombiné qui abrite le fragment d’ADN contenant le gène qui l'intéresse. Une fois qu’on l’a trouvé, il faut alors isoler le clone phagique recombiné positif à l’hybridation, et le caractériser par une série de techniques standard de biologie moléculaire. Le processus est analogue à la recherche d’un texte dans une encyclopédie informatisée au moyen d'un mot-clé. La sonde (mot-clé) est comparée aux fragments (textes) existant dans la librairie génomique (encyclopédie), jusqu’à ce qu'on obtienne une réponse positive. Comme dans le cas des recherches informatisées, il ne faut pas que le mot-clé et le texte cherché soient parfaitement identiques, il suffit qu’ils soient assez semblables pour qu’on puisse être sûr que l’on a trouvé un texte lié à celui qu’on cherchait. De façon analogue, la séquence cible dans la librairie génomique ne sera pas identique à la sonde, mais le degré d’homologie (une mesure de similarité) sera suffisamment élevé pour qu'on soit certain qu’on a identifié un gène très semblable à celui à partir duquel la sonde a été produite. Dans le cas de l’ADN génomique, le fait que la sonde soit marquée radioactivement permet d’identifier au moyen d’une radiographie le clone contenant le fragment souhaité. Une technique particulièrement efficace récemment mise au point pour isoler de nouveaux gènes est la technique dite cible mutagène.

 

 

CLONAGE D’UN GÈNE

 

L’une des applications les plus importantes du génie génétique consiste à cloner (c'est-à-dire à isoler, puis à amplifier en des millions de copies) des gènes intéressants pour la recherche ou pour des applications pratiques. La première phase de la caractérisation d’un gène est son clonage. Une fois qu’il a été isolé, on pourra le séquencer afin de connaître sa structure nucléotidique primaire.

L’une des méthodes de clonage génique les plus simples utilise un type particulier d’ADN bactérien extra-chromosomique. Plusieurs espèces de Bactéries contiennent des molécules d’ADN circulaire (c'est-à-dire en forme d’anneau), dites plasmides, qui viennent s'ajouter au chromosome bactérien normal. De par leur petite taille, les plasmides se prêtent particulièrement à des manipulations avec des enzymes de restriction et peuvent donc être utilisés comme vecteurs pour le clonage de gènes.

Supposons que nous voulions cloner un gène précédemment isolé dans une plante ou un animal. Nous pouvons utiliser la même enzyme de restriction, en mesure, dans ce cas, de créer des extrémités « collantes » à hélice individuelle, pour couper le gène en question et un plasmide bactérien utilisé en tant que vecteur. Nous pourrons, par exemple, choisir un vecteur plasmide contenant deux gènes pour la résistance à deux antibiotiques, l’ampicilline et la tétracycline. Nous choisissons l’enzyme de restriction pour qu’elle coupe l’ADN de l’un des deux gènes du plasmide, par exemple le gène pour la résistance à la tétracycline. L’ADN à cloner et le plasmide s’unissent au moyen des extrémités « collantes » de l’hélice laissée couverte par l’enzyme de restriction. L’enzyme ADN-ligase réunit donc les deux fragments pour obtenir finalement un plasmide complet. À ce point, nous avons créé une molécule d’ADN recombiné, constituée du plasmide original et du nouveau gène, qui se trouvera au milieu du gène du plasmide original qui code pour la résistance à la tétracycline (mais qui, de cette façon, a été interrompu et a perdu sa fonctionnalité).

Comment clone-t-on le plasmide recombiné ? On peut réinsérer le plasmide dans une Bactérie au moyen de la procédure dite de transformation des Bactéries. La Bactérie ainsi formée est définie à son tour comme un clone ; elle se divisera pour former une colonie de cellules parfaitement identiques. Chaque membre de la colonie aura également une copie du plasmide et, puisqu’une colonie bactérienne peut produire des millions de cellules en quelques heures, nous aurons obtenu des millions de copies du plasmide et, donc, du gène que nous avons inséré. Pour distinguer les Bactéries qui ont effectivement incorporé l’ADN recombiné de celles qui n’ont reçu que le vecteur plasmide refermé sur lui-même, nous pouvons cultiver ces Bactéries dans un milieu ne contenant que l’ampicilline et dans un milieu contenant l’ampicilline et la tétracycline. Les Bactéries recombinées seront en mesure de croître dans le milieu de culture contenant l’ampicilline, mais pas dans celui qui contient la tétracycline, car le gène de la résistance à la tétracycline a été rendu inactif par l’insertion du gène cloné. Il existe une autre méthode pour identifier un gène cloné, appelée blotting.

 

 

SÉQUENÇAGE D’UN GÈNE

 

Si nous voulons savoir le fonctionnement exact díun gène, l’une des informations clés est sa séquence nucléotidique, c'est-à-dire la séquence de bases azotées qui constituent sa double hélice, et qui codent la protéine ou l’enzyme que ce gène est à même de produire (voir gènes et protéines). Frederick Sanger inventa (ce qui lui valut le prix Nobel) une méthode très efficace pour séquencer un fragment d’ADN. Le gène en question, cloné dans un vecteur plasmide particulier (voir chapitre précédent), est dénaturé, si bien que les deux hélices sont séparées. L’une des deux hélices est utilisée comme modèle, tout comme dans la réplication naturelle de l’ADN à l’intérieur des cellules. Une courte séquence oligonucléotidique à un brin, et complémentaire à une région du vecteur plasmide situé à proximité du point d’insertion de l’ADN cloné, est utilisée comme amorce pour la réaction de polymérisation.

Les brins, l’oligonucléotide d'amorce, l’enzyme ADN-polymérase (qui catalyse la duplication de l’ADN dans les organismes vivants), et un mélange des quatre nucléotides, dont l’un est marqué radioactivement, sont mis dans quatre éprouvettes (identifiées par les lettres A, C, G ou T). Dans chaque éprouvette est ajouté un désoxynucléotide modifié, auquel il manque un groupe hydroxyle -OH (un groupe formé d’un atome d’oxygène et d'un atome d’hydrogène) en position 3’ du désoxyribose (voir composition chimique de l’ADN). Ces précurseurs, qui présentent des bases modifiées, sont appelés didésoxynucléotides, et ils ne permettent pas la polymérisation par l’ADN-polymérase, car ils ne possèdent pas le groupe hydroxyle en position 3’ responsable de la liaison phosphodiester. Quand l’ADN-polymérase insère une base ainsi modifiée, la synthèse d'ADN cesse, et une série de fragments à hélice individuelle ayant une longueur différente, mais finissant tous par une base particulière, celle qui contient le didésoxynucléotide (selon l’éprouvette), s’accumulent au cours du processus.

Les produits des quatre réactions (une par éprouvette) sont ensuite soumis à une électrophorèse sur gel, pour séparer les fragments selon leurs dimensions (c'est-à-dire selon leur poids moléculaire). Puisque dans chaque mélange de réaction était présente une base radioactive, une radiographie du gel permet de visualiser la position de chaque bande (fragment) dans chacune des quatre colonnes (correspondant aux fragments se terminant en A, C, G et T). À ce moment, la séquence du gène inconnu peut être lue directement sur le gel. Si on part de la partie la plus basse (dans laquelle se trouvent les fragments les plus petits, qui se sont beaucoup déplacés pendant l’électrophorèse), et qu'on se déplace en diagonale vers des fragments de plus en plus grands à travers les quatre colonnes, on lit (dans le cas de notre exemple) G-A-C-T-G... De la séquence nucléotidique, au moyen du tableau du code génétique, on peut déduire la séquence des acides aminés qui formera la protéine quand le gène sera transcrit puis traduit.

 

LE PROGRAMME GÉNOME HUMAIN

 

 

Le Programme Génome Humain (PGH) est l’un des domaines de recherche de la biologie moléculaire moderne les plus importants, les plus coûteux et les plus controversés. Son objectif fondamental est de comprendre les mécanismes génétiques qui régissent le développement d’un être humain, afin de fournir un instrument thérapeutique puissant à la médecine moléculaire moderne. Par la portée de son objectif et l’ampleur des moyens mis à la disposition des chercheurs qui y participent, on peut comparer le Programme Génome Humain au Programme Apollo, qui porta l’homme sur la Lune, ou à l’actuel développement des recherches dans le domaine de la physique des particules. Cette section traitera différents aspects du PGH, depuis les aspects strictement scientifiques, aux aspects politiques et financiers, en passant par les aspects de nature éthique.

 

 

NAISSANCE DU PROGRAMME

 

Le PGH fut proposé à l’origine par Robert L. Sinsheimer de l’Université de Californie de Santa Cruz, États-Unis. En novembre 1984, Sinsheimer suggéra la création d’un institut pour l’étude du génome humain, financé sur des fonds privés au moyen de donations, avec un investissement initial de 25 millions de dollars et un coût annuel de 5 millions de dollars. L’institut en question fut formellement présenté au public lors d’une conférence qui se tint à l’Université de Californie de Santa Cruz en mai 1985. En mars 1986, le programme s’était élargi et comprenait dès lors le Département de l’Énergie du gouvernement américain, qui organisa une deuxième conférence à Santa Fe, au Nouveau-Mexique, États-Unis. Dans la deuxième moitié de l’année 1986, les Los Alamos National Laboratories (où fut inventée la bombe atomique) et le prestigieux Institut pour la Technologie de Californie s’étaient joints à l’entreprise. Enfin, en février 1988, le Conseil national de la recherche américain et l’Académie nationale des sciences des États-Unis formèrent un comité en vue de l'établissement de la carte chromosomique et du séquençage du génome humain. Ce comité a par la suite publié et coordonné les efforts internationaux, y compris ceux de l’Europe (France, Grande-Bretagne, Italie) et ceux du Japon.

 

 

BUT DES RECHERCHES

 

Mais à quelle fin séquencer un génome, et le génome humain en particulier ? Le Programme Génome Humain comprend en réalité différents programmes semblables concernant d’autres organismes, des Bactéries intestinales aux Champignons, en passant par la drosophile (l’un des organismes les plus étudiés par les généticiens et les biologistes). L’idée fondamentale est que l’ADN contient de l’information pour le développement et le fonctionnement correct d’un organisme entier, information qui est transmise de génération en génération. L’ADN est formé de toute une série de composés chimiques appelés bases (voir composition chimique de l’ADN). La séquence de ces bases peut donc être lue et, si elle est correctement interprétée, elle devrait fournir des informations vitales sur l’organisme. L’un des objectifs du PGH est donc de permettre une meilleure compréhension de la structure et du fonctionnement du génome d’un organisme, et de comparer différents génomes entre eux, dans le but d’étudier leur évolution. Mais il a été clair dès le début que la recherche de base n’est que l’un des aspects secondaires de cette entreprise internationale. Ce qui a enflammé l’imagination de beaucoup, c'est la possibilité de comprendre la nature humaine elle-même. Les médecins et les biologistes soutiennent qu’une connaissance approfondie de la séquence des gènes humains permettra de découvrir les causes ultimes de chaque maladie et, pense-t-on, indiquera la voie pour le traitement définitif des maux principaux de ce siècle, du cancer au sida. Sur des bases strictement scientifiques, le PGH propose simplement la création d’une carte extrêmement détaillée du génome humain, ainsi que le séquençage de quelques zones présentant un intérêt particulier. À long terme, toutefois, il est clair que la promesse d’une médecine moléculaire préventive repose sur la lecture du génome tout entier, base par base.

 

 

COMPARAISON DES GÉNOMES

 

Les chercheurs connaissent déjà la séquence complète de certains génomes parmi les plus simples qui existent, tels que ceux de certains virus. Le niveau de complexité suivant est représenté par les Bactéries, avec environ 2 000 gènes par génome. Si l’on procède le long d’une échelle imaginaire de complexité, on arrive ensuite aux Champignons (qui figurent parmi les organismes Eucaryotes les plus simples), et aux invertébrés, comme la drosophile (avec un nombre de gènes estimé à environ 5 000). La complexité des génomes de vertébrés tels que les Mammifères, dont l’homme, est sans doute impressionnante (à peu près 100 000 gènes pour notre espèce), et il est clair qu’une pierre de touche constituée par des êtres vivants plus simples est nécessaire pour orienter le chercheur quand il tente d’analyser l’information volumineuse contenue dans quelques chromosomes (23 paires dans l’espèce humaine).

 

 

ISOLEMENT DES CHROMOSOMES

 

Du point de vue pratique, la première difficulté rencontrée par les chercheurs du PGH a été d’isoler un chromosome spécifique (voir chromosomes et chromatine) parmi les 23 paires qui constituent le génome humain. Deux techniques peuvent être utilisées, parfois en combinaison, pour atteindre ce but.

1) La première est connue sous le nom d'hybridation. Les cellules humaines sont fondues en éprouvette avec des cellules de souris et, étant donné que ces hybrides sont instables, les cellules qui résultent perdent sélectivement des chromosomes humains durant la division cellulaire. Le processus peut être poursuivi jusqu’à donner lieu à des lignes cellulaires ayant un seul chromosome humain mélangé à ceux de la souris.

2) La deuxième méthode pour isoler un chromosome humain, toujours en partant de cellules hybrides, est la méthode dite de la cytométrie de flux. Un extrait de chromosomes est marqué au moyen de colorants fluorescents et suspendu dans l’eau. Pour ce faire, on utilise des sondes marquées au moyen de colorants fluorescents, qui reconnaissent de façon spécifique les séquences hautement répétitives qui caractérisent les chromosomes humains. La solution est ensuite passée, goutte à goutte, à travers un système de lasers, qui identifient les gouttes contenant des chromosomes différents, les chromosomes humains, fluorescents, et les chromosomes de souris, non marqués. Les gouttes passent ensuite à travers un collier électrifié qui charge électriquement les chromosomes fluorescents. Une paire de plaques électromagnétiques permet ensuite d’orienter les chromosomes humains dans une éprouvette, en les séparant des chromosomes de souris.

 

 

SÉQUENÇAGE

 

Une fois qu’un chromosome donné a été isolé, son ADN est extrait et les procédures normales d'établissement de la carte et de séquençage de l’ADN fondées sur les techniques de l’ADN recombiné sont appliquées. À ce point, le processus de séquençage peut être exécuté automatiquement sous le contrôle d’un système informatisé. Le nombre de gènes présents dans le génome humain, identifiés par des moyens traditionnels ou des techniques avancées, a augmenté régulièrement de la fin des années 50 à la fin des années 80, et il est actuellement d’environ 5 000 gènes (rappelons, toutefois, qu’on suppose que le génome humain tout entier possède environ 100 000 gènes).

 

 

COÛT DU PROGRAMME

 

Comme tout programme de recherche ambitieux, le PGH se caractérise par des coûts opérationnels et de gestion relativement élevés (même s’ils ne sont pas encore comparables à ceux qui sont engagés dans le domaine de la physique des hautes énergies). La version originale du programme, celle qui fut proposée par l’Université de Californie de Santa Cruz en 1984, avait prévu un coût initial de 25 millions de dollars, puis des financements ultérieurs de 5 millions par an. Ces estimations se sont démontrées très optimistes. Un tableau proposé en 1988 par le bureau d'évaluation technologique du gouvernement américain, prévoyait un coût total de 660 millions de dollars pour les cinq années 1989-1993. Ces coûts comprenaient les ordinateurs et les logiciels destinés aux analyses, l’élaboration de cartes génétiques à basse résolution du génome tout entier, le séquençage de certains gènes d’importance particulière, la mise au point de nouvelles technologies de biologie moléculaire, des bourses d’étude et de recherche, et les dépenses administratives.

Les estimations les plus récentes prévoient un coût de 0,5 dollar par base séquencée, plus un coût supplémentaire d’environ 100 millions de dollars par an, rien que pour la mise au point de nouvelles technologies liées au PGH. L’objectif actuel est le séquençage total du génome humain d'ici 2005. Rappelons qu’un seul gène contient de 2 000 à 2 millions de bases, et que le génome humain tout entier consiste en à peu près 3 milliards de bases.

 

 

CRITIQUES

 

LES ARGUMENTS SCIENTIFIQUES

 

Le Programme Génome Humain a reçu des critiques substantielles au plan scientifique dès qu’il a été proposé officiellement dans les années 80. L’un des arguments les plus radicaux est que, en fait, ce que l’on appelle le « génome humain » n’existe pas ! Non pas que les gènes et les génomes ne soient pas présents à l’intérieur de chaque cellule humaine, mais ils sont différents dans chaque individu, sauf dans le cas de jumeaux monozygotes. L’objection se fonde sur notre connaissance étendue de la génétique des populations humaines, qui démontre, entre autres choses, que chaque population se caractérise par des fréquences différentes des différentes formes alléliques de presque chaque gène étudié jusqu’à présent. Dans un certain sens, parler de génome humain comme s’il s’agissait d’une entité monolithique et stable, c'est revenir au concept typologique d’espèce, qui avait été abandonné dès le siècle dernier. Cette idée populaire avant que la théorie de l’évolution ne fût proposée par Charles R. Darwin (1809-1882), soutenait que les espèces sont fixes et que la variabilité entre individus à l’intérieur de chacune d’entre elles est complètement secondaire. Aujourd’hui, au contraire, il est universellement reconnu que la variabilité intraspécifique est fondamentale pour l’existence même des espèces et pour leur aptitude à évoluer.

Une deuxième objection adressée au PGH se fonde sur un plan plus technique. Le génome humain est extrêmement vaste (environ 3 milliards de bases), mais ses 100 000 gènes environ ne représentent probablement que 5 % de l’information totale (et actuellement on n’est pas en mesure de comprendre pourquoi 95 % de notre génome n’a aucune fonction apparente). Par conséquent, séquencer tout le génome humain sans distinction revient à vider un océan entier en vue de récupérer une flotte de navires ! Ne serait-il pas plus sensé, demandent les critiques, d’utiliser des techniques plus spécifiques pour identifier et séquencer directement les différents gènes ?

Un troisième argument contre le PGH porte sur l'affirmation de ses tenants, selon laquelle il s'agirait d’une science d’avant-garde, ce qui justifierait ses coûts élevés. Selon les chercheurs participant au PGH, l’une des retombées économiques principales du programme sera le développement de nouvelles technologies. C’est ce qui arriva pour le Programme Apollo, qui donna lieu à d’innombrables applications industrielles, parmi lesquelles les calculatrices de poche et les ordinateurs personnels. Mais, soutiennent les détracteurs du PGH, les technologies employées dans le programme de séquençage sont extrêmement pointues (c’est-à-dire spécifiques pour ce type d’application) et, pour la plupart, ont déjà été mises au point au cours des quarante dernières années de la biologie moléculaire.

 

 

LES ARGUMENTS MORAUX

 

Le Programme Génome Humain a attiré un type de critiques complètement différentes de celles qui se fondent sur des considérations purement scientifiques. Étant donné que le programme propose la connaissance approfondie de la nature humaine elle-même, des arguments contre le PGH ont été présentés sur des bases religieuses, philosophiques et morales. En ceci, le PGH ressemble à bien peu d’entreprises de ce genre dans le domaine scientifique. Parmi celles-ci, citons les recherches dans le domaine des technologies militaires et dans celui des techniques d'ingénierie génétique, sur des organismes présentant un intérêt agricole et alimentaire.

L’une des principales critiques adressées au PGH se fonde sur l’idée qu’une connaissance détaillée des séquences de bases de l’ADN humain pourrait avoir pour conséquence, fût-ce lointaine, une connaissance de la nature humaine. L’ADN est simplement l’une des nombreuses parties qui composent un être humain et qui en définissent l’individualité. Le processus de développement et les interactions avec le milieu sont également importants. Par exemple, la myopie est un défaut génétique (qui, au moyen d’une paire de lunettes bien calibrées, c’est-à-dire par une intervention étrangère à la biologie moléculaire, peut être résolu de façon brillante). Toutefois, des individus génétiquement non prédisposés peuvent acquérir la myopie à cause d’influences liées au seul milieu, selon la façon dont ils utilisent leurs yeux.

Le débat qui s’est ouvert sur le Programme Génome Humain, peut être considéré sous certains aspects comme une version moderne de l’affrontement entre le déterminisme et l’holisme. C'est lui qui inspire une certaine école de pensée moderne, qui ne partage pas l’approche mécaniste de la compréhension de la réalité par laquelle se caractérise la plus grande partie de la science contemporaine.

Une autre objection contre le programme de séquençage de tous les gènes humains, provient du domaine légal. Qui aura le droit de gérer cette énorme quantité d’informations ? Comment pourra-t-on protéger les individus du spectre de « Big Brother », la vision d’un gouvernement qui contrôle dans ses moindres aspects nos existences évoquée par l’écrivain George Orwell dans son livre 1984. Il nous faut réfléchir sur ce qui se passe aujourd’hui, et sur ce qui pourrait arriver demain. La médecine légale fait de plus en plus usage d'informations obtenues grâce au séquençage des gènes humains pour incriminer ou non des suspects. Mais jusqu’à quel point ces techniques sont-elles fiables, surtout si l'on considère leur poids dans des décisions concernant la possibilité de condamner à mort un individu suspect, comme cela a lieu par exemple aux États-Unis ? De la même façon, les banques de données sur l’ADN humain pourraient être utilisées par des compagnies d’assurances pour refuser l’assistance médicale à des personnes considérées « à risque », simplement parce qu’elles sont porteuses d’un allèle d’un certain gène, statistiquement lié à l’apparition d'un cancer ou à la prédisposition à une crise cardiaque. C’est là sans doute une perspective inquiétante.

 

Source: Science interactive Hachette Multimedia