16 May 2022

Origines des langues et familles linguistiques

Sommaire

Add a header to begin generating the table of contents

S’il y a bien une question qui a autant agité les linguistes que les ethnologues, les sociologues que les archéologues ou même les théologiens, c’est celle de l’origine des langues. Posée depuis des siècles par des penseurs de tous bords, elle a toujours été à l’origine de débats animés et de questions complexes. Fortement liée à l’Histoire de l’humanité, cette problématique de l’origine des langues sous-tend aussi de nombreuses discussions sur l’origine des populations, des cultures, des religions et, plus largement encore, des modes de pensées que l’on rencontre de par le monde. La complexité du débat est telle que la Société de Linguistique de Paris a décrété au XIXe siècle qu’elle ne recevrait “aucune communication concernant […] l’origine du langage”. Il faudra attendre 1975 pour que la question soit relancée, à New York cette fois, par son Académie des Sciences. Depuis, les méthodes d’analyse se sont homogénéisées et se sont faites plus précises, les études se sont multipliées et les données se sont accumulées ; la recherche a donc effectivement progressé, mais la question ultime reste, elle, bien loin d’être tranchée ! Nous vous proposons aujourd’hui de mettre un pied dans l’univers de la linguistique pour mieux cerner les enjeux des origines des langues, les théories les plus couramment avancées et l’implication de ces connaissances dans le monde de la traduction.

Quelles sont les principales théories concernant l’origine des langues ?

Si la question des origines des langues a passionné de nombreux scientifiques et érudits en tout genre au travers des siècles, la majorité des études et résultats produits peuvent être rattachés à deux hypothèses distinctes : le monogénétisme ou le polygénisme des langues. Avoir une idée générale de ce que ces deux théories proposent est essentiel pour mettre un pied averti dans le monde des langues et leurs origines.

Une origine unique : la théorie du monogénétisme

La première théorie linguistique que nous abordons ici est celle dite de la monogenèse des langues, c’est-à-dire celle d’une origine commune, et donc unique, à toutes les langues et dialectes qui ont existé ou existent à l’heure actuelle. Cette proposition est l’une des plus anciennes théories linguistiques que l’on connaisse, on la défend dès le Moyen-Âge et certains scientifiques en sont encore partisans à l’heure actuelle, moyennant bien entendu quelques changements et adaptations. Force est de constater en effet que là où l’idée d’une langue originelle commune à tous les humains est facilement acceptée et très largement répandue, sa forme, sa propre genèse et les mécanismes de son évolution ont, quant à eux, bien du mal à faire consensus. L’une des principales raisons à cela est le contexte culturel et religieux dans lequel les théories sont échafaudées ; les érudits occidentaux du Moyen-Âge étaient pour leur part convaincus que l’hébreu était la première et unique langue jusqu’à l’épisode de la Tour de Babel et la confusion des langues qui s’en suivit. Dans le même temps, les scientifiques arabes pensaient, eux, que c’était la langue arabe qui avait existé en premier et que toutes les autres langues trouvaient leurs racines dans ce dialecte ; d’autres encore ont proposé que le latin ou le grec soient ces fameuses premières langues. En d’autres termes, chacun voit midi à sa porte et les preuves scientifiques démontrant que telle ou telle langue pourrait être la première manquent cruellement. Néanmoins, l’absence de preuve n’étant pas preuve d’absence, la théorie de la monogenèse des langues n’a jamais été enterrée et a fait l’objet de recherches scientifiques, au sens contemporain du terme, dès le XIXe siècle, puis, plus tard, en parallèle des premières recherches menées en génétique des populations. Le lien entre ces deux domaines scientifiques est fort et s’appuie sur le principe suivant : si l’on peut retracer et dater les déplacements de populations grâce à la génétique, et que l’on considère que les langues se déplacent avec leurs locuteurs, alors on devrait pouvoir remonter jusqu’à une origine commune, de proche en proche. La théorie est la même que pour rechercher l’ancêtre commun de tous les êtres humains. L’un des principaux défenseurs de cette théorie est l’anthropologue Merritt Ruhlen. Dans sa publication de 1994, The Origin of Language. Tracing the Evolution of the Mother Tongue, New York, John Wiley & Sons (traduit en 1997), il explique que 27 formes orthographiques se retrouvent, même de manière parfois assez différente, dans toutes les langues ou presque, ce qui plaiderait en faveur d’une langue mère commune. La communauté scientifique n’est pas fondamentalement convaincue par les hypothèses de Ruhlen, principalement car il est impossible de démontrer que les ressemblances relevées sont effectivement dues à des liens de parenté et pas au hasard. Par ailleurs, un nouveau courant de recherche émerge qui propose une approche pluridisciplinaire du problème, alliant les forces de la linguistique, de la génétique et de l’archéologie, ces travaux sont principalement menés par Cavalli-Sforza en 2001 et Renfrew en 1987. Ce dernier parle de cette approche comme celle de la “nouvelle synthèse” et entend utiliser les méthodes de ces trois disciplines scientifiques pour venir à bout de l’éternel problème des langues. Toutefois, et bien que la théorie soit plutôt engageante, il demeure que les données obtenues sont difficiles à corréler avec certitude, un point soulevé plus tard par Renfrew lui-même dans la revue Current Biology¹ en 2010 et résumé clairement, au moins en partie, par la formule de l’archéologue René Treuil² “les pots ne parlent pas”. En l’état actuel des connaissances, la monogenèse des langues demeure un mystère scientifique : il est possible qu’une langue mère (ou protolangue) ait effectivement existé mais c’est impossible de le démontrer.

Des origines multiples : la théorie du polygénisme

La seconde théorie est celle du polygénisme des langues, celle qui envisage que les milliers de langues existantes aujourd’hui trouvent leurs origines dans différentes proto-langues, différentes langues mères, qui auraient évolué de multiples façons pour donner les langages que nous connaissons. Claude Hagège, qui a occupé la chaire de Théorie Linguistique du Collège de France de 1986 à 2006 considère, quant à lui, “qu’il est très probable que l’immense diversité des idiomes aujourd’hui attestés ne se ramène pas à une langue originelle unique pour toute l’humanité”³. Cette hypothèse est assez couramment acceptée de nos jours, notamment car elle correspond mieux à la théorie néo-darwinienne de l’évolution que son pendant monogénétique, mais elle est, elle aussi, difficile à prouver. Toutefois, considérer que les milliers de langues qui existent aujourd’hui ne partagent pas une seule et même origine linguistique n’empêche pas de constater qu’il existe effectivement des liens entre certaines langues, ce que sous-tend l’approche généalogique.

³ Hagège C.,1987, L’homme de paroles. Contribution linguistique aux sciences humaines, Paris, Gallimard, coll. Folio Essais 49

Qu’est-ce que l’approche généalogique en linguistique ?

Inspirée des modèles de parenté biologique, l’approche généalogique ou génétique propose de considérer l’existence de familles de langues au sein desquelles des liens de parenté existent entre les différents dialectes qui la constituent. Défendue notamment par F. Bopp dès le XIXe siècle, cette approche propose de voir les langues comme des êtres vivants, qui naissent, vivent et meurent et créent des liens de parenté, que l’on peut ensuite classer en familles de langues. On trouve ainsi des langues mères, des langues cousines, des langues sœurs, etc. L’évolution des dialectes se fait de génération en génération à partir d’une langue commune plus ancienne, la langue dite mère, dont les évolutions se transmettent à des millions de locuteurs et ainsi de suite. On établit les liens de parenté entre les langues grâce à la recherche par comparaison de ressemblances de formes ou de sens de différents mots ou, plus largement, de morphèmes. Grâce à ces recherches, on reconstitue une proto-langue commune aux langues en question. Une attention toute particulière est accordée aux questions des emprunts linguistiques et des ressemblances fortuites, c’est-à-dire que l’on s’assure, avant d’établir fermement un lien de parenté entre des langues, que leurs similarités sont réellement des points communs et pas simplement des mots empruntés à d’autres langues ou de vagues correspondances dues au hasard. Par exemple, le verbe “aimer” en français se dit “amare” en italien et “aimar” en occitan : les racines communes de ces trois langues transparaissent ici de façon assez claire. A l’inverse, un bon exemple d’emprunt linguistique est le mot “bonsaï”, utilisé couramment en français alors que c’est un mot issu du japonais, une langue qui n’est pas apparentée aux langues romanes dont fait partie le français. Si la majorité des langues connues, vivantes et mortes, peut être classée de cette manière, certaines exceptions existent, par exemple lorsque deux langues sont très proches et qu’il est difficile d’établir une distinction claire, ou encore lorsque l’on arrête soudainement de parler une langue pour la remplacer par une langue dominante, typiquement dans un cadre colonial, et que se crée ainsi une nouvelle langue qui mélange des aspects des deux idiomes en jeu. Cette approche génétique, bien qu’ayant ses limites, demeure essentielle en linguistique historique et a en plus le mérite de proposer un support de réflexion et d’étude clair et accessible, l’arbre généalogique linguistique.

Quelles sont les principales familles de langues ?

Compte tenu de l’immense diversité des langues ayant existé et existant encore aujourd’hui, nous ne présenterons ici que les principales familles de langues, c’est-à-dire les plus larges ensembles acceptés par les scientifiques à l’heure actuelle. Chaque famille comprend également des branches, elles-mêmes sous-divisées lorsque cela est pertinent.

Les langues indo-européennes

Commençons par l’une des familles les mieux connues à la fois des spécialistes et du grand public : la famille des langues indo-européennes.
Cette famille est particulièrement bien connue car la très grande majorité des humains parlent aujourd’hui une langue appartenant à la famille indo-européenne et que, par ailleurs, sa découverte est assez ancienne.
La famille de langues indo-européennes comprend notamment les branches suivantes :

langues germaniques : allemand, anglais, langues scandinaves…
langues celtiques : breton, gallois, gaélique
langues romanes : français, espagnol, occitan, italien, portugais, roumain…
langues indo-iraniennes : persan, kurde, langues de l’Inde, tzigane…
langues slaves : russe, polonais, tchèque, macédonien, bulgare…
langues baltes : letton, lithuanien

A ces branches s’ajoutent des langues qui forment un courant particulier à elles seules, par exemple le grec ou encore l’arménien, et un certain nombre de langues mortes, plus ou moins bien connues comme le hittite, le mycénien ou certaines langues indiennes.
Les langues indo-européennes et la question sous-jacente d’un “peuple indo-européen” sont aussi connues pour alimenter régulièrement des débats historico-politiques, débats qu’il convient d’aborder avec un esprit critique et de préférence conscient de la réalité des données dont nous disposons.

Les langues afro-asiatiques ou chamito-sémitiques

La famille des langues afro-asiatiques, aussi appelées langues chamito-sémitiques, comprend actuellement plus de 300 langues distinctes, parlées principalement dans le Nord et la Corne de l’Afrique, dans le Sahara et dans une partie du Sahel. On les retrouve également au Moyen-Orient et à Malte. Cette famille linguistique comprend notamment les langues berbères, couchitiques, sémitiques (dont l’arabe et l’hébreu), tchadiques et quelques langues mortes dont l’égyptien ancien et l’akkadien.

Les langues austroasiatiques

Les langues austroasiatiques sont principalement parlées dans l’est de l’Inde et en Asie du Sud-Est. Cette famille linguistique inclut entre autres les langues môn-khmer, dont le khmer, parlé au Viêt Nam, en Thaïlande et au Cambodge, les langues munda ou encore les langues nicobar.

Les langues austroasiatiques

On trouve des locuteurs de langues austronésiennes principalement aux alentours de l’Océanie, à Madagascar, Taïwan et dans les îles Andaman. Cette famille de langues se répartit en deux branches distinctes, les langues formosanes et les langues malayo-polynésiennes. Leur origine pourrait se trouver tout au sud de la Chine, aux alentours de Taïwan.

Les langues dravidiennes

La famille de langues dravidiennes est assez circonscrite d’un point de vue géographique puisque l’on trouve principalement ces langues sur le sous-continent indien. Les plus largement parlées sont le tamoul et le télougou, ainsi que, dans une moindre mesure, le malayalam et le kannada.

Les langues eskimo-aléoutes

Le berceau des langues eskimo-aléoutes (ou langues inuites-aléoutes) se trouve dans le grand nord américain, en Alaska, au Groenland, dans l’Arctique canadien et l’Extrême-Orient de la Russie. On distingue au sein de cette famille deux branches que sont les langues eskimo, qui comprennent les langues inuites et yupik, et les langues aléoutes.

Les langues hmong-mien

Relativement petite comparée à d’autres, cette famille linguistique comprend des langues parlées en Chine, principalement dans les régions montagneuses, au Laos, en Birmanie et au Viêt Nam. On distingue d’un côté les langues hmong et, de l’autre, les langues mien. Cette famille est aussi appelée miao-yao, un terme issu de l’appellation des langues en question en chinois.

Les langues japoniques

Les langues japoniques sont parlées au Japon et comprennent le japonais (et tous ses dialectes régionaux) et les langues ryūkyū, qui sont parlées sur les îles Ryūkyū (le chapelet d’îles entre le Japon et Taïwan). Toutefois, certains linguistiques se passent de la distinction entre japonais et langues ryūkyū, considérant que ces dernières sont des dialectes du japonais.

Les langues mongoles

La famille des langues mongoles (parfois aussi appelée “famille des langues mongoliques”) se trouve en Asie du Nord et en Asie Centrale, soit en Mongolie, en Russie, en Chine et en Afghanistan. Cette famille inclut le mongol, parlé en Mongolie, le moghol, parlé en Afghanistan, l’oïrate, parlé en Chine, le kalmouk, parlé en Russie…

Les langues nilo-sahariennes

Les langues nilo-sahariennes sont parlées sur le continent africain, principalement dans les régions du Haut-Nil et du Haut-Chari, où se trouve la Nubie. La famille des langues nilo-sahariennes est, à l’heure actuelle, toujours controversée, notamment car elle regroupe un ensemble de langues très hétérogène et qu’il semble particulièrement délicat de proposer une classification interne satisfaisante. D’ailleurs, les linguistes à avoir travaillé sur la question sont peu nombreux et le débat est toujours vif.

Les langues nigéro-congolaises

Le groupe de langues nigéro-congolaises est le plus représenté en Afrique, tant en termes de répartition géographique que de nombre de locuteurs. On lui reconnaît une quinzaine de branches distinctes, ce qui en fait une famille linguistique particulièrement diversifiée.

Les langues ouraliennes

Les langues dites ouraliennes sont parlées en Europe comme en Sibérie, principalement en Hongrie, Estonie, Finlande, Russie et Lettonie. On distingue nettement deux branches au sein de ce groupe, les langues finno-ougriennes, dont le hongrois, l’estonien et le finnois, ainsi que plusieurs langues anciennes et, de l’autre côté, les langues samoyèdes, nettement plus rares. La classification interne à ces deux branches est, elle, moins nette et toujours sujette à débat.

Les langues sino-tibétaines

La famille des langues sino-tibétaines regroupe en son sein trois branches : les langues chinoises, les langues tibéto-birmanes et les langues birmano-qianguiques, qui sont parlées en Asie de l’Est et dans la péninsule indochinoise. Le classement interne de ces différentes branches est, comme souvent, encore sujet à controverses, et certains chercheurs proposent même de regrouper cette famille sino-tibétaine et celle des langues austronésiennes, effectivement parlées à proximité. L’hypothèse de réels points communs entre ces deux groupes reste cependant à prouver.

Les langues taï-kadaï

Les langues taï-kadaï (ou tai-kadai) sont une centaine, parlées en Thaïlande, au Laos, au Cambodge, au Viêt Nam, en Chine, en Inde et en Birmanie. Longtemps rapprochées des langues sino-tibétaines, les langues taï-kadaï semblent en réalité former un groupe linguistique bien distinct, qui partage un certain nombre de points communs et dont les ressemblances avec les langues du groupe sino-tibétain seraient plutôt dues à des emprunts.

Les langues toungouses

On trouve les langues toungouses en Asie du Nord et de l’Est, principalement en Russie, en Chine et en Mongolie. On distingue habituellement les langues toungouses septentrionales des langues toungouses méridionales, mais toutes sont parlées par des peuples toungouses.

Les langues turques

Les langues turques, que l’on appelle aussi “langues turciques” pour éviter les confusions avec la langue turque, sont parlées sur une aire géographique assez étendue, de Chypre à la Sibérie, en passant par la Chine et l’Europe de l’Est. Ce groupe comprend une trentaine de langues, classées en 6 branches au sein desquelles se retrouvent le turkmène, le tatar, l’ouzbek, le ouïghour…

Un système de classification amené à changer

Si les recherches en linguistique semblent aujourd’hui plutôt bien avancées et le classement généalogique des langues relativement clair, il est important de souligner que la question est encore largement ouverte. Les lignes de l’arbre généalogique linguistique ne cessent de bouger, au gré des études, analyses et découvertes, d’autant plus que les langues sont loin d’être un sujet d’étude fixe ! Comme leurs locuteurs en effet, elles naissent, évoluent, se mélangent, s’oublient, se retrouvent, disparaissent aussi parfois… Les grands changements de l’Histoire, comme les guerres, les conquêtes, la colonisation, les migrations ou même la mondialisation ont un effet direct sur les langues, ce qui rend le champ de la linguistique particulièrement dynamique. Par exemple, on estime à l’heure actuelle le nombre de langues parlées à travers le monde aux alentours de 7000, un chiffre déjà important, mais qui n’est rien face à la diversité linguistique que la Terre a un jour connue ! Différentes causes, en particulier, dans l’histoire récente, la colonisation et la mondialisation, ont fait disparaître un bon nombre de langues régionales et même de langues nationales, appauvrissant se faisant la diversité linguistique.

Généalogie des langues et traduction : quelles implications ?

Au-delà de l’intérêt scientifique que représente la linguistique et en particulier la question des liens de parenté entre les langues, qu’elles soient vivantes ou mortes, orales ou écrites, ces études ont aussi des implications en traduction. Elles ont par exemple permis de mieux cerner le fonctionnement des langues, en particulier des points de vue de leur grammaire, syntaxe et vocabulaire ce qui, in fine, permet de construire des méthodes d’apprentissage plus précises, qui facilitent l’assimilation et, de fait, la traduction. Ces études soulignent aussi l’importance de faire appel à un traducteur natif pour effectuer des traductions de qualité tant les disparités sont nombreuses et cruciales d’un groupe linguistique à un autre. Enfin, rappelons qu’étudier une langue revient à étudier la culture dont elle est issue, et qu’une bonne connaissance de cet aspect contextuel est essentiel à la réalisation de travaux de traduction.

Pour aller plus loin : Un colloque sur les origines du langage et les origines des langues La leçon inaugurale de linguistique générale de Luigi Rizzi au Collège de France Une conférence de Charles Brasart sur la construction des langues

¹ Renfrew C., 2010, “Archaeogenetics – Towards a “New Synthesis” ?”, in Current Biology, Volume 20, Issue 4, pp. 162-165 ² Treuil R., 2011, 2. – L’origine des langues, in L’archéologie cognitive [en ligne], Paris, Editions de la Maison des sciences de l’Homme, pp. 105-113 ³ Hagège C.,1987, L’homme de paroles. Contribution linguistique aux sciences humaines, Paris, Gallimard, coll. Folio Essais 49

Retour en haut

Partager sur :

Articles associés