Quelles sont les principales théories concernant l’origine des langues ?
Si la question des origines des langues a passionné de nombreux scientifiques et érudits en tout genre au travers des siècles, la majorité des études et résultats produits peuvent être rattachés à deux hypothèses distinctes : le monogénétisme ou le polygénisme des langues. Avoir une idée générale de ce que ces deux théories proposent est essentiel pour mettre un pied averti dans le monde des langues et leurs origines.Une origine unique : la théorie du monogénétisme
La première théorie linguistique que nous abordons ici est celle dite de la monogenèse des langues, c’est-à-dire celle d’une origine commune, et donc unique, à toutes les langues et dialectes qui ont existé ou existent à l’heure actuelle. Cette proposition est l’une des plus anciennes théories linguistiques que l’on connaisse, on la défend dès le Moyen-Âge et certains scientifiques en sont encore partisans à l’heure actuelle, moyennant bien entendu quelques changements et adaptations. Force est de constater en effet que là où l’idée d’une langue originelle commune à tous les humains est facilement acceptée et très largement répandue, sa forme, sa propre genèse et les mécanismes de son évolution ont, quant à eux, bien du mal à faire consensus. L’une des principales raisons à cela est le contexte culturel et religieux dans lequel les théories sont échafaudées ; les érudits occidentaux du Moyen-Âge étaient pour leur part convaincus que l’hébreu était la première et unique langue jusqu’à l’épisode de la Tour de Babel et la confusion des langues qui s’en suivit. Dans le même temps, les scientifiques arabes pensaient, eux, que c’était la langue arabe qui avait existé en premier et que toutes les autres langues trouvaient leurs racines dans ce dialecte ; d’autres encore ont proposé que le latin ou le grec soient ces fameuses premières langues. En d’autres termes, chacun voit midi à sa porte et les preuves scientifiques démontrant que telle ou telle langue pourrait être la première manquent cruellement. Néanmoins, l’absence de preuve n’étant pas preuve d’absence, la théorie de la monogenèse des langues n’a jamais été enterrée et a fait l’objet de recherches scientifiques, au sens contemporain du terme, dès le XIXe siècle, puis, plus tard, en parallèle des premières recherches menées en génétique des populations. Le lien entre ces deux domaines scientifiques est fort et s’appuie sur le principe suivant : si l’on peut retracer et dater les déplacements de populations grâce à la génétique, et que l’on considère que les langues se déplacent avec leurs locuteurs, alors on devrait pouvoir remonter jusqu’à une origine commune, de proche en proche. La théorie est la même que pour rechercher l’ancêtre commun de tous les êtres humains. L’un des principaux défenseurs de cette théorie est l’anthropologue Merritt Ruhlen. Dans sa publication de 1994, The Origin of Language. Tracing the Evolution of the Mother Tongue, New York, John Wiley & Sons (traduit en 1997), il explique que 27 formes orthographiques se retrouvent, même de manière parfois assez différente, dans toutes les langues ou presque, ce qui plaiderait en faveur d’une langue mère commune. La communauté scientifique n’est pas fondamentalement convaincue par les hypothèses de Ruhlen, principalement car il est impossible de démontrer que les ressemblances relevées sont effectivement dues à des liens de parenté et pas au hasard. Par ailleurs, un nouveau courant de recherche émerge qui propose une approche pluridisciplinaire du problème, alliant les forces de la linguistique, de la génétique et de l’archéologie, ces travaux sont principalement menés par Cavalli-Sforza en 2001 et Renfrew en 1987. Ce dernier parle de cette approche comme celle de la “nouvelle synthèse” et entend utiliser les méthodes de ces trois disciplines scientifiques pour venir à bout de l’éternel problème des langues. Toutefois, et bien que la théorie soit plutôt engageante, il demeure que les données obtenues sont difficiles à corréler avec certitude, un point soulevé plus tard par Renfrew lui-même dans la revue Current Biology¹ en 2010 et résumé clairement, au moins en partie, par la formule de l’archéologue René Treuil² “les pots ne parlent pas”. En l’état actuel des connaissances, la monogenèse des langues demeure un mystère scientifique : il est possible qu’une langue mère (ou protolangue) ait effectivement existé mais c’est impossible de le démontrer.Des origines multiples : la théorie du polygénisme
La seconde théorie est celle du polygénisme des langues, celle qui envisage que les milliers de langues existantes aujourd’hui trouvent leurs origines dans différentes proto-langues, différentes langues mères, qui auraient évolué de multiples façons pour donner les langages que nous connaissons. Claude Hagège, qui a occupé la chaire de Théorie Linguistique du Collège de France de 1986 à 2006 considère, quant à lui, “qu’il est très probable que l’immense diversité des idiomes aujourd’hui attestés ne se ramène pas à une langue originelle unique pour toute l’humanit锳. Cette hypothèse est assez couramment acceptée de nos jours, notamment car elle correspond mieux à la théorie néo-darwinienne de l’évolution que son pendant monogénétique, mais elle est, elle aussi, difficile à prouver. Toutefois, considérer que les milliers de langues qui existent aujourd’hui ne partagent pas une seule et même origine linguistique n’empêche pas de constater qu’il existe effectivement des liens entre certaines langues, ce que sous-tend l’approche généalogique.Qu’est-ce que l’approche généalogique en linguistique ?
Inspirée des modèles de parenté biologique, l’approche généalogique ou génétique propose de considérer l’existence de familles de langues au sein desquelles des liens de parenté existent entre les différents dialectes qui la constituent. Défendue notamment par F. Bopp dès le XIXe siècle, cette approche propose de voir les langues comme des êtres vivants, qui naissent, vivent et meurent et créent des liens de parenté, que l’on peut ensuite classer en familles de langues. On trouve ainsi des langues mères, des langues cousines, des langues sœurs, etc. L’évolution des dialectes se fait de génération en génération à partir d’une langue commune plus ancienne, la langue dite mère, dont les évolutions se transmettent à des millions de locuteurs et ainsi de suite. On établit les liens de parenté entre les langues grâce à la recherche par comparaison de ressemblances de formes ou de sens de différents mots ou, plus largement, de morphèmes. Grâce à ces recherches, on reconstitue une proto-langue commune aux langues en question. Une attention toute particulière est accordée aux questions des emprunts linguistiques et des ressemblances fortuites, c’est-à-dire que l’on s’assure, avant d’établir fermement un lien de parenté entre des langues, que leurs similarités sont réellement des points communs et pas simplement des mots empruntés à d’autres langues ou de vagues correspondances dues au hasard. Par exemple, le verbe “aimer” en français se dit “amare” en italien et “aimar” en occitan : les racines communes de ces trois langues transparaissent ici de façon assez claire. A l’inverse, un bon exemple d’emprunt linguistique est le mot “bonsaï”, utilisé couramment en français alors que c’est un mot issu du japonais, une langue qui n’est pas apparentée aux langues romanes dont fait partie le français. Si la majorité des langues connues, vivantes et mortes, peut être classée de cette manière, certaines exceptions existent, par exemple lorsque deux langues sont très proches et qu’il est difficile d’établir une distinction claire, ou encore lorsque l’on arrête soudainement de parler une langue pour la remplacer par une langue dominante, typiquement dans un cadre colonial, et que se crée ainsi une nouvelle langue qui mélange des aspects des deux idiomes en jeu. Cette approche génétique, bien qu’ayant ses limites, demeure essentielle en linguistique historique et a en plus le mérite de proposer un support de réflexion et d’étude clair et accessible, l’arbre généalogique linguistique.Quelles sont les principales familles de langues ?
Compte tenu de l’immense diversité des langues ayant existé et existant encore aujourd’hui, nous ne présenterons ici que les principales familles de langues, c’est-à-dire les plus larges ensembles acceptés par les scientifiques à l’heure actuelle. Chaque famille comprend également des branches, elles-mêmes sous-divisées lorsque cela est pertinent.Les langues indo-européennes
Commençons par l’une des familles les mieux connues à la fois des spécialistes et du grand public : la famille des langues indo-européennes.
Cette famille est particulièrement bien connue car la très grande majorité des humains parlent aujourd’hui une langue appartenant à la famille indo-européenne et que, par ailleurs, sa découverte est assez ancienne.
La famille de langues indo-européennes comprend notamment les branches suivantes :
- langues germaniques : allemand, anglais, langues scandinaves…
- langues celtiques : breton, gallois, gaélique
- langues romanes : français, espagnol, occitan, italien, portugais, roumain…
- langues indo-iraniennes : persan, kurde, langues de l’Inde, tzigane…
- langues slaves : russe, polonais, tchèque, macédonien, bulgare…
- langues baltes : letton, lithuanien
A ces branches s’ajoutent des langues qui forment un courant particulier à elles seules, par exemple le grec ou encore l’arménien, et un certain nombre de langues mortes, plus ou moins bien connues comme le hittite, le mycénien ou certaines langues indiennes.
Les langues indo-européennes et la question sous-jacente d’un “peuple indo-européen” sont aussi connues pour alimenter régulièrement des débats historico-politiques, débats qu’il convient d’aborder avec un esprit critique et de préférence conscient de la réalité des données dont nous disposons.