La généalogie du français

<< Les familles de langues | Origines | L'indo-européen >>

(:toggle init=hide lshow='(Voir plan de la page)' lhide='(Cacher plan de la page)' set=1 div=box2:)

La plupart des introductions à l’histoire du français prennent le latin, vulgaire ou classique, comme point de départ dans leurs descriptions (ainsi Huchon 2002, Chaurand 1999). Cependant, grace au matériel attesté et à la reconstruction, nous pouvons aller beaucoup plus loin dans la généalogie.

Le français, une langue indo-européenne

La famille des langues indo-européennes se divise en dix branches dont deux sont éteintes aujourd‘hui (le tokharien et les langues anatoliennes). Le français fait partie des langues romanes, qui descendent du latin. Le latin lui-même appartient à la branche italique de l’indo-européen.
On a cru pendant longtemps que l’italique et le celtique forment ensemble une branche plus grande, l’italo-celtique. Cependant, les indices et les caractéristiques en commun des deux branches sont insuffisants pour considérer cette “super-branche” comme prouvée (Clackson et Horrocks 2007: 32sqq., Hock 2000: 134sq., Meier-Brügger 2003: 39).


La famille indo-européenne représentée sous forme d'arbre généalogique, élaborée d'après Crystal 2010: 308 et Fortson IV 2010: 10. Cliquez sur l'image pour voir la version agrandie. Addenda : Dans le groupe indo-iranien, il manque la troisième sous-branche, le nurustani.

-> On remarquera que presque toutes les langues en Europe font partie de la famille indo-européenne, sauf le hongrois, l'estonien, le finnois, le basque et quelques petites langues en Laponie et au Caucase.

La plupart des romanistes divisent la Romania, l’ensemble des langues romanes, en plusieurs sous-groupes. On trouve à l’Est le sarde, l’italien péninsulaire, le corse, le sicilien et le roumain qui forment la Romania orientale (Wüest 2003: 646), à l’Ouest les autres langues romanes, qui constituent la Romania occidentale : l’italien septentrional, le rhéto-roman, ainsi que le groupe de l’ibéro-roman (portugais et espagnol) et le groupe gallo-roman. Le gallo-roman du nord comprend les dialectes d’oïl et le français qui en est issu, le gallo-roman du sud et de l’est comprend l’occitan et le franco-provençal (Harris et Vincent 1988: 13sqq.). Le catalan est le plus souvent compté comme membre de l’ibéro-roman (ibid.: 12, Walter 1988: 59) mais du point de vue historique, il se situe au fond entre l’ibéro-roman et le gallo-roman (Rohlfs 1966 : 6).


Carte approximative des langues romanes d'un point de vue historique, sans le roumain. D’après Walter 1988: 59, Huchon 2002: 66, Duval et al. 2011: 651 et la carte de Walter Strauß(valider les liens) (université de Bochum).

On lit souvent que le français standard, dans son histoire, est simplement le dialecte de Paris ou de l’Ile de France tel qu’il s’est développé dans cette ville (Lodge 1997: 143, Harris et Vincent 1988: 14) mais cela semble erroné. Le français s’est nourri de multiples sources au cours de son histoire, parmi lesquelles le parler de l’élite de la cour royale semble avoir joué un rôle majeur (Wüest 2003: 656) ; d’ailleurs, il ne faut pas oublier qu’il existe aujourd’hui plusieurs français régionaux (Midi, Canada, Belgique, Suisse, Afrique,...) qui varient dans leurs accents, leur vocabulaire et leurs structures (cf. Walter 1988).
-> Pour résumer la généalogie (< = fait partie de) :
le français < langue d’oïl < groupe gallo-roman < langues romanes < sous-branche latino-faliscienne < branche italique < indo-européen < nostratique ?...

La méthode comparative

Comment peut-on savoir si deux langues sont en parenté l’une avec l’autre, qu’elles ont une langue-mère commune et qu’elles font pour cette raison partie de la même famille ? En ce qui concerne la famille indo-européenne, on peut nommer le célèbre discours de William Jones, président de la Asiatic Society, en 1786 comme point de départ de la grammaire comparée. Dans cette époche-là, on était fasciné par l’orient et, en particulier, par le sanscrit. Jones remarqua que plusieurs langues différentes avaient tant de points grammaticaux en commun qu’il était presque impossible de prétendre que les ressemblences étaient le fruit du hasard, et qu’il fallait donc penser que toutes ces langues avaient une langue-mère commune :

Le sanscrit, quelque soit son origine, est d’une structure merveilleuse ; plus parfait que le grec, plus copieux que le latin, et raffiné de façon plus exquise que les deux, bien qu’il porte en lui une affinité avec tous les deux, dans les racines des verbes comme dans les formes de la grammaire, qui est plus grande que le hasard probablement puisse produire ; tellement grande, ma foi, qu’aucun philologue ne pourrait examiner toutes les trois langues sans être convaincu qu’elles sont surgies d’une source commune, qui, peut-être, n’existe plus : il y a une raison semblable, quoique non pas dans le même degré, de supposer que la langue gotique et le celtique, bien que melangés avec un idiome très différent, avaient la même origine que le sanscrit ; et que le vieux persan pourrait être ajouté à la même famille, si ceci était la place pour discuter la question concernant l’origine de la Perse.

(traduit de "The third Anniversary Discourse, delivered 2 February, 1786". in Jones 1807: 34sq.)

Mais plusieurs décennies passèrent d’abord avant qu’une méthode scientifique ne soit developpée. Au Danemark et surtout en Allemagne, des philologues comme Rasmus Rask, Franz Bopp et Jakkob Grimm étaient les premiers qui comparaient les langues diverses dans la première moitié du XIXe siècle, et plus tard, August Schleicher developpait son modèle d’arbre généalogique et des caractéristiques de la proto-langue reconstruite. (cf. Fox 1995: 19sqq.). Mais comment peut-on reconstruire une proto-langue quand on n’a que l’évidence des langues-filles (c-à-d. aucun document écrit dans la langue-mère) ?

Le premier pas consiste à rassembler des correspondences de mots (ou de morphèmes) des langues qu’on pense être parentées. D’habitude, on prend les stades les plus anciens de chaque langue et des mots qu’on croit être des mots inherités. Les emprunts doivent être exclus. Un resultat possible serait par ex.:

français:pèrepiedmère
italien:padrepiedemadre
espagnol:padrepiemadre
portugais:paimãe
latin:paterpesmater
grec ancien:patérpōsméter
sanscrit:pitāpātmatár
ancien anglais:fæderfōtmōdor
turc:ataayakanne
finnois:isäjalkaäiti

Quand on a ces listes de mots, on voit par ex. que les correspondences de p- intial et de m- initial sont réguliers entre les langues romanes mais aussi quand on prend encore en compte le latin, le grec, le sanscrit et l’anglais, dans lequel p devient f. Ce sont ces regularités qui constituent la base pour l’affirmation que deux langues sont parentées. On voit aussi que les correspondences du turc et du finnois ne sont pas reguliers, voire n’ont souvent aucune ressemblence avec les mots des autres langues, ils ne semblent donc pas faire partie de la même famille des langues.
Le mot proto-indo-européen pour “père” a-t-il commencé avec f (comme en anglais) ou avec p ? Plusieurs critères sont à respecter: ainsi, il faut tenir compte du son qu’ont la majorité des langues (p) mais aussi dans quelle direction des changements phonétiques vont d’habitude : est-ce plus souvent p qui devient f ou vice-versa ? (critère appellé directionalité). En plus, il faut tenir compte du système phonologique dans son ensemble et des caractéristiques universelles des langues (Campbell 2004: 122-167, Fox 1995: 57-91). Dans le cas présenté ici, c’est un *p- (l’astérisque signifie que la forme est reconstruite) qu’on reconstruit pour le proto-indo-européen. Cela signifie aussi qu’un changement phonétique s’est produit dans l’anglais (et les autres langues germaniques) où un *p indo-européen est devenu f (cf. Walter 1988 : 33).

Les Néogrammairiens, un groupe de linguistes de la fin du XIXe siècle, qui se composait, entre autres, de August Leskien, Karl Brugmann et Hermann Osthoff, mettait en avant le fait que certaines correspondences affichent une telle régularité qu’on peut les formuler dans des lois phonétiques: p > f. Malheureusement, il y a aussi des exceptions : il existe des changements irréguliers, des changements par analogie et des emprunts qui troublent l’image. Et bien souvent, un mot est substitué par un autre ou disparait tout simplement dans une des langues, de sorte que le lexique commun à comparer des langues-filles devient de plus en plus petit à travers le temps.

Exemple : trois


Le nombre "3" (trois) dans quelques langues indo-européennes, avec comme point de départ le mot indo-européen *tréies. À droite (pour comparaison) "3" en quelques langues non-indo-européennes de l'Europe. Plus sur les nombres indo-européens dans Gvozdanović 1991.

Bibliographie

CAMPBELL, Lyle (2004), Historical Linguistics. An introduction, 2nd edition, Edinburgh: Edinburgh Univ. Press.
CHAURAND, Jacques (éd., 1999), Nouvelle histoire de la langue française, Paris: Editions du Seuil.
CLACKSON, James et HORROCKS, Geoffrey (2007), The Blackwell history of the Latin language, Malden: Blackwell.
CRYSTAL, David (2010), The Cambridge Encyclopedia of Language, 3rd edition, Cambridge: Cambridge Univ. Press.
DUVAL, Frédéric et al. (2011), Mille ans de langue française. Histoire d’une passion (t. I : Des origines au français moderne), Paris: Perrin.
FORTSON IV, Benjamin W. (2010), Indo-European Language and Culture. An Introduction, 2nd edition, Chichester: Wiley-Blackwell.
FOX, Anthony (1995), Linguistic Reconstruction. An Introduction to Theory and Method, Oxford: Oxford Univ. Press.
GVOZDANOVIĆ, Jadranka (éd., 1991), Indo-European Numerals, Berlin: de Gruyter.
HARRIS, Martin et VINCENT, Nigel (1988), The Romance Languages, London et New York: Routledge.
HOCK, Wolfgang (2000), “Balto-Slavisch, Indo-Iranisch, Italo-Keltisch. Kriterien für die Annahme von Sprachgemeinschaften in der Indogermania“, in: Range, Jochen (éd.), Aspekte baltistischer Forschung, Essen: Die blaue Eule, 119-145.
HUCHON, Mireille (2002), Histoire de la langue française, Paris: Librairie Générale Française.
JONES, William (1807), Discourses, Vol. III, Réimpression, London: Routledge, 1993 (British linguistics in the 18th century).
LODGE, R. Anthony (1997), Le français. Histoire d’un dialecte devenu langue, Paris: Fayard.
MEIER-BRÜGGER, Michael (2003), Indo-European Linguistics, Berlin et New York: Walter de Gruyter.
ROHLFS, Gerhard (1966), Einführung in das Studium der romanischen Philologie, Heidelberg: Winter.
WALTER, Henriette (1988), Le français dans tous les sens, Paris: Robert Laffont.
WÜEST, Jakob (2003), "Evolution des frontières des langues romanes: la Galloromania", in: Ernst, Gerhard et al. (éds.), Histoire linguistique de la Romania / Romanische Sprachgeschichte, t. 1, Berlin et New York: de Gruyter, 646-657.