En effet, ce n'est pas simple : selon la définition de départ on a plus ou moins de graphèmes. Et ce chiffre absolu, déjà difficile à obtenir, ne rend sûrement pas compte de la réalité puisqu'il faut faire intervenir la fréquence : il y a en a qui sont rares.
Il y a un excellent article - parmi d'autres sans doute - de Nina Catach, qui était l'une des plus grandes autorités en matière d'orthographe (comment on écrit les mots) dans le numéro spécial de Langue française, consacré à l'orthographe (20, décembre 1973, pp. 30-44) malheureusement difficile à résumer. Mais vous pouvez lire ce qu'écrit Catach sans crainte de perdre votre temps.
Parmi les remarques intéressantes qu'elle fait, elle écrit :
Catach a écrit:Peu de lettres en français sont en effet biunivoques, c'est-à-dire répondent au principe posé comme idéal pour l'écriture par la Grammaire de Port-Royal : un son, une lettre, une lettre, un son.
Seules, en fait, deux d'entre elles, j et v, sont absolument dans ce cas, et ce n'est pas un hasard : il s'ait de deux graphèmes «modernes», puisqu'ils sont entrés dans notre alphabet il y a moins de deux siècles, et n'ont pas subi les avatars qui ont dévoyé ou sclérosé les autres.»
Elle cite encore, dans la biblio., un article sûrement intéressant de Vl. Horejsi, Les graphonèmes français et leurs parties composantes, Etudes de linguistique appliquée, 8, 10-12/1972 (orthographe et système d'écriture), pp.10-17. : l'auteur tente «de relever toutes les positions que peuvent prendre en français les lettres pour un même son, et toutes les correspondances phoniques que l'on peut avoir pour un même groupe de lettres. Il arrive ainsi à un nombre impressionnant de graphonèmes, c'est-à-dire de correspondances différentes entre les sons et les graphies et les graphies et les sons».
Catach tempère et ajoute que «tout, dans cette affaire, est une question de proportion.»
Dans la suite de son article, elle élimine les graphèmes théoriques et se concentre sur les graphèmes fondamentaux qu'elle nomme «archigraphèmes». Elle se livre alors à une recherche statistique en utilisant des textes : 3800 mots pour 14000 graphèmes (suivant le système phonologique standard de 36 phonèmes (16 voyelles dont 12 orales et 4 nasales, 17 consonnes et 3 semi-voyelles) décrit dans la Prononciation française, P. Léon, Paris, Didier, 1969.)
Bref,
Catach a écrit:Les graphèmes qui nous semblent véritablement nécessaires et suffisants à la seule compréhension de la seconde articulation du langage se réduisent ainsi à 32 ou 33 signes, c'est-à-dire moins que nous ne comptons de phonèmes.
Voici la liste des archigraphèmes reconnus (grosso modo pour la mise en page):
A E I O U EU OU
AN IN ON UN
ILL Y
OI OIN
P-B T-D C-G F-V S-Z X CH-J L-R M-N GN
Et, je termine ma copie, voici le rendement de ces graphèmes vocaliques de base (il faut imaginer qu'il y a l'alphabet phonétique en face :
A couvre 92% des transcriptions du phonème [A]
E 78% [e]
I 98% [i]
O 75% [o]
U 100% [y]
EU 93% [œ]
OU 98% [u]
ON 93% [signe pour on]
UN 97% [signe pour un]
OI 100% [wa]
OIN 100% [w +signe oin]
Enfin, c'est toujours intéressant : elle ajoute «Alors que nos 33 archigraphèmes suffisent à lire 80 à 90% des phonèmes du français, quelque 130 allographes se partagent les 10 à 20% restants, et l'on pourrait aisément doubler ce chiffre en y incluant par exemple les noms propres et les graphèmes d'emprunt. C'est donc bien ce que l'on peut appeler une zone marginale».
Suit ensuite un très intéressant tableau qui vous intéresserait. Je vais tâcher de le copier quelque part, plus tard, mais voici le résumé (je ne cite que les totaux) :
archigraphèmes : 33
graphèmes de base : ±45
graphèmes principaux : ±70
sous-graphèmes : ±63
graphèmes+sous-graphèmes : ±133
gb.
ps : pour recevoir automatiquement les réponses, «abonnez-vous» au sujet