Passer au contenu du forum

forum abclf

Le forum d'ABC de la langue française

forum abclf

Mise à jour du forum (janvier 2019)

Remise en l'état – que j'espère durable – du forum, suite aux modifications faites par l'hébergeur.

forum abclf » Internet et informatique » Fréquence d'un mot ou d'une séquence de mots (google ngrams)

Pages 1

Répondre

Flux RSS du sujet

Messages [ 6 ]

1

Sujet : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

Un nouvel outil de Google permet de faire des courbes de fréquence intéressantes sur les mots ou les séquences de mots à travers les deux derniers siècles de livres numérisés.
Des explications sont données sur le blog de Jean Véronis.
À titre d'illustration, voici la courbe obtenue pour la séquence "malgré que".
Il est assez curieux de constater le creux de popularité de cette expression dans les années 1860, suivi d'un sommet vers les années 1930, suivi d'une régression constante à ce jour, probablement due aux impitoyables mises en garde régulièrement lancées contre l'expression.

Re : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

Merci DB, c'est tout à fait passionnant ! je viens de chercher par contre puis en revanche, le résultat est très amusant. Je ne saisis pas à quoi correspondent les pourcentages indiqués, mais c'est probablement écrit quelque part. Voilà un bel outil pour l'histoire de la langue. Et dire qu'il y a encore des gens pour considérer Gooogle comme un outil d'abrutissement !

3 Dernière modification par gb (29-12-2010 02:18:05)

Re : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

C'est amusant, précieux et bienvenu. De quoi s'amuser. Merci.
L'idéal serait que les corpus soient filtrables, et mieux établis (« con » donne de gros résultats issus de textes espagnols, « bite » de textes angophones — d'après les liens en bas de page) mais c'est déjà bien intéressant, et facile à utiliser, si on se limite.

boche,pinard
pognon,fric,artiche,grisbi
merde

4

Re : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

Je remarque en passant que les traits d'union sont traités comme indiquant une césure de mot ; et que pour trouver « jean-foutre », il faut demander « jeanfoutre ».

5

Re : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

gb a écrit:

Je remarque en passant que les traits d'union sont traités comme indiquant une césure de mot ; et que pour trouver « jean-foutre », il faut demander « jeanfoutre ».

Ce qui m'explique pourquoi hier je n'ai pas pu sortir la comparaison entre deci delà et de-ci de-là que je voulais faire. Merci de cette observation.

6

Re : Fréquence d'un mot ou d'une séquence de mots (google ngrams)

Et aussi, il faut plutôt chercher « mœurs » que « moeurs »
http://ngrams.googlelabs.com/graph?cont … moothing=6 ;
et plutôt « cœur » que « coeur »
http://ngrams.googlelabs.com/graph?cont … moothing=6


chercher « le cœur bien accroché » et non « le coeur bien accroché ».

Messages [ 6 ]

Pages 1

Répondre

forum abclf » Internet et informatique » Fréquence d'un mot ou d'une séquence de mots (google ngrams)