Passer au contenu du forum

forum abclf

Le forum d'ABC de la langue française

Mise à jour du forum (janvier 2019)

Remise en l'état – que j'espère durable – du forum, suite aux modifications faites par l'hébergeur.

forum abclf » Internet et informatique » Usage de Google et assimilés

Pages 1

Répondre

Flux RSS du sujet

Messages [ 12 ]

1

Sujet : Usage de Google et assimilés

Il me paraît utile d'ouvrir ce fil, qui pourrait servir  rassembler des données souvent éparses que l'on trouve sous des intitulés divers.
Ce lieu pourra aussi être bienvenu par P'tit prof, qui ne rate pas une occasion de dire tout le mal qu'il pense des références électroniques.
Ainsi, tout dernièrement, il a pris prétexte d'une citation de Voltaire mal transcrite, où le mot silenciaires était écrit sileuciaires (ce qui ne modifiait en rien la pertinence de la citation), pour commenter :

Comme quoi il ne faut pas faire une confiance aveugle à ces bêtes machines.

Rien n'indique toutefois que la citation proviendrait d'une "machine", et il pourrait tout aussi bien s'agir d'une erreur de copie manuelle. La graphie sileuciaires se trouve deux fois sur Google - renvoyant à notre propre forum ABC. Elle n'obtient aucun résultat sur Gallica. Sur Google Recherche de livres, où la lecture de typographies variées et anciennes produit souvent des erreurs, on la trouve quatre fois : mais trois des références sont inatteignables, et la quatrième s'avère concerner la forme correcte. Celle-ci est par ailleurs présente 120, 9 et 216 fois sur ces trois moteurs, qui citent plusieurs fois correctement la phrase de Voltaire en question.

Question "confiance aveugle", il me semble qu'il a été indiqué un nombre considérable de fois sur ce forum comment utiliser judicieusement les données de ces moteurs, et aucun participant régulier n'est susceptible de les ignorer , sauf si c'est une ignorance volontaire.

J'espère que ce fil pourra aider à aller de l'avant dans les techniques de recherche, sans être encombré par des critiques répétitives.

2

Re : Usage de Google et assimilés

Quelqu'un sait-il s'il est possible de rechercher une suite de mots sur Gallica ? Chez Google, il suffit de les mettre entre guillemets.  Mais Gallica, qui propose pourtant sous "Recherche avancée" une case "Texte" où l'on peut activer "Expression exacte", n'offre rien de tel. Si l'on inscrit par exemple "Tous les Français", on obtient des milliers de références où ces mots figurent dans le désordre, ce qui est inutilisable.
Peut-être y a-t-il une manière de procéder qui m'est inconnue ? Merci de la communiquer, si elle existe.

3 Dernière modification par Naïf (02-07-2009 14:57:29)

Re : Usage de Google et assimilés

Ah oui, très utile ce fil. Pour Gallica, je n'ai pas de réponse. Le motif de mon message est d'indiquer le site de Jean Véronis pour ceux qui ne le connaissent pas encore:

Vous trouverez, si ma mémoire est bonne, l'explication du paradoxe dont parlait gb (Google annonçant 5558 résultats, puis 56 dès la seconde page) une comparaison systématique avec Yahoo etc. , et certains outils intéressants.

PS. J'ai oublié si la réclame d'autres sites était acceptée sur ce forum. Effacez sans vergogne si ce n'est pas le cas.

4

Re : Usage de Google et assimilés

Oui, il y a un bug dans Gallica ou quelque chose m'échappe:

Pour chercher des documents contenant une expression exacte, mettez-la entre guillemets.

http://gallica.bnf.fr/html/aide/rechercher.html

Mais cela ne marche pas.

Re : Usage de Google et assimilés

Ainsi, tout dernièrement, il a pris prétexte d'une citation de Voltaire mal transcrite, où le mot silenciaires était écrit sileuciaires (ce qui ne modifiait en rien la pertinence de la citation), pour commenter :

Cela ne modifiait en rien la pertinence de la citation, cela ne faisait que faire dire n'importe quoi à Voltaire. Mais peu importe, pouvu que la citation soit pertinente...

Que l'on ne me parle pas du doigt et de la lune : je trouve précisément que se servir d'un auteur du calibre de Voltaire pour en tirer des citations pertinentes concernant des points de grammaire, c'est regarder le doigt, et non la lune.
D'autant que lorsqu'un mot a été estropié par le lecteur optique, la raison humaine peut le corriger avant de le servir aux autres.

... ne supra crepidam  sutor iudicaret. Pline l'Ancien

6

Re : Usage de Google et assimilés

Oui, P'tit prof, amende honorable, vous avez entièrement raison sur ce point.
Mais livrez nous vous aussi vos secrets internet, ce fil est pour cela.
--
Par exemple: saviez vous qu'en écrivant

+interné

vous obtenez dans Google des résultats avec accents, donc différents de

+interne

? (sans le "+", il mélange les deux)

Allez, si vous le saviez, d'autres non assurément.

Jadis, un moteur français faisait cela par défaut, ils sont devenus vendeurs de mayonnaise...

7

Re : Usage de Google et assimilés

Ces 1531 (!) collections constituent un immense fourre-tout,

http://www.numerique.culture.fr/mpf/pub-fr/index.html

où se trouvent entre autres des textes (imprimés et manuscrits) qui ne paraissent pas être repérables par les voies ordinaires. J'ai ainsi pu y lire en mode image l'amusante Gazzette françoise (forézienne), 1605, de Marcellin Allard, numérisée à la médiathèque de Saint-Etienne. Faute de relevé systématique des écrits disponibles, il faut y aller au petit bonheur, sur des indices aléatoires. On se sent comme un explorateur d'autrefois au coeur de la jungle.

8 Dernière modification par Naïf (02-07-2009 23:26:24)

Re : Usage de Google et assimilés

Catalogue de liens bien utile (pardon s'il est déjà là)
http://clicnet.swarthmore.edu/dictionnaires.html
Comme toujours, regardez le root:
http://clicnet.swarthmore.edu/

PS. Pour vous faire patienter: j'ai bien des adresses de bases de données, encore faudra-t-il* que je remette la main dessus.

*j'ai retrouvé le trait d'union sur mon clavier, ouf.

9

Re : Usage de Google et assimilés

Ce remarquable moteur indexe les descriptifs de textes scientifiques (articles, monographies) récents et moins récents, sur des sites comme ceux de Persée, du Michigan etc.
Interface en anglais, mais très simple à manipuler:

http://www.oaister.org/

Cliquez sur SEARCH, puis sur la page qui s'affiche tapez, par exemple, "participe passé", ou "orthographe française" - sans guillemets. Puis "Envoi" ou à nouveau "Search".

Les textes ne sont pas tous accessibles sans formation (c'est la vie! les forums de vulgarisation en neurologie ou en philosophie sont parfois rudement compliqués...), mais qu'on essaye. Il se trouvera bien des bonnes âmes pour répondre aux éventuelles questions de compréhension.

Bonne moisson !

10

Re : Usage de Google et assimilés

Naïf a écrit:

Ce remarquable moteur indexe les descriptifs de textes scientifiques (articles, monographies) récents et moins récents, sur des sites comme ceux de Persée, du Michigan etc.

J'ignorais son existence. Il me paraît richissime, bien que je ne comprenne pas du tout sur quels critères ces textes sont sélectionnés (si sélection il y a).

11 Dernière modification par Naïf (03-07-2009 11:11:14)

Re : Usage de Google et assimilés

Zimon a écrit:

bien que je ne comprenne pas du tout sur quels critères ces textes sont sélectionnés (si sélection il y a).

Je pense qu'il n'y a pas de sélection, mais une base pour l'instant limitée de banque de données consultées. A partir de cette brochette de banques de données en ligne (établie sur base contractuelle), le système récupère toutes les ressources numériques:

...harvest(s) and retain(s) all records that point to digital resources. This includes freely-available and restricted-access digital resources.

Seules les banques de données inexploitables sont laissées de côté:

Those repositories containing many incorrect UTF-8 or XML records will be dropped.

Malheureusement, on tombera aussi sur des textes en accès restreint. Il faut alors soit interroger des connaissances qui ont un accès auxdites bases, soit écrire directement aux auteurs si c'est possible. En général, pour reprendre l'expression un peu malheureuse de Colline d'Or - il est vrai dans un contexte un peu polémique - , les auteurs de langue française "condescendent" (l'image d'Epinal du chercheur dans sa Tour d'ivoire est évidemment totalement fausse, mais la plupart des habitués de ce forum le savent et en usent, j'en suis sûr).

Pour les auteurs américains, c'est une autre paire de manches ; des collègues m'ont à plusieurs reprises benoîtement renvoyé au prêt entre bibliothèques pour des ouvrages absents des bibliothèques continentales: ils ne se doutaient pas combien cela coûtait de faire venir leurs travaux. Dans ce cas: aller voir leurs pages personnelles.

12

Re : Usage de Google et assimilés

Zimon a écrit:

Quelqu'un sait-il s'il est possible de rechercher une suite de mots sur Gallica ? Chez Google, il suffit de les mettre entre guillemets.  Mais Gallica, qui propose pourtant sous "Recherche avancée" une case "Texte" où l'on peut activer "Expression exacte", n'offre rien de tel. Si l'on inscrit par exemple "Tous les Français", on obtient des milliers de références où ces mots figurent dans le désordre, ce qui est inutilisable.

Bonjour Zimon,
Si vous êtes encore lecteur –je n'ai pas encore lu les sujets qui fâchent– je crois que la réponse est oui, on peut faire une recherche exacte avec Gallica, de la manière que vous l'avez faite. Mais pas avec votre exemple.
Je pense que les mots les plus courants ont été supprimés de l'index (tous, les par exemple) : de fait, « tous les Français » ne recherche que « Français » (+40000 résultats).
Mais si vous essayez avec « dormir debout » (recherche avancée, texte, expression exacte), ça marche smile

Sont aussi probablement supprimés les je, tu, il, etc., ne, pas, etc. En anglais, ce sont les « stopwords ».

Messages [ 12 ]

Pages 1

Répondre

forum abclf » Internet et informatique » Usage de Google et assimilés