Passer au contenu du forum

forum abclf

Le forum d'ABC de la langue française

Mise à jour du forum (janvier 2019)

Remise en l'état – que j'espère durable – du forum, suite aux modifications faites par l'hébergeur.

Répondre

Répondre

Rédigez et envoyez votre nouvelle réponse

Vous pouvez utiliser : BBCode Images Binettes

Tous le champs doivent être remplis avant d’envoyer ce formulaire, ou alors vous avez utilisé la fonction copier/coller qui n'est pas supportée par l'éditer de texte.

Information obligatoire pour les invités


Information obligatoire

Revue du sujet (plus récents en tête)

12

Zimon a écrit:

Quelqu'un sait-il s'il est possible de rechercher une suite de mots sur Gallica ? Chez Google, il suffit de les mettre entre guillemets.  Mais Gallica, qui propose pourtant sous "Recherche avancée" une case "Texte" où l'on peut activer "Expression exacte", n'offre rien de tel. Si l'on inscrit par exemple "Tous les Français", on obtient des milliers de références où ces mots figurent dans le désordre, ce qui est inutilisable.

Bonjour Zimon,
Si vous êtes encore lecteur –je n'ai pas encore lu les sujets qui fâchent– je crois que la réponse est oui, on peut faire une recherche exacte avec Gallica, de la manière que vous l'avez faite. Mais pas avec votre exemple.
Je pense que les mots les plus courants ont été supprimés de l'index (tous, les par exemple) : de fait, « tous les Français » ne recherche que « Français » (+40000 résultats).
Mais si vous essayez avec « dormir debout » (recherche avancée, texte, expression exacte), ça marche smile

Sont aussi probablement supprimés les je, tu, il, etc., ne, pas, etc. En anglais, ce sont les « stopwords ».

11

Zimon a écrit:

bien que je ne comprenne pas du tout sur quels critères ces textes sont sélectionnés (si sélection il y a).

Je pense qu'il n'y a pas de sélection, mais une base pour l'instant limitée de banque de données consultées. A partir de cette brochette de banques de données en ligne (établie sur base contractuelle), le système récupère toutes les ressources numériques:

...harvest(s) and retain(s) all records that point to digital resources. This includes freely-available and restricted-access digital resources.

Seules les banques de données inexploitables sont laissées de côté:

Those repositories containing many incorrect UTF-8 or XML records will be dropped.

Malheureusement, on tombera aussi sur des textes en accès restreint. Il faut alors soit interroger des connaissances qui ont un accès auxdites bases, soit écrire directement aux auteurs si c'est possible. En général, pour reprendre l'expression un peu malheureuse de Colline d'Or - il est vrai dans un contexte un peu polémique - , les auteurs de langue française "condescendent" (l'image d'Epinal du chercheur dans sa Tour d'ivoire est évidemment totalement fausse, mais la plupart des habitués de ce forum le savent et en usent, j'en suis sûr).

Pour les auteurs américains, c'est une autre paire de manches ; des collègues m'ont à plusieurs reprises benoîtement renvoyé au prêt entre bibliothèques pour des ouvrages absents des bibliothèques continentales: ils ne se doutaient pas combien cela coûtait de faire venir leurs travaux. Dans ce cas: aller voir leurs pages personnelles.

10

Naïf a écrit:

Ce remarquable moteur indexe les descriptifs de textes scientifiques (articles, monographies) récents et moins récents, sur des sites comme ceux de Persée, du Michigan etc.

J'ignorais son existence. Il me paraît richissime, bien que je ne comprenne pas du tout sur quels critères ces textes sont sélectionnés (si sélection il y a).

9

Ce remarquable moteur indexe les descriptifs de textes scientifiques (articles, monographies) récents et moins récents, sur des sites comme ceux de Persée, du Michigan etc.
Interface en anglais, mais très simple à manipuler:

http://www.oaister.org/

Cliquez sur SEARCH, puis sur la page qui s'affiche tapez, par exemple, "participe passé", ou "orthographe française" - sans guillemets. Puis "Envoi" ou à nouveau "Search".

Les textes ne sont pas tous accessibles sans formation (c'est la vie! les forums de vulgarisation en neurologie ou en philosophie sont parfois rudement compliqués...), mais qu'on essaye. Il se trouvera bien des bonnes âmes pour répondre aux éventuelles questions de compréhension.

Bonne moisson !

8

Catalogue de liens bien utile (pardon s'il est déjà là)
http://clicnet.swarthmore.edu/dictionnaires.html
Comme toujours, regardez le root:
http://clicnet.swarthmore.edu/

PS. Pour vous faire patienter: j'ai bien des adresses de bases de données, encore faudra-t-il* que je remette la main dessus.

*j'ai retrouvé le trait d'union sur mon clavier, ouf.

7

Ces 1531 (!) collections constituent un immense fourre-tout,

http://www.numerique.culture.fr/mpf/pub-fr/index.html

où se trouvent entre autres des textes (imprimés et manuscrits) qui ne paraissent pas être repérables par les voies ordinaires. J'ai ainsi pu y lire en mode image l'amusante Gazzette françoise (forézienne), 1605, de Marcellin Allard, numérisée à la médiathèque de Saint-Etienne. Faute de relevé systématique des écrits disponibles, il faut y aller au petit bonheur, sur des indices aléatoires. On se sent comme un explorateur d'autrefois au coeur de la jungle.

6

Oui, P'tit prof, amende honorable, vous avez entièrement raison sur ce point.
Mais livrez nous vous aussi vos secrets internet, ce fil est pour cela.
--
Par exemple: saviez vous qu'en écrivant

+interné

vous obtenez dans Google des résultats avec accents, donc différents de

+interne

? (sans le "+", il mélange les deux)

Allez, si vous le saviez, d'autres non assurément.

Jadis, un moteur français faisait cela par défaut, ils sont devenus vendeurs de mayonnaise...

5

Ainsi, tout dernièrement, il a pris prétexte d'une citation de Voltaire mal transcrite, où le mot silenciaires était écrit sileuciaires (ce qui ne modifiait en rien la pertinence de la citation), pour commenter :

Cela ne modifiait en rien la pertinence de la citation, cela ne faisait que faire dire n'importe quoi à Voltaire. Mais peu importe, pouvu que la citation soit pertinente...

Que l'on ne me parle pas du doigt et de la lune : je trouve précisément que se servir d'un auteur du calibre de Voltaire pour en tirer des citations pertinentes concernant des points de grammaire, c'est regarder le doigt, et non la lune.
D'autant que lorsqu'un mot a été estropié par le lecteur optique, la raison humaine peut le corriger avant de le servir aux autres.

4

Oui, il y a un bug dans Gallica ou quelque chose m'échappe:

Pour chercher des documents contenant une expression exacte, mettez-la entre guillemets.

http://gallica.bnf.fr/html/aide/rechercher.html

Mais cela ne marche pas.

3

Ah oui, très utile ce fil. Pour Gallica, je n'ai pas de réponse. Le motif de mon message est d'indiquer le site de Jean Véronis pour ceux qui ne le connaissent pas encore:

Vous trouverez, si ma mémoire est bonne, l'explication du paradoxe dont parlait gb (Google annonçant 5558 résultats, puis 56 dès la seconde page) une comparaison systématique avec Yahoo etc. , et certains outils intéressants.

PS. J'ai oublié si la réclame d'autres sites était acceptée sur ce forum. Effacez sans vergogne si ce n'est pas le cas.