Sujet : Encodage du genre et du nombre dans une base de données lexicale
Bonjour,
Je réalise (à titre de recherche personnelle et gratuite) un système de catégorisation graduelle
Ma base puise ses entrées lexicales dans les lexiques Morphalou, Prolex et bien d'autres encore.
Chacune de ces sources catégorise les entrées selon un modèle justifié par un rationnel théorique... mais différent pour chacune des sources et... qu'elles enfreignent... souvent ou suivent... à peu près...
Par exemple, pour les mots qui peuvent être ou du masculin ou du féminin, Morphalou crée une entrée pour un genre et une autre pour l'autre genre, mais Prolex créera une entrée unique masculin_féminin.
Dans l'optique de mon amusement à visée essentiellement sémantique, (mais c'est aussi à dire dans une optique de traitement automatisable et donc sous un point de vue général), quel serait votre conseil de spécialistes lexicographes, lexicologues :
1/ Adopter une approche type morphalou, c'est à dire que pour une entrée telle que agenais (en tant qu'adjectif de gentilé) faire deux entrées distinctes (masculin et singulier / masculin et pluriel)
2/ Adopter une approche type Prolex, c'est à dire, pour l'exemple ci-dessus une seule entrée masculin et singulier_pluriel
3/ Adopter une troisième approche nécessairement floue, ne prenant qu'une seule entrée lexicale mais qui peut prendre les deux genres et les deux nombres, chacun renseigné en pourcentage d'apparition dans un corpus de référence. (Corpus type Frantext par exemple)
Il va sans dire que la réponse 3 est parfaitement cohérente avec mon amusement, qu'elle offre aussi le mérite de "décider" quelque chose pour les "mots-outils" les toponymes, ergonymes... et tous les "on-sait-pas-dire-à-priori"
MAIS, l'accepter cet instant de mon étude va me compliquer singulièrement ma tâche... et la charge informatique associée.
Aussi je ne l'adopterai que si des spécialistes du sujet confirment que les deux premières solutions ne peuvent constituer une approche satisfaisante.
Merci d'avoir lu jusque là. Je peux évidemment donner beaucoup d'autres informations complémentaires, mais peut-être aussi ma question n'a-t-elle rien à faire sur ce forum. (N'hésitez pas à me le dire, je comprendrai très bien.)