Oui, gb, j'ai omis de clairement confirmer tes réponses.
Je n'utilise pas ces logiciels destinés à Windo$.
Le tableau de dix huit mégaoctets au format texte, a été dépouillé de ses colonnes redondantes (Mot ou syllabes à l'envers, Voyelles/Consonnes...) ainsi que des informations inutiles à mon programme de jeux de mots (Fréquences d'apparition).
Puis j'ai réparti les mots en différents fichiers selon leur catégorie grammaticale :
article, adjectif, nom, pronom, verbe, adverbe ...
Les déterminants, substantifs et adjectifs, ont été séparés selon les différents cas de genre (m, f ou indéterminé) et de nombre (s, p ou indéterminé).
Ce qui me donne de nombreux fichiers avec les mots et leur prononciation.
Maintenant, je vais commencer un programme simple : recherche des structures figées "déterminant adjectif nom" conduisant à une même prononciation.
Peut-être que ça fera des jeux de mots marrants. "Ne pas confondre ... et ...".
Une remarque quant au lexique de Boris New & Christophe Pallier : il y a pas mal d'erreurs dans la prononciation des mots. Pour s'en convaincre, si les logiciels livrés avec les données permettent une recherche sur la phonétique, il suffit de demander le "son" d'une lettre telle que W : "dubl*v". De nombreux mots sont épelés à tort au lieu d'être prononcés.
Pour les jeux de mots, j'ai "trafiqué" la prononciation du lexique en simplifiant :
un seul son pour [in]:5 et [un]:1, de même pour les différents [eu]:2,9 ou *. J'ai aussi confondu les deux [u] et les [é].
On peut sans doute prendre cette liberté pour les jeux de mots. Les rimes respectent-elles les sonorités avec précisions ?
Je serais bien curieux d'avoir votre avis quant à ce dernier point.
Ce qu'omet une liste d'interdictions est libre. L'énoncé de droits condamne ce qui n'est pas cité.