AI - Le NLP n'aime pas le français



Le #NLP (Natural Language Processing) n'aime pas le français. Cette technique d'Intelligence artificielle, totalement rationnelle n'aime pas le Français.

Le français est une langue étrange, surtout à l'écrit....Etrange voire folle ! :-)

Par exemple on dit :
  • Le foie (avec un e) alors qu'un mot finissant par e c'est souvent un féminin.
  • La foi (sans e).
  • Une fois (avec un s).


Et encore pour les nombres on n'a pas une suite comme cinquante, soixante, septante, octante (sauf en Suisse) mais on a soixante dix et quatre vingt et quatre vingt dix càd (4x20+10)... Va donc comprendre....

Et des exceptions comme cela y'en a énormément....

Cela a des conséquences... sur les réseaux neurones. Je fais des tests sur du RNN (Recurrent Neural Network) sur des sets de données de chatbot.... Et cela a des conséquences...

A résultat égal qualitativement sur le même set de données on a :
  • 50 EPOCH en Néerlandais (presque pareil que l'anglais)
  • 65 EPOCH en Français.


OK la nature même du set d'entrainement, les homonymies, et la taille jouent aussi...

Mais on pourrait faire cela avec le plus de langages pour créer un classement des langues les plus intelligibles... Et sélectionner ainsi la langue la plus rationnelle :-) ...

Si j'étais provocateur, on pourrait en conclure que le Français (surtout à l'écrit) est une langue moins intelligible donc moins intelligente... Si on était politique on pourrait s'intéresser à la raison d'une langue aussi complexe dans un pays de contrat écrit... Si on était écologique on pourrait en conclure que le Français n'est pas une langue Green...

Si on fait de l'intelligence artificielle, on doit surtout prendre en considération que les langues ne sont pas égales devant les réseaux neurones et l'IA. ET que donc faire du NLP c'est aussi faire de la linguistique... Pour ma part j'ai "étudié", le japonais, le chinois, le vietnamien, le russe, l'hébreux, l'arable, l'anglais et le néerlandais, non pas pour les pratiquer mais pour comprendre leurs structures... et je pense que toute personne souhaitant faire du NLP devrait en faire autant en espérant qu'elle ne soit pas aussi nul que moi dans la pratique de ces langues...

Mais comprendre la logique de construction d'une langue est réellement passionnant et un plus...

Etonnant non ?

Jerome Fortias

Sur Twitter https://twitter.com/FortiasJerome


Commentaires

Articles les plus consultés