Traitement Automatisé de la Langue Naturelle

Une page de texte bien remplie peut contenir jusqu'à un millier de mots, soit environ 5000 caractères. Une image de cette même page, numérisée à 300ppp, contient 8,7 millions de pixels.

Un texte dans sa forme conceptuelle ne contient que deux relations : un mot peut se situer avant ou après un autre. Une fois une page de texte numérisée, les pixels peuvent avoir une infinité de relations: à gauche, à droite, en haut, en bas et tous les angles possibles.

Ces chiffres illustrent très bien la complexité du traitement d'images par rapport au traitement de la langue naturelle. Le niveau de compétence de CoReNum permet donc évidemment de traiter les documents en mode texte afin, par exemple, d'en extraire les mots clés, les expressions importantes, voire un résumé automatique.




kamagra fast brighton cheapest cialis in uk cialis in canada online buying levitra from canada kamagra in london generic cialis uk online sildenafil patent expiration uk