Cassini est un moteur d'aide à la transcription de documents numérisés. Il fonctionne aussi bien sur les textes imprimés que manuscrits, en langues latines ou chinoise.

Assistance à  la transcription

Cassini est capable de détecter le texte dans des documents numérisés et de créer les fichiers XML Alto correspondants. Il devient alors possible de transcrire facilement le document.

Grâce à un système inédit de comparaison de formes, Cassini transcrit automatiquement tout mot déjà rencontré. Cette assistance permet un gain de temps de 80% par rapport à une saisie entièrement manuelle.

Transcription automatique

Correction d'OCR

Le taux de reconnaissance des OCR est souvent bien décevant. Cassini améliore ces résultats grâce à son puissant moteur de comparaison d'images de mots.

Une fois les fichiers XML Alto de l'OCR importés dans Cassini, les mots mal reconnus sont corrigés automatiquement. Pour ce faire, Cassini exploite judicieusement les connaissances récoltées dans les portions de document correctement transcrites.