Question 1

Comment fonctionne l'OCR ?

Accepted Answer

L'OCR (Optical Character Recognition) analyse les pixels de chaque page pour reconnaître les caractères. Chaque page du PDF est rendue en image puis envoyée au moteur Tesseract.js qui s'exécute entièrement dans votre navigateur.

Question 2

Quelles langues sont supportées ?

Accepted Answer

Le français et l'anglais sont supportés. Le modèle de langue est téléchargé automatiquement lors de la première utilisation (~2-4 Mo). Sélectionnez la langue AVANT de lancer la reconnaissance pour de meilleurs résultats.

Question 3

Qu'est-ce qui est bien reconnu ?

Accepted Answer

Le texte imprimé en bonne résolution (>150 DPI), les documents scannés à plat, les polices standard. Plus le document est net et contrasté, meilleur est le résultat.

Question 4

Qu'est-ce qui est mal reconnu ?

Accepted Answer

L'écriture manuscrite, les documents de mauvaise qualité (flous, tordus, tachés), les tableaux complexes, les formules mathématiques et les textes sur fond coloré ou image. La mise en page (colonnes, indentation) n'est pas préservée.

Question 5

Est-ce que mes fichiers sont envoyés sur un serveur ?

Accepted Answer

Non. Tout le traitement OCR est effectué localement dans votre navigateur via Tesseract.js. Aucune donnée ne quitte votre ordinateur. Le seul téléchargement est celui du modèle de langue (une seule fois, puis mis en cache).

Question 6

Pourquoi c'est plus lent que d'autres outils en ligne ?

Accepted Answer

Les outils en ligne envoient vos fichiers sur des serveurs puissants avec GPU. Ici, tout tourne sur votre processeur. Comptez environ 5 à 30 secondes par page selon la complexité et votre machine.

Question 7

Puis-je utiliser le texte extrait pour convertir en Word/Excel ?

Accepted Answer

Oui, vous pouvez copier le texte extrait puis le coller dans Word ou Excel. Pour une conversion directe, utilisez d'abord l'OCR puis nos outils PDF vers Word ou PDF vers Excel sur le PDF natif résultant.

OCR - Reconnaissance de texte

Texte reconnu

Questions fréquentes