Aller au contenu

OCR - Reconnaissance de texte

Extrayez le texte de vos PDF scannés ou images grâce à la reconnaissance optique
Glissez-déposez votre fichier PDF ou image ici
ou cliquez pour sélectionner (PDF, PNG, JPG, WebP)

Questions fréquentes

L'OCR (Optical Character Recognition) analyse les pixels de chaque page pour reconnaître les caractères. Chaque page du PDF est rendue en image puis envoyée au moteur Tesseract.js qui s'exécute entièrement dans votre navigateur.

Le français et l'anglais sont supportés. Le modèle de langue est téléchargé automatiquement lors de la première utilisation (~2-4 Mo). Sélectionnez la langue AVANT de lancer la reconnaissance pour de meilleurs résultats.

Le texte imprimé en bonne résolution (>150 DPI), les documents scannés à plat, les polices standard. Plus le document est net et contrasté, meilleur est le résultat.

L'écriture manuscrite, les documents de mauvaise qualité (flous, tordus, tachés), les tableaux complexes, les formules mathématiques et les textes sur fond coloré ou image. La mise en page (colonnes, indentation) n'est pas préservée.

Non. Tout le traitement OCR est effectué localement dans votre navigateur via Tesseract.js. Aucune donnée ne quitte votre ordinateur. Le seul téléchargement est celui du modèle de langue (une seule fois, puis mis en cache).

Les outils en ligne envoient vos fichiers sur des serveurs puissants avec GPU. Ici, tout tourne sur votre processeur. Comptez environ 5 à 30 secondes par page selon la complexité et votre machine.

Oui, vous pouvez copier le texte extrait puis le coller dans Word ou Excel. Pour une conversion directe, utilisez d'abord l'OCR puis nos outils PDF vers Word ou PDF vers Excel sur le PDF natif résultant.