OCR PDF (PDF Consultable)
Exécutez l'OCR sur un PDF numérisé pour le rendre consultable et copiable, avec une couche de texte invisible derrière chaque page.
Réponse rapide: Exécutez l'OCR sur un PDF numérisé pour le rendre consultable et copiable, avec une couche de texte invisible derrière chaque page.
Dernière mise à jour
Questions fréquentes
- Qu'est-ce que l'OCR pour les PDF ?
- L'OCR (reconnaissance optique de caractères) lit les pixels des pages numérisées et reconnaît les mots. Nous écrivons ensuite ces mots dans le PDF sous forme de couche de texte invisible, ce qui permet la recherche, le copier-coller et la lecture à voix haute.
- L'OCR peut-il rendre un PDF numérisé consultable ?
- Oui — c'est exactement ce qu'il fait. Après l'OCR, Ctrl/Cmd+F dans n'importe quel lecteur PDF trouvera des mots à l'intérieur de la numérisation.
- Quelle est la précision de l'OCR pour les PDF ?
- Tesseract est généralement précis à 95-99 % avec un texte imprimé propre à 300 DPI. La précision diminue pour les scans de mauvaise qualité, l'écriture manuscrite et les polices inhabituelles. Les scans d'origine à plus haute résolution donnent les meilleurs résultats.
- L'OCR prend-il en charge plusieurs langues ?
- Oui. Choisissez parmi l'anglais, le néerlandais, l'allemand, le français, l'espagnol ou l'italien. Chaque modèle de langue se télécharge lors de la première utilisation (environ 10 Mo) et est mis en cache.
- L'OCR peut-il gérer des pages tournées ?
- Il gère bien les petites inclinaisons. Pour les pages tournées de 90° ou 180°, passez-les d'abord par Rotate PDF, puis par l'OCR.
- Y a-t-il une limite de pages ?
- Aucune limite fixe. L'OCR est néanmoins gourmand en CPU, donc chaque page prend quelques secondes — un PDF de 100 pages peut prendre plusieurs minutes sur un ordinateur portable typique. La barre de progression affiche l'état en direct.
- L'OCR va-t-il changer l'apparence de mon PDF ?
- Non. L'image de la page est préservée exactement ; le texte OCR est ajouté comme une couche invisible derrière. La page visible est identique à l'original.
- L'OCR est-il sûr pour les documents sensibles ?
- Oui. L'ensemble du processus s'exécute dans votre navigateur — le PDF et les résultats de l'OCR ne quittent jamais votre appareil.
- Puis-je copier du texte après l'OCR ?
- Oui. Ouvrez le PDF résultant dans n'importe quel lecteur (Acrobat, Preview, lecteur PDF du navigateur), sélectionnez le texte et collez — les mots OCR sont ceux qui sont copiés.
- Pourquoi l'OCR rate-t-il certains caractères ?
- Causes courantes : scans de basse résolution, polices inhabituelles, texte très petit ou texte sur un fond texturé. Re-scanner à 300 DPI en niveaux de gris (ou utilisez d'abord notre outil PDF vers niveaux de gris) pour obtenir les meilleurs résultats.