Available on the Microsoft Store
Simple Text Extractor is a fast, 100% offline desktop OCR application. Securely extract text from PDF, PNG, JPG, JPEG, TIFF, or BMP files while ensuring total privacy.
This application is officially validated and published on the Microsoft Store, ensuring security and reliability. It features a robust architecture, a modern interface, and advanced features like batch processing.
-
Total Privacy: All operations are performed locally without an internet connection.
-
Modern Interface: New fluid and ergonomic graphical interface (based on CustomTkinter) with high-resolution screen support.
-
Batch Processing: Add as many files as you wish to the queue and process them all automatically in sequence.
-
Drag & Drop: Simply drag your files directly into the window to add them instantly.
-
Metadata Analysis: Immediate visualization of technical details (Size, Page count, DPI Resolution, PDF/A Format) before processing.
-
Archiving Format (PDF/A): Option to generate files compliant with the long-term archiving standard (PDF/A-1b).
-
Flexible Management: Ability to remove files from the list one by one or clear everything in a single click.
-
Compatible: Supports PDF, PNG, JPG, JPEG, TIFF, and BMP files.
-
Zero Configuration: No administrator rights required, portable, and secure.
To extract text with "Simple Text Extractor":
1. Add files:
- Click the "Choose Input PDF or Image" button or simply drag your files (PDF or Images) into the application window.
2. Configure output (Optional):
-
By default, files are saved in the same folder as the source.
-
You can define a specific folder via the "Choose..." button in the Destination section.
-
Check the "Archiving Format (PDF/A)" box if you want a document optimized for long-term preservation.
3. Start processing:
-
Check the list of pending files.
-
Click "Start OCR".
4. Results:
-
Follow the global and detailed progress via the loading bar.
-
Once finished, click the displayed links to directly open the folder containing your new files (automatically named with the _ocr suffix).
-
Enhanced Security: Integrates protections against malicious files (Decompression Bombs) and secures internal process execution.
-
Industrial Stability: Thanks to a new architecture (Multiprocessing), the application never freezes, even when processing heavy documents.
-
Simplicity: Tooltips guide the user on every option.
-
Speed: Optimized RAM processing for maximum execution speed.
-
Total Control: The user retains absolute control over their files and information with no risk of leakage.
- Email: app.sencie@gmail.com
- LinkedIn: Gaëtan Sencie
- GitHub: STENS66
Thank you for using "Simple Text Extractor"!
Developed by Gaëtan Sencie, Python developer. Windows application available on the Microsoft Store and GitHub.
Keywords: OCR, privacy, offline application, data security, PDF conversion, text extraction.
Disponible sur le Microsoft Store
Simple Text Extractor est une application OCR de bureau rapide et 100% hors ligne. Extrayez en toute sécurité le texte de vos fichiers PDF, PNG, JPG, JPEG, TIFF ou BMP tout en garantissant une confidentialité totale.
Cette application est officiellement validée et publiée sur le Microsoft Store, garantissant sécurité et fiabilité. Elle propose une architecture robuste, une interface moderne et des fonctionnalités avancées comme le traitement par lots.
-
Confidentialité Totale : Toutes les opérations sont effectuées localement sans connexion internet.
-
Interface Moderne : Nouvelle interface graphique fluide et ergonomique (basée sur CustomTkinter) avec support des écrans haute résolution.
-
Traitement par Lots (Batch Processing) : Ajoutez autant de fichiers que vous le souhaitez dans la file d'attente et traitez-les tous automatiquement à la suite.
-
Glisser-Déposer (Drag & Drop) : Glissez simplement vos fichiers directement dans la fenêtre pour les ajouter instantanément.
-
Analyse des Métadonnées : Visualisation immédiate des détails techniques (Taille, Nombre de pages, Résolution DPI, Format PDF/A) avant le traitement.
-
Format Archivage (PDF/A) : Option pour générer des fichiers conformes à la norme d'archivage long terme (PDF/A-1b).
-
Gestion Flexible : Possibilité de supprimer des fichiers de la liste un par un ou de tout vider en un clic.
-
Compatible : Prend en charge les fichiers PDF, PNG, JPG, JPEG, TIFF et BMP.
-
Zéro Configuration : Aucun droit administrateur requis, portable et sécurisé.
Pour extraire du texte avec "Simple Text Extractor" :
1. Ajouter des fichiers :
- Cliquez sur le bouton "Choisir PDF ou Image d'entrée" ou faites simplement glisser vos fichiers (PDF ou Images) dans la fenêtre de l'application.
2. Configurer la sortie (Optionnel) :
-
Par défaut, les fichiers sont sauvegardés dans le même dossier que la source.
-
Vous pouvez définir un dossier spécifique via le bouton "Choisir..." dans la section Destination.
-
Cochez la case "Format Archivage (PDF/A)" si vous souhaitez un document optimisé pour la conservation longue durée.
3. Lancer le traitement :
-
Vérifiez la liste des fichiers en attente.
-
Cliquez sur "Lancer l'OCR".
4. Résultats :
-
Suivez la progression globale et détaillée via la barre de chargement.
-
Une fois terminé, cliquez sur les liens affichés pour ouvrir directement le dossier contenant vos nouveaux fichiers (nommés automatiquement avec le suffixe _ocr).
-
Sécurité Renforcée : Intègre des protections contre les fichiers malveillants (Decompression Bombs) et sécurise l'exécution des processus internes.
-
Stabilité Industrielle : Grâce à une nouvelle architecture (Multiprocessing), l'application ne gèle jamais, même lors du traitement de documents lourds.
-
Simplicité : Des infobulles (tooltips) guident l'utilisateur sur chaque option.
-
Rapidité : Traitement optimisé en mémoire vive (RAM) pour une vitesse d'exécution maximale.
-
Contrôle total : L'utilisateur garde un contrôle absolu sur ses fichiers et informations sans risque de fuite.
- Email : app.sencie@gmail.com
- LinkedIn : Gaëtan Sencie
- GitHub : STENS66
Merci d'utiliser "Simple Text Extractor" !
Développé par Gaëtan Sencie, développeur Python. Application Windows disponible sur le Microsoft Store et GitHub.
Mots-clés : OCR, confidentialité, application hors ligne, sécurité des données, conversion PDF, extraction de texte.
