Skip to content

Simple Text Extractor is a fast, 100% offline desktop OCR application. Securely extract text from PDF, PNG, JPG, JPEG, TIFF or BMP files while ensuring total privacy.

License

Notifications You must be signed in to change notification settings

STENS66/Simple-Text-Extractor

Repository files navigation

Simple Text Extractor - English Version 1.1

Available on the Microsoft Store

Copyright © Gaëtan Sencie 2025

All rights reserved.

Description

Simple Text Extractor is a fast, 100% offline desktop OCR application. Securely extract text from PDF, PNG, JPG, JPEG, TIFF, or BMP files while ensuring total privacy.

This application is officially validated and published on the Microsoft Store, ensuring security and reliability. It features a robust architecture, a modern interface, and advanced features like batch processing.

Preview

Screenshot of the Simple-Text-Extractor app

Features

  • Total Privacy: All operations are performed locally without an internet connection.

  • Modern Interface: New fluid and ergonomic graphical interface (based on CustomTkinter) with high-resolution screen support.

  • Batch Processing: Add as many files as you wish to the queue and process them all automatically in sequence.

  • Drag & Drop: Simply drag your files directly into the window to add them instantly.

  • Metadata Analysis: Immediate visualization of technical details (Size, Page count, DPI Resolution, PDF/A Format) before processing.

  • Archiving Format (PDF/A): Option to generate files compliant with the long-term archiving standard (PDF/A-1b).

  • Flexible Management: Ability to remove files from the list one by one or clear everything in a single click.

  • Compatible: Supports PDF, PNG, JPG, JPEG, TIFF, and BMP files.

  • Zero Configuration: No administrator rights required, portable, and secure.

Usage

To extract text with "Simple Text Extractor":

1. Add files:

  • Click the "Choose Input PDF or Image" button or simply drag your files (PDF or Images) into the application window.

2. Configure output (Optional):

  • By default, files are saved in the same folder as the source.

  • You can define a specific folder via the "Choose..." button in the Destination section.

  • Check the "Archiving Format (PDF/A)" box if you want a document optimized for long-term preservation.

3. Start processing:

  • Check the list of pending files.

  • Click "Start OCR".

4. Results:

  • Follow the global and detailed progress via the loading bar.

  • Once finished, click the displayed links to directly open the folder containing your new files (automatically named with the _ocr suffix).

Advantages

  • Enhanced Security: Integrates protections against malicious files (Decompression Bombs) and secures internal process execution.

  • Industrial Stability: Thanks to a new architecture (Multiprocessing), the application never freezes, even when processing heavy documents.

  • Simplicity: Tooltips guide the user on every option.

  • Speed: Optimized RAM processing for maximum execution speed.

  • Total Control: The user retains absolute control over their files and information with no risk of leakage.

Download

Contact

Thank you for using "Simple Text Extractor"!


References & Keywords

Developed by Gaëtan Sencie, Python developer. Windows application available on the Microsoft Store and GitHub.

Keywords: OCR, privacy, offline application, data security, PDF conversion, text extraction.


Simple Text Extractor - Version française 1.1

Disponible sur le Microsoft Store

Copyright © Gaëtan Sencie 2025

Tous droits réservés.

Description

Simple Text Extractor est une application OCR de bureau rapide et 100% hors ligne. Extrayez en toute sécurité le texte de vos fichiers PDF, PNG, JPG, JPEG, TIFF ou BMP tout en garantissant une confidentialité totale.

Cette application est officiellement validée et publiée sur le Microsoft Store, garantissant sécurité et fiabilité. Elle propose une architecture robuste, une interface moderne et des fonctionnalités avancées comme le traitement par lots.

Prévisualisation

Capture d'écran de l'application Simple-Text-Extractor

Fonctionnalités

  • Confidentialité Totale : Toutes les opérations sont effectuées localement sans connexion internet.

  • Interface Moderne : Nouvelle interface graphique fluide et ergonomique (basée sur CustomTkinter) avec support des écrans haute résolution.

  • Traitement par Lots (Batch Processing) : Ajoutez autant de fichiers que vous le souhaitez dans la file d'attente et traitez-les tous automatiquement à la suite.

  • Glisser-Déposer (Drag & Drop) : Glissez simplement vos fichiers directement dans la fenêtre pour les ajouter instantanément.

  • Analyse des Métadonnées : Visualisation immédiate des détails techniques (Taille, Nombre de pages, Résolution DPI, Format PDF/A) avant le traitement.

  • Format Archivage (PDF/A) : Option pour générer des fichiers conformes à la norme d'archivage long terme (PDF/A-1b).

  • Gestion Flexible : Possibilité de supprimer des fichiers de la liste un par un ou de tout vider en un clic.

  • Compatible : Prend en charge les fichiers PDF, PNG, JPG, JPEG, TIFF et BMP.

  • Zéro Configuration : Aucun droit administrateur requis, portable et sécurisé.

Utilisation

Pour extraire du texte avec "Simple Text Extractor" :

1. Ajouter des fichiers :

  • Cliquez sur le bouton "Choisir PDF ou Image d'entrée" ou faites simplement glisser vos fichiers (PDF ou Images) dans la fenêtre de l'application.

2. Configurer la sortie (Optionnel) :

  • Par défaut, les fichiers sont sauvegardés dans le même dossier que la source.

  • Vous pouvez définir un dossier spécifique via le bouton "Choisir..." dans la section Destination.

  • Cochez la case "Format Archivage (PDF/A)" si vous souhaitez un document optimisé pour la conservation longue durée.

3. Lancer le traitement :

  • Vérifiez la liste des fichiers en attente.

  • Cliquez sur "Lancer l'OCR".

4. Résultats :

  • Suivez la progression globale et détaillée via la barre de chargement.

  • Une fois terminé, cliquez sur les liens affichés pour ouvrir directement le dossier contenant vos nouveaux fichiers (nommés automatiquement avec le suffixe _ocr).

Avantages

  • Sécurité Renforcée : Intègre des protections contre les fichiers malveillants (Decompression Bombs) et sécurise l'exécution des processus internes.

  • Stabilité Industrielle : Grâce à une nouvelle architecture (Multiprocessing), l'application ne gèle jamais, même lors du traitement de documents lourds.

  • Simplicité : Des infobulles (tooltips) guident l'utilisateur sur chaque option.

  • Rapidité : Traitement optimisé en mémoire vive (RAM) pour une vitesse d'exécution maximale.

  • Contrôle total : L'utilisateur garde un contrôle absolu sur ses fichiers et informations sans risque de fuite.

Téléchargement

Contact

Merci d'utiliser "Simple Text Extractor" !


Références & Mots-clés

Développé par Gaëtan Sencie, développeur Python. Application Windows disponible sur le Microsoft Store et GitHub.

Mots-clés : OCR, confidentialité, application hors ligne, sécurité des données, conversion PDF, extraction de texte.