Caractéristiques de l'IronOCR

Translated

View the article in English

IronOCR for .NET est une bibliothèque permettant aux développeurs de scanner et de lire du texte ou des codes-barres à partir d'images.

Compatibilité

langues .NET

C# (Tutoriel Référence API)
Numérisez et lisez des textes ou des codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en C#.
VB.NET
Numérisez et lisez des textes ou des codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en VB.NET.
F#
- Analyser et lire le texte ou les codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en F#.

Plates-formes

.NET 5, 6, 7 et 8 (Tutoriel)
IronOCR est disponible pour .NET 5, 6, 7 et 8.
.NET Core 2 et 3 (Tutoriel)
- IronOCR est disponible pour .NET Core 2 et 3.
- La version actuelle prend en charge .NET Core sur les systèmes d'exploitation clients Linux, Unix et macOS, ainsi que Mono.
Une prochaine version prendra en charge MAUI et Xamarin
.NET Standard 2+ (Référence API)
IronOCR est compatible avec le Standard .NET 2 et les versions ultérieures.
.NET Framework 4.6.2+ (Exemple de Code Référence API
- Scannez et lisez des textes ou des codes-barres à partir d'images avec le Framework .NET 4.6.2 et plus.

Types d'applications

Console, Web et Bureau (Tutoriel Référence API)
- Créer des applications pour le Web, le bureau et la console à l'aide d'IronOCR.

Systèmes d'exploitation

Microsoft Windows (Tutoriel)
Linux (Tutoriel)
macOS
Docker (Tutoriel
Azure (Tutoriel
AWS

IDE

Microsoft Visual Studio (Tutoriel)
Jetbrains ReSharper et Rider

Certification

Microsoft Authenticode
- DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1

Moteur OCR

Moteur d'OCR sous-jacent

Tesseract 5 (Tutoriel Exemple de code
Tesseract est un moteur de reconnaissance de texte (OCR) open source, disponible sous la licence Apache 2.0. L'une des bibliothèques les plus précises et les plus rapides est disponible pour C#.NET. Actuellement, Tesseract 5 est la version la plus stable.
Configuration détaillée (Exemple de code)
- L'objet IronTesseract.Configuration fournit un accès à l'API Tesseract sous-jacente en C# / .NET pour configurer l'installation pour les utilisateurs avancés.
- La configuration peut aider à améliorer le résultat après l'exécution de l'OCR.
- Pour améliorer la vitesse de l'OCR, veuillez consulter cet exemple de code pour la configuration OCR rapide.

Langues internationales

Tutoriel

125 Langues (Liste Exemple de Code
Haute, Moyenne et Rapide Qualité pour la plupart des langues (Exemple de Code)
Langues personnalisées (Exemple de code)
Entraînement de polices personnalisées (Comment faire)

Lecture de textes et de codes-barres

Texte et Nombres (Exemple de Code)
Plusieurs langues à la fois (Guide pratique Exemple de code
Code-barres (plus de 20 formats) et code QR (Comment faire Exemple de code

Documents spécialisés

Cette méthode utilise l'apprentissage automatique pour améliorer la reconnaissance de texte.

Document numérisé (Guide Exemple de Code
Optimisé pour la lecture de documents numérisés ou de photos de documents papier contenant beaucoup de texte.
Tableau dans le document (Comment faire Exemple de Code
Optimisé pour les documents contenant des tableaux avec des contours clairs.
Plaque d'immatriculation (Comment faire Exemple de code
Optimisé pour lire les plaques d'immatriculation à partir de photos.
Passeport (Comment faire Exemple de code)
Optimisé pour la lecture et l'extraction des informations de passeport à partir de photos en scannant les contenus de la zone à lecture automatique (ZLA).
Photo (Comment faire Exemple de code
Optimisé pour lire les images contenant du texte difficile à lire.
Capture d'écran (Guide pratique Exemple de code
- Optimisé pour lire les captures d'écran contenant du texte difficile à lire.

Concurrence

Monothread et Multithread (Comment faire Exemple de Code
Prise en charge asynchrone (Comment faire Référence API)
Jeton d'Annulation (Exemple de Code)
Permet aux utilisateurs de suspendre le thread en cours pendant une période spécifiée en millisecondes dans le cas de la lecture d'un fichier d'entrée volumineux et d'un blocage pendant l'exécution du programme ou de l'application.
Timeout (Exemple de code)
- Fournit un délai optionnel en millisecondes, après lequel la lecture OCR sera annulée.

Vision par ordinateur

Comment faire Référence API

Utilisez la vision par ordinateur pour trouver du texte basé sur nos modèles avancés entraînés. IronOCR utilise OpenCV pour utiliser la vision par ordinateur afin de détecter les zones où se trouve du texte dans une image. Cette fonction est utile pour les images contenant beaucoup de bruit, les images dont le texte se trouve à plusieurs endroits différents et les images dont le texte est déformé. L'utilisation de la vision par ordinateur dans IronOCR déterminera où se trouvent les régions de texte et utilisera ensuite Tesseract pour tenter de lire ces régions.

Entrée OCR

Exemple de code

Lire à partir de nombreux formats

Images (jpg, png, gif, tiff, bmp) (Comment faire Exemple de Code
Fichiers tiff et gif multi-pages et cadres (How-To Exemple de Code
Objects System.Drawing (Comment faire Exemple de code)
Flux (Comment faire Exemple de code
PDFs (Comment faire Exemple de Code

Filtres

Assistant de Filtrage (Exemple de Code Référence API)
Si vous ne savez pas quel filtre appliquer à l'image, Filter Wizard fournit la liste des filtres adaptés à OcrInput en utilisant une approche de force brute qui renvoie la combinaison avec le maximum de confiance.

Filtres d'images OCR (Comment faire Tutoriel Exemple de Code

Sharpen (Référence API)

* Permet d'accentuer la netteté des documents OCR flous. Aplatit les canaux Alpha en blanc.

EnhanceResolution (Référence API)

* Améliore la résolution des images de faible qualité.

Denoise (Référence API)

* Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque l'on s'attend à ce qu'il y ait du bruit. Aplatit les canaux Alpha en blanc.

Dilate (Référence API)

* Morphologie avancée. la dilatation ajoute des pixels aux limites des objets d'une image. En face de Erode

Erode (Référence API)

Morphologie avancée. l'érosion supprime les pixels sur les limites de l'objet. Opposé à Dilater

Correction de l'orientation de l'image (Guide pratique Tutoriel Exemple de Code

Rotate (Tutoriel Référence API)

* Fait pivoter les images d'un certain nombre de degrés dans le sens des aiguilles d'une montre. Pour une rotation dans le sens inverse des aiguilles d'une montre, utilisez des nombres négatifs.

Deskew (Tutoriel Référence API

* Fait pivoter une image de manière à ce qu'elle soit dans le bon sens et orthogonale. Ceci est très utile pour l'OCR car la tolérance de Tesseract pour les scans biaisés peut être aussi basse que 5 degrés

Échelle (Tutoriel Référence API

Met à l'échelle les pages OcrInput de manière proportionnelle.

Corriger les couleurs de l'image (Comment faire Tutoriel Exemple de Code

Binarize (Tutoriel Référence API

* Ce filtre d'image transforme chaque pixel en noir ou en blanc, sans solution intermédiaire. Peut améliorer les performances de l'OCR en cas de contraste très faible entre le texte et l'arrière-plan.

ToGrayscale (Référence API)

* Ce filtre d'image transforme chaque pixel en une nuance de gris. Il est peu probable qu'il améliore la précision de l'OCR, mais il peut en améliorer la vitesse.

Inverser (Tutoriel Référence API

* Inverse toutes les couleurs. Par exemple, le blanc devient noir : le noir devient blanc.

ReplaceColor (Référence API)

* Remplace une couleur dans une image par une autre couleur avec un certain seuil.

SelectTextColor (Référence API)

* Remplace une couleur dans une image par une autre couleur avec un certain seuil.

Appliquer une région de culture

CropRectangle (Exemple de Code Référence API
- Dessiner un rectangle avec la coordonnée identifiée au-dessus d'un OcrInput.

Résultat du ROC

Sortie de données simple

Comment Faire Exemple de Code

Chaînes de texte .NET
Données de codes-barres et de codes QR
Images

Sortie de données structurées

Comment Faire Exemple de code

Pages
Blocs
Paragraphes
Lignes
Mots
Caractères

Exporter des documents

PDFs Recherchables (Guide pratique Tutoriel
- PDF en PDF Recherchable (Exemple de Code)
TIFF en PDF Recherchable (Exemple de Code)
Exportation hOCR (Tutoriel Tutoriel
Exportation HTML
Image de n'importe quelle page ou élément de texte
Code-barres ou code QR en tant qu'image

Surligner le texte d'une page pour le déboguer

Dessiner des boîtes rouges autour des caractères/mots/lignes/paragraphes détectés pour les mettre en évidence, et les enregistrer au format .png pour le débogage.