Caractéristiques de l'IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR for .NET est une bibliothèque permettant aux développeurs de scanner et de lire du texte ou des codes-barres à partir d'images.

Compatibilité

langues .NET

  • C# (Tutoriel Référence API)
  • Numérisez et lisez des textes ou des codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en C#.
  • VB.NET
  • Numérisez et lisez des textes ou des codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en VB.NET.
  • F#

    • Analyser et lire le texte ou les codes-barres à partir d'images (jpg, png, gif, tiff, bmp) en F#.

Plates-formes

  • .NET 5, 6, 7 et 8 (Tutoriel)
  • IronOCR est disponible pour .NET 5, 6, 7 et 8.
  • .NET Core 2 et 3 (Tutoriel)

    • IronOCR est disponible pour .NET Core 2 et 3.

    • La version actuelle prend en charge .NET Core sur les systèmes d'exploitation clients Linux, Unix et macOS, ainsi que Mono.
  • Une prochaine version prendra en charge MAUI et Xamarin
  • .NET Standard 2+ (Référence API)
  • IronOCR est compatible avec le Standard .NET 2 et les versions ultérieures.
  • .NET Framework 4.6.2+ (Exemple de Code Référence API

    • Scannez et lisez des textes ou des codes-barres à partir d'images avec le Framework .NET 4.6.2 et plus.

Types d'applications

  • Console, Web et Bureau (Tutoriel Référence API)

    • Créer des applications pour le Web, le bureau et la console à l'aide d'IronOCR.

Systèmes d'exploitation

IDE

  • Microsoft Visual Studio (Tutoriel)
  • Jetbrains ReSharper et Rider

Certification

  • Microsoft Authenticode

    • DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1

Moteur OCR

Moteur d'OCR sous-jacent

  • Tesseract 5 (Tutoriel Exemple de code
  • Tesseract est un moteur de reconnaissance de texte (OCR) open source, disponible sous la licence Apache 2.0. L'une des bibliothèques les plus précises et les plus rapides est disponible pour C#.NET. Actuellement, Tesseract 5 est la version la plus stable.
  • Configuration détaillée (Exemple de code)

    • L'objet IronTesseract.Configuration fournit un accès à l'API Tesseract sous-jacente en C# / .NET pour configurer l'installation pour les utilisateurs avancés.

    • La configuration peut aider à améliorer le résultat après l'exécution de l'OCR.

    • Pour améliorer la vitesse de l'OCR, veuillez consulter cet exemple de code pour la configuration OCR rapide.

Langues internationales

Tutoriel

Lecture de textes et de codes-barres

Documents spécialisés

Cette méthode utilise l'apprentissage automatique pour améliorer la reconnaissance de texte.

  • Document numérisé (Guide Exemple de Code
  • Optimisé pour la lecture de documents numérisés ou de photos de documents papier contenant beaucoup de texte.
  • Tableau dans le document (Comment faire Exemple de Code
  • Optimisé pour les documents contenant des tableaux avec des contours clairs.
  • Plaque d'immatriculation (Comment faire Exemple de code
  • Optimisé pour lire les plaques d'immatriculation à partir de photos.
  • Passeport (Comment faire Exemple de code)
  • Optimisé pour la lecture et l'extraction des informations de passeport à partir de photos en scannant les contenus de la zone à lecture automatique (ZLA).
  • Photo (Comment faire Exemple de code
  • Optimisé pour lire les images contenant du texte difficile à lire.
  • Capture d'écran (Guide pratique Exemple de code

    • Optimisé pour lire les captures d'écran contenant du texte difficile à lire.

Concurrence

  • Monothread et Multithread (Comment faire Exemple de Code
  • Prise en charge asynchrone (Comment faire Référence API)
  • Jeton d'Annulation (Exemple de Code)
  • Permet aux utilisateurs de suspendre le thread en cours pendant une période spécifiée en millisecondes dans le cas de la lecture d'un fichier d'entrée volumineux et d'un blocage pendant l'exécution du programme ou de l'application.
  • Timeout (Exemple de code)

    • Fournit un délai optionnel en millisecondes, après lequel la lecture OCR sera annulée.

Vision par ordinateur

Comment faire Référence API

  • Utilisez la vision par ordinateur pour trouver du texte basé sur nos modèles avancés entraînés. IronOCR utilise OpenCV pour utiliser la vision par ordinateur afin de détecter les zones où se trouve du texte dans une image. Cette fonction est utile pour les images contenant beaucoup de bruit, les images dont le texte se trouve à plusieurs endroits différents et les images dont le texte est déformé. L'utilisation de la vision par ordinateur dans IronOCR déterminera où se trouvent les régions de texte et utilisera ensuite Tesseract pour tenter de lire ces régions.

Entrée OCR

Exemple de code

Lire à partir de nombreux formats

Filtres

  • Assistant de Filtrage (Exemple de Code Référence API)
  • Si vous ne savez pas quel filtre appliquer à l'image, Filter Wizard fournit la liste des filtres adaptés à OcrInput en utilisant une approche de force brute qui renvoie la combinaison avec le maximum de confiance.
  • Filtres d'images OCR (Comment faire Tutoriel Exemple de Code

    • Sharpen (Référence API)

      * Permet d'accentuer la netteté des documents OCR flous. Aplatit les canaux Alpha en blanc.
    • EnhanceResolution (Référence API)

      * Améliore la résolution des images de faible qualité.
    • Denoise (Référence API)

      * Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque l'on s'attend à ce qu'il y ait du bruit. Aplatit les canaux Alpha en blanc.
    • Dilate (Référence API)

      * Morphologie avancée. la dilatation ajoute des pixels aux limites des objets d'une image. En face de Erode
    • Erode (Référence API)
  • Morphologie avancée. l'érosion supprime les pixels sur les limites de l'objet. Opposé à Dilater
  • Correction de l'orientation de l'image (Guide pratique Tutoriel Exemple de Code

    • Rotate (Tutoriel Référence API)

      * Fait pivoter les images d'un certain nombre de degrés dans le sens des aiguilles d'une montre. Pour une rotation dans le sens inverse des aiguilles d'une montre, utilisez des nombres négatifs.
    • Deskew (Tutoriel Référence API

      * Fait pivoter une image de manière à ce qu'elle soit dans le bon sens et orthogonale. Ceci est très utile pour l'OCR car la tolérance de Tesseract pour les scans biaisés peut être aussi basse que 5 degrés
    • Échelle (Tutoriel Référence API
  • Met à l'échelle les pages OcrInput de manière proportionnelle.
  • Corriger les couleurs de l'image (Comment faire Tutoriel Exemple de Code

    • Binarize (Tutoriel Référence API

      * Ce filtre d'image transforme chaque pixel en noir ou en blanc, sans solution intermédiaire. Peut améliorer les performances de l'OCR en cas de contraste très faible entre le texte et l'arrière-plan.
    • ToGrayscale (Référence API)

      * Ce filtre d'image transforme chaque pixel en une nuance de gris. Il est peu probable qu'il améliore la précision de l'OCR, mais il peut en améliorer la vitesse.
    • Inverser (Tutoriel Référence API

      * Inverse toutes les couleurs. Par exemple, le blanc devient noir : le noir devient blanc.
    • ReplaceColor (Référence API)

      * Remplace une couleur dans une image par une autre couleur avec un certain seuil.
    • SelectTextColor (Référence API)

      * Remplace une couleur dans une image par une autre couleur avec un certain seuil.

Appliquer une région de culture

Résultat du ROC

Sortie de données simple

Comment Faire Exemple de Code

  • Chaînes de texte .NET
  • Données de codes-barres et de codes QR
  • Images

Sortie de données structurées

Comment Faire Exemple de code

  • Pages
  • Blocs
  • Paragraphes
  • Lignes
  • Mots
  • Caractères

Exporter des documents

Surligner le texte d'une page pour le déboguer

  • Dessiner des boîtes rouges autour des caractères/mots/lignes/paragraphes détectés pour les mettre en évidence, et les enregistrer au format .png pour le débogage.

Statut et analyse