Imaginez que vous ayez cent bons de commande et que chacun contient une grande quantité d’informations, y compris, sans toutefois s’y limiter, les matériaux demandés et les exigences de livraison. Sans la technologie OCR (reconnaissance optique de caractères), vous devez analyser et saisir manuellement les informations importantes dans le système dans le cadre d’un processus long et sujet aux erreurs humaines. Grâce à l’utilisation d’un moteur OCR, tel que celui que nous avons implémenté dans OMS+, les commandes sont automatiquement analysées et les informations mappées dans le système.
Les moteurs OCR populaires qui existent aujourd’hui peuvent gérer les types de fichiers les plus courants, tels que pdf, jpg, jpeg, png, etc. Certains peuvent gérer des documents de plusieurs pages. Textract d’Amazon prend en charge le traitement multilingue : actuellement anglais, espagnol, italien, portugais, français, allemand ; ainsi que l’écriture manuscrite pour l’anglais. Dans un prochain article, nous ferons une comparaison détaillée des moteurs OCR les plus populaires. L’OCR, comme toute technologie d’apprentissage automatique, n’est pas parfait et pour obtenir les meilleurs résultats, il convient de prendre en compte les éléments suivants :
-
Fournissez des images de plus haute définition, idéalement au moins 150 DPI.
-
Si votre document est déjà dans l’un des formats de fichier pris en charge par le moteur OCR, ne le convertissez pas et ne le sous-échantillonnez pas avant de le télécharger sur le moteur OCR.
-
La fonctionnalité de tableau fonctionne mieux lorsque les tableaux de votre document sont visuellement séparés des éléments environnants sur la page (par exemple, pas superposés sur une image ou un motif complexe) et que le texte du tableau est vertical (par exemple, pas pivoté par rapport à un autre texte sur la page). )
Outre les exigences de préparation des données pour faire fonctionner les moteurs OCR, ceux qui recherchent la technologie OCR dans le cadre de leur solution doivent aligner leurs besoins et attentes commerciaux sur ce qui existe sur le marché. Most customers are exploring applications of OCR in their businesses to solve one main problem: Automate the manual process of data entry from documents received into business systems.
Cela signifie que les clients recherchent une solution complète qui va au-delà de l’OCR :
-
Lire du texte dactylographié et manuscrit à partir de documents et d’images (OCR)
-
Mapper le texte reconnu aux attributs commerciaux critiques (étiquetage)
La plupart des applications d’OCR existantes sur le marché peuvent effectuer une reconnaissance de texte (point 1 ci-dessus) avec une bonne précision. Cependant, il faut être prudent lors de l’évaluation de la manière dont le moteur OCR étiquette le texte reconnu. Les moteurs OCR facilement disponibles sur le marché aujourd’hui sont formés avec des données générales et peuvent ne pas être conçus pour les commandes ou les factures. Ainsi, la plupart des textes ne seront pas étiquetés de la manière que nous souhaitons spécifiquement.
La raison pour laquelle nous devons garder les étiquettes cohérentes est que SAP nécessite une manière très spécifique d’étiqueter les données afin de former une commande. Cependant, l’étiquetage des moteurs OCR trouve généralement simplement la relation entre les cases et le titre comme dans les figures ci-dessous. Comme vous pouvez le constater, des données similaires sous différentes formes sont étiquetées de manières très différentes. Cependant, afin de permettre à SAP de créer directement une commande à l’aide des données OCR, nous devrons rendre l’étiquette cohérente. (c’est-à-dire que l’étiquette « customer_name » ne sera pas « customer name » ou « CustomerName »). Il est impossible pour le moteur OCR d’atteindre cette cohérence. Il est donc essentiel de créer une couche supplémentaire capable d’étiqueter les textes de manière cohérente et précise. Cette couche supplémentaire préparera les données texte spécifiquement pour la création SAP.
Dans une application d’OCR dans OMS+, le processus de création de commande est optimisé à partir du moment où une commande d’achat arrive du client jusqu’à une commande client créée dans SAP. L’interface utilisateur facile à utiliser d’OMS+ organise le texte reconnu ainsi que les étiquettes prédites dans un ordre prêt à être traité dans SAP. Comme pour tout type d’application d’apprentissage automatique, la gestion des erreurs constitue une partie importante de l’équation, à mesure que les prédictions se rapprochent d’une précision de 100 % au fil du temps. Par conséquent, toute application qui exploite l’OCR pour prédire les étiquettes du texte d’un document doit permettre une gestion efficace des erreurs de reconnaissance et de prédiction.
Trois points sont particulièrement importants lors du choix d’un logiciel permettant l’OCR pour tout type de processus métier :
-
L’application, que la technologie OCR utilisée soit développée en interne ou intégrée par un tiers comme Google Document AI, doit être adaptée au cas d’utilisation particulier afin que le texte reconnu qui n’est pas utile au scénario soit filtré.
-
L’application doit permettre à l’utilisateur d’examiner et de réviser efficacement les prévisions afin de préparer la prochaine étape du processus.
-
L’application doit collecter des données à partir des commentaires des utilisateurs, telles que des révisions, à utiliser dans un cycle d’apprentissage automatique itératif.
OMS+ OCR fait partie de la fonction de traitement automatisé des commandes OMS+. L’ensemble de la fonction est un « gâteau à trois couches », un terme inventé par notre ingénieur logiciel senior lors de la création de la solution.. Le moteur OCR joue le rôle de première couche. Les deuxième et troisième couches distinguent OMS+ OCR du moteur OCR standard.
-
Reconnaissance de texte : les fichiers contenant les bons de commande des clients sont récupérés dans OMS+ et OMS+ envoie les documents au moteur OCR via un appel API. Le moteur OCR analyse ces documents de commande et renvoie le texte reconnu à OMS+.
-
Prédiction des étiquettes : Cependant, comme les moteurs OCR sont gérés par des tiers en tant que services, ils sont pour nous comme une boîte noire. Nous saisissons des données et obtenons une sortie sans savoir comment la sortie est générée. Le format de sortie et les données sont fixes, ce qui ne nous donne pas beaucoup de flexibilité pour modifier ces données directement depuis le moteur OCR. De plus, la plupart des moteurs OCR offrent une fonctionnalité d’analyse des données texte, qui seront automatiquement étiquetées par les moteurs OCR. Mais les étiquettes du moteur OCR manquent de précision. Ainsi, nous devons créer des couches supplémentaires pour analyser le résultat qui étiqueteraient correctement la plupart du texte (John Smith comme nom, 800-555-7777 comme numéro de téléphone, etc.). Nous utilisons SAP Intelligence pour analyser la sortie du moteur OCR. Le processus d’analyse (appelé Bulk) consiste à étiqueter le texte par nous-mêmes. Bulk comporte deux étapes. Dans la première étape, nous utiliserons un modèle d’apprentissage automatique pour déterminer si ce texte est utile pour nous et filtrer le texte inutile. Dans la deuxième étape, nous utiliserons un autre modèle d’apprentissage automatique pour étiqueter le reste du texte.
-
OMS+ extraira les données matérielles et les enverra à notre modèle de recherche de matériaux, qui est également hébergé par SAP Data Intelligence Le modèle de recherche de matériaux passera par chaque matériau d’entrée. Transformez les descriptions et recherchez les éléments correspondants dans la base de données clients. Les articles seront extraits et automatiquement placés dans un tableau de commande SAP. Une fois que tout le matériel est placé dans ce tableau de commande SAP, le tableau sera renvoyé à OMS+ et s’affichera joliment pour les utilisateurs. Bien entendu, vous pouvez modifier toutes les données de cette page OMS+. Ensuite, une commande SAP avec les articles requis est générée.
Comme vous pouvez le voir, les deuxième et troisième couches sont construites par DataXstream. Ces deux modèles d’apprentissage automatique devenir de plus en plus intelligent chaque jour à mesure que l’entreprise l’utilise pour analyser et créer des commandes Ces modèles d’apprentissage automatique peuvent apprendre à catégoriser automatiquement les données d’entrée .Plus ils reçoivent de données, plus ils obtiendront de précision de catégorisation et d’étiquetage.