SAP Data Intelligence for IA MLOps

Demandez à un expert saison 2 épisode 1

Xilin Cheng et Kathleen Taggart de DataXstream discutent de la création d’une automatisation intelligente (IA) et des avantages de l’utilisation de SAP Data Intelligence pour MLOps. L’équipe examine le problème auquel sont confrontés les distributeurs en gros lorsqu’ils tentent d’exécuter des devis et des commandes importantes avec précision et efficacité. Traditionnellement, cela nécessitait des représentants du service client (CSR) qui comprenaient SAP GUI et avaient des années d’expérience dans le secteur et passaient des heures à saisir des données. Avec l’automatisation intelligente, la reconnaissance optique de caractères (OCR) est utilisée pour lire du texte dans les modèles d’apprentissage automatique créés par Xilin. Il discute des techniques de traitement du langage naturel (NLP) utilisées en plus des avantages du développement de pipelines d’apprentissage automatique dans SAP Data Intelligence. pipelines in SAP Data Intelligence. Kathleen et Xilin abordent ensuite l’avenir de l’automatisation intelligente et le potentiel de l’utilisation de l’apprentissage automatique pour remporter davantage de contrats et améliorer l’expérience d’achat des clients.

Salut et bienvenue ! Merci de nous rejoindre aujourd’hui! Nous sommes ici avec Xilin Cheng et moi-même, l’hôte, Kathleen Taggart de DataXstream, nous allons passer en revue notre projet actuel Intelligent Order Creation et comment nous avons été intégrés au SAP Data Intelligence Content Sprint et comment nous avons pu collaborer avec eux. Ceux de SAP et les autres partenaires travaillent sur SAP Data Intelligence pour proposer des solutions innovantes vraiment intéressantes sur l’utilisation de la plateforme DI pour mieux servir nos clients. Alors Xilin, que diriez-vous de vous présenter et de nous raconter un peu votre parcours. Salut à tous, je m’appelle Xilin Chung, je suis développeur de logiciels chez DataXstream et je travaille également en tant qu’ingénieur en apprentissage automatique et, fondamentalement, je construis également l’infrastructure pour le cadre de test de DataXstream, mais aujourd’hui, nous allons nous concentrer sur le travail que nous avons réalisé autour de SAP Data Intelligence et le projet sur lequel nous travaillons. Kat va vous donner plus de détails à ce sujet.

Génial, merci Xilin, car il a mentionné qu’il est développeur de logiciels chez DataXstream. Nous nous connaissons depuis l’université, RAH ! tu as mis ta bague ? Et puis tous deux sont arrivés chez DataXstream juste après l’obtention de leur diplôme pour rejoindre l’équipe de développement d’apprentissage automatique. Depuis, je suis passé au marketing et je me concentre maintenant sur le marketing technique autour de l’intelligence des données et de l’automatisation des processus robotiques. Je suppose donc que nous allons simplement commencer par pourquoi nous sommes ici aujourd’hui. Pouvez-vous nous donner un aperçu rapide, un aperçu de haut niveau, de ce qu’est la création de commandes intelligente en premier lieu et de ce qu’elle fait pour nos clients, comment avons-nous commencé ce projet?

Ouais, absolument, donc tout ce projet a commencé avec une question commerciale très basique, alors supposons que le client envoie un bon de commande dans des fichiers PDF contenant 100 matériaux différents et des quantités différentes, pour chaque matériau, donc il faut généralement des heures aux gens pour saisir et rechercher ces matériaux dans les bases de données SAP un par un et essayez ensuite de former une commande SAP à partir de là. Il s’agit d’un processus long, très exigeant en main-d’œuvre, et beaucoup de travail répétitif et d’erreurs humaines sont généralement un facteur d’influence important pour conclure ou non cette transaction au cours de ce processus. C’est pourquoi nous construisons ce projet OMS+ Intelligent Order Creation, qui vise essentiellement à ce que l’IA effectue tout le travail répétitif à forte intensité de main-d’œuvre, mais de manière beaucoup plus rapide et beaucoup plus précise grâce à l’utilisation de la technologie OCR. Et nous avons également intégré avec succès les systèmes OMS+ et SAP, ce qui rend le projet très pratique pour toute organisation utilisant SAP. C’est essentiellement l’intention initiale du lancement de ce projet. Il s’agit d’aider nos clients, d’accélérer tout ce processus de création de commande. Surtout quand il y a un grand nombre de commandes impliquant une grande quantité de matériaux.

Absolument, cela améliore l’expérience client lorsqu’ils soumettent un devis, et ils le récupèrent en quelques heures, voire quelques minutes, au lieu de devoir attendre des semaines pour prévoir comment se dérouleront leurs projets, quelles seront les prévisions des budgets. . Je suppose que nous avons initialement vu ce projet surgir en 2020 lorsqu’un de nos clients essayait de le construire lui-même en interne et il a demandé « vous savez… pourriez-vous faire ça ? et nous nous disons « Ouais ! Absolument! Utilisez-vous une plateforme d’apprentissage automatique ou utilisez-vous l’intelligence des données ? » et ils avaient commencé avec ce système de classification et/ou un ingénieur senior en apprentissage automatique a pu intervenir et vraiment construire les algorithmes en utilisant la similarité cosinus en utilisant l’OCR pour améliorer le potentiel du produit que nous avions en cours et ils ont donc été très heureux avec les résultats, c’est vrai, et nous continuons à leur faire une démonstration et cela conduit également à d’autres projets. C’est donc vraiment excitant de voir comment cela a évolué.

Certainement, je pense que ce projet a beaucoup de potentiel pour s’étendre à d’autres domaines, il y a tellement plus de technologie que nous pourrons intégrer dans le prototype, cette base, du projet que nous avons déjà construit et je pense qu’il devrait être très flexible. pour satisfaire tous les besoins des clients en matière d’OCR ou de création de commandes ou même pour les moteurs de recherche dont nous parlerons plus tard.

Je pense que l’un des termes clés ici est l’automatisation des processus robotisés et que les gens se rendent compte que l’apprentissage automatique peut effectuer de nombreuses fonctions commerciales qui étaient traditionnellement effectuées par quelqu’un derrière le comptoir. Laissez ces gens sortir et utiliser leur temps plus judicieusement pour établir des relations avec les clients et laisser l’apprentissage automatique et l’automatisation des processus robotiques gérer les tâches de saisie manuelle des données qui sont si sujettes aux erreurs et, oui, nous pourrions nous enthousiasmer encore et encore sur le potentiel de le produit, mais voyons comment utilisons-nous l’intelligence des données SAP.

Je sais que vous savez que nous avons discuté avec certains de nos contacts SAP et qu’ils nous ont aidé à créer le produit, puis nous ont dit « vous savez, pourquoi ne rejoignez-vous pas notre Sprint de contenu ? Votre projet est tellement innovant et c’est un excellent exemple du potentiel de SAP DI » pourquoi avons-nous utilisé SAP Data Intelligence.

Tout d’abord, DataXstream est un partenaire de SAP, donc lorsque nous avons eu cette exigence de projet, nous les avons immédiatement contactés en leur disant : « Hé, vous avez une plate-forme d’apprentissage automatique que nous pourrions utiliser et ils ont dit oui, nous avons SAP Data Intelligence » et ils nous a donné une version d’essai et nous l’avons essayée et c’est une excellente plateforme de développement d’apprentissage automatique. Fondamentalement, un IDE d’apprentissage automatique avec tous les outils dont vous avez besoin pour développer des pipelines d’apprentissage automatique, mais avec une interface très simple, il n’y a pas de fonctions sophistiquées ou de complexité qui arrêtent le développement et rendent le développeur confus, c’est assez simple et très simple à utiliser et cela rend le Le processus de développement de l’apprentissage automatique et de création de pipelines est aussi simple que possible pour les ingénieurs en apprentissage automatique et les scientifiques de données comme moi et mes collègues. De plus, il s’agit d’un produit SAP, il est donc très simple à intégrer à tous les autres produits SAP. C’est essentiel pour les processus d’apprentissage automatique comme S4/HANA ou SAP Analytic Cloud. Il s’agit simplement pour un opérateur de se connecter et d’utiliser tout ce qui a déjà été intégré, et c’est très très simple. C’est pourquoi nous avons décidé d’opter pour SAP DI, non seulement parce que nous sommes des partenaires, mais aussi parce qu’il s’agit d’une excellente plateforme. Et pendant que nous faisions ce projet, l’équipe de support SAP DI nous a constamment aidé et au cours de ce processus, ils ont été vraiment intéressés par ce que nous faisons, ils nous ont donc proposé cette opportunité de sprint de contenu, essentiellement, du marketing. pour nos produits et grâce à notre produit, ils peuvent également commercialiser leur plateforme SAP Data Intelligence auprès d’un plus grand nombre d’utilisateurs, c’est donc une situation gagnant-gagnant. Et nous en sommes tous les deux heureux, donc je pense que le sprint de contenu a été un excellent événement pour diffuser nos produits, les exposer à un plus grand public et aux clients.

Et c’est vraiment formidable de voir ce que d’autres partenaires font également avec SAP Data Intelligence. Certains des autres participants au sprint de contenu SAP étaient également Camelot et ils l’utilisent pour l’automatisation/l’optimisation de la chaîne d’approvisionnement. Il est donc vraiment intéressant de voir comment les gens font preuve de créativité et d’innovation avec la technologie proposée par SAP Data Intelligence et qu’ils utilisent. la plate-forme pour créer ces outils fantastiques qui répondent à des problèmes très spécifiques des clients. Et c’est vraiment le début car après son lancement, nos produits continueront à croître et encore une fois, nous parlions de leur potentiel, mais j’espère qu’à mesure qu’il décollera, il y aura toute cette communauté autour de SAP Data Intelligence à laquelle nous pourrons nous référer. les uns avec les autres, nous pouvons collaborer sur la façon dont nous l’utilisons et explorer le potentiel de certains pipelines et même simplement des concepts d’apprentissage automatique et comment nous les avons développés dans nos produits pour les améliorer. Le potentiel est donc vraiment passionnant, et c’était la clé de votre rôle au sein de l’équipe d’intelligence artificielle ici, car vous travailliez sur les pipelines et vous étiez dans SAP DI tous les jours, programmant en Python, mettant en place des API entre nos systèmes, travaillant avec Avec les données que vous obteniez du backend SAP, pouvez-vous nous en dire un peu plus sur le travail que vous avez effectué sur le projet ?

Bien sûr, oui, je suis l’ingénieur en apprentissage automatique du projet. Je travaille essentiellement avec mes collègues pour concevoir le flux de travail d’apprentissage automatique, construire le pipeline basé sur le flux de travail dans DI, et manipuler et explorer des données pour former un tas de belles tables afin que la sortie soit utile et mieux intégrée dans nos systèmes backend et frontend. . Je collecte et crée également l’ensemble de données de formation, avec vous Kat, et j’utilise ces ensembles de données pour entraîner ces modèles d’apprentissage automatique hautement personnalisés afin de nous donner un meilleur résultat pour chaque client spécifique, car ils sont tous uniques. Il n’y aura pas de modèle général qui pourrait être appliqué à chaque client et nous souhaitons également que le client bénéficie de la meilleure précision et d’une expérience unique. Cela signifie que le modèle doit être hautement personnalisé. Donc, cela fait aussi partie de mon travail. Et nous gérons également l’intégration des moteurs OCR dans nos pipelines d’apprentissage automatique, donc oui, construisons essentiellement l’intégralité du pipeline. Integrating the OCR pipelines and have it ready to expand in the future.

Je sais que vous en avez fait beaucoup, en particulier en ce qui concerne les capacités de reconnaissance optique de caractères que nous avons intégrées à notre solution. Je sais que vous avez fait beaucoup de travail sur l’analyse de la façon dont nous allons traiter un bon de commande qui arrive et qui est manuscrit, ou comment allons-nous traiter un bon de commande dont le format est différent d’un autre, ou il peut s’agir d’un paysage horizontal ou d’un paysage vertical, car certaines de ces IA OCR apprenant automatiquement, elles recherchent vraiment la reconnaissance de formes et donc, lorsque vous lancez un bon de commande unique, cela peut être confus et le faire dérailler. Nous avons donc fait beaucoup de personnalisation en les formant à rechercher des types de texte et des étiquettes très spécifiques. Voulez-vous parler de tout cela ?

Oui, donc fondamentalement, le moteur OCR que nous utilisons est externalisé. Nous ne pouvons donc pas contrôler le résultat des moteurs OCR. Nous pouvons seulement saisir, faire fonctionner l’OCR et nous renvoyer le résultat. Donc, très souvent, car il s’agit d’un moteur général, beaucoup de données, comme les données de table, ne seront pas renvoyées à 100 % car cela dépend parfois de la structure du bon de commande. Cela pourrait être varié. C’est donc à nous de trouver un moyen de l’automatiser et de demander à nos modèles d’apprentissage automatique d’examiner ces données pour décider « oh, quelles sont ces données » et si ces données sont au bon endroit ou non. Sinon, disons qu’un numéro de matériau est étiqueté comme donnée non pertinente et qu’il sera rejeté et notre modèle d’apprentissage automatique empêchera cela, et fera en sorte que le numéro de matériau soit réellement étiqueté comme numéro de matériau et le placera au bon endroit. Ainsi, lorsque le client formule une demande sur le frontend, il aura la possibilité de la vérifier manuellement. Au lieu que ces données soient complètement supprimées et une fois les données transmises au frontend, le client a également la possibilité de modifier les données s’il les a mal étiquetées. Parce que le modèle d’apprentissage automatique ne sera pas précis à 100 %, mais nous disposons du système de rétroaction pour apprendre les erreurs avec un apprentissage renforcé. Ainsi, après tout cela, le modèle fera une erreur, puis étiquetera mieux les heures supplémentaires avec un type spécifique de données et le modèle deviendra de plus en plus personnalisé spécifiquement pour ce client.

Bien sûr, oui, et je suppose que l’un des avantages de notre solution est que nous avons l’avantage de pouvoir choisir le modèle OCR que nous aimons. Ainsi, à mesure que le marché évolue, même si de nouveaux concurrents émergent sur ce marché, nous sommes toujours en mesure de choisir les moteurs que nous aimons, les moteurs sont les meilleurs, les moteurs les plus performants, et cela peut changer et fluctuer à mesure que de nouveaux développements apparaissent. sur le marché de l’OCR. Et puis, comme vous en parliez également, nous avons le système de rétroaction, donc non seulement nous formons les modèles à comprendre spécifiquement l’OCR, ces tableaux qui proviennent du pipeline OCR, nous les filtrons en fonction de leur pertinence, mais nous sommes également nous avons construit le système de rétroaction de telle sorte que lorsque les clients utilisent l’interface, quel que soit leur niveau de compétence, s’ils interagissent avec la création de commandes intelligente, s’ils créent des commandes, les modèles apprennent déjà de leur utilisation et de leur performance. « Sur quels sont les modèles ? Qu’est-ce qui va bien ? Quelles choses sont corrigées et prédites de manière légèrement incorrecte ? Comment les prédictions peuvent-elles s’améliorer ? » Et il s’agit simplement de collecter ce journal de données afin que nous puissions revenir en arrière et comprendre véritablement ses performances et comment les optimiser pour le client.

C’est vrai, et cela revient en fait au point que je mentionnais plus tôt. Que ce projet a tellement de potentiel pour se développer à l’avenir. Et nous aussi, en plus de ce projet, nous avons également réalisé d’autres choses intelligentes de création de commandes autres que celle-ci. Nous avons donc réalisé le matériel et les moteurs de recherche de clients. Par exemple, parfois, la description du matériel sur le bon de commande ne sera pas exactement la même que la description SAP dans la base de données du client. Ainsi, ces deux moteurs seront capables d’analyser les descriptions et de renvoyer les matériaux ou les clients qui présentent la plus grande similitude. Et ces deux moteurs pourraient également être intégrés au projet de création de commandes intelligente sur lequel nous travaillons. De plus, le système de feedback dont nous avons parlé sera également intégré au système de création de commandes. Fondamentalement, il est si facile à utiliser dans le frontend qu’une personne sans aucune expérience technologique téléchargerait simplement le fichier et attendrait qu’il renvoie le résultat. Et cela formera automatiquement une demande pour vous, qui ressemble à la version modifiée de la commande SAP où l’utilisateur irait simplement examiner manuellement si la commande est correcte ou non. C’est énorme pour réduire le temps de traitement pour la création d’une commande et d’autres choses, et le modèle d’apprentissage automatique obtiendra la majeure partie de la commande correcte. Ainsi, certaines commandes, même obtenues, trouvent les mauvais matériaux dans votre base de données SAP à l’aide du moteur de recherche de matériaux, l’utilisateur pourra les corriger manuellement. Et une fois que l’utilisateur a corrigé tout cela, notre système de commentaires capturerait automatiquement toutes ces données et les renverrait à notre système de commentaires automatisé et ces systèmes de commentaires traiteraient automatiquement ces données et formeraient un tableau et une matrice sur de nombreuses fonctionnalités de ces données doivent être analysées plus en détail et ces fonctionnalités seront analysées plus en détail dans SAP dans le cloud analytique. Ainsi, après le cloud analytique, nous trouverons un moyen d’améliorer le modèle car les besoins de chaque client sont différents et il est de notre devoir de satisfaire les besoins individuels de chaque client concernant les caractéristiques des modèles. La manière de former le modèle n’est donc pas toujours la même, mais avec toutes ces données, nous serons en mesure de comprendre ce que recherche le client et d’améliorer les performances des modèles et, éventuellement, d’automatiser l’ensemble du système. Les commentaires serviraient directement à la formation du modèle et le nouveau modèle serait automatiquement appliqué au client la prochaine fois, afin que le modèle ne commette pas la même erreur que la dernière fois.

D’accord, et ce sera juste ce cycle continu, il ne sera pas perturbateur, les mises à jour seront poussées, les modèles seront améliorés, les modèles d’apprentissage automatique seront optimisés mais le client sur le front-end continuera simplement à fonctionner et, tout d’un coup, ses résultats s’améliorent de plus en plus dans les prévisions, à un moment donné, nous devrons faire des corrections très minimes. Et même dès le début, nos pourcentages de correction sont déjà corrects à 90 %. Lorsque vous regardez un bon de commande qui représente des milliers d’articles et qu’il aurait fallu, même à un représentant commercial très très expérimenté, des jours, voire des heures, mais toujours une quantité énorme de temps humain pour parcourir ces bons de commande, croisez -référencer sur le système interne de SAP tous les numéros… Oui, cela prendra, cela ne prendra que quelques minutes à notre recherche intelligente de matériaux pour renvoyer ces résultats et ensuite ce sera ce cycle continu de correction et de reconnaissance de modèles comme modèles continuer à se développer et à s’améliorer. Alors oui, il y a tout simplement un énorme potentiel à utiliser SAP DI comme plate-forme et quelles sont toutes les fantastiques capacités d’apprentissage automatique que vous pouvez construire en plus de cela.

Oui, absolument, et comme la base de données d’un client est généralement limitée, le client ne vend qu’une certaine quantité de matériel. Ainsi, chaque fois que la commande arrive, les modèles d’apprentissage automatique n’auront pas des millions de matériaux à apprendre ou à ajouter à l’index de recherche. Alors oui, le processus d’apprentissage par renforcement ne prendra pas très longtemps, il ne faudra pas longtemps avant que le modèle devienne assez précis, et cela dépend aussi de la façon dont le client forme ses descriptions. Cela pourrait être trop ambigu, c’est là que la puissance humaine interviendrait pour s’assurer que lorsque les modèles d’apprentissage automatique ont… disons… trois matériaux, s’ils trouvent trois matériaux avec une grande similitude et que cela dépend de l’humain de sélectionner lequel il s’agit. Et puis ces commentaires, cette sélection seraient renvoyés à notre système de commentaires, alors nous saurons « OK, c’est ce que le client a imputé et c’est ce que le client a recherché, donc c’est la bonne réponse et ce sont les questions et maintenant nous voulions le modèle pour apprendre, c’est la question, c’est la réponse et la prochaine fois, associez-les. En gros, c’est comme ça que ça marche.

Oui, et ce sera presque une interface de type navigateur. Vous continuez simplement et vous commencez à rechercher le matériel ou les données, il se peut que les données client soient des données matérielles, mais dans tous les cas, les algorithmes d’apprentissage automatique commenceront à détecter ces modèles et à fournir des recommandations afin que vous ne le fassiez pas. Je dois passer du temps à parcourir manuellement les chiffres et toutes les spécifications pour essayer d’obtenir le bon matériel. Pour trouver le bon matériel, il va simplement vous le présenter et vous choisissez ce dont vous avez besoin. Alors oui, le potentiel est incroyable et ça va être très excitant de voir ce qui continue de se passer avec notre suite d’automatisation intelligente et ce que nos partenaires continuent de développer avec l’intelligence des données SAP. Nous sommes impatients de voir toutes les solutions fantastiques qui seront construites sur cette plate-forme à l’avenir. Si vous souhaitez en savoir plus sur SAP Data Intelligence, veuillez consulter le contenu imprimé de SAP Data Intelligence, les liens sont ci-dessous. uilt on this platform in the future if you want learn more about SAP Data Intelligence please check out the SAP Data Intelligence contents print, links are below. Vous pouvez également venir nous rendre visite sur DataXstream.com où vous pourrez suivre ce podcast que nous commençons la série en demandant à la série de podcasts d’experts d’en savoir plus sur nos produits, le processus de développement, d’obtenir des informations des développeurs d’apprentissage automatique, des scientifiques des données, du produit à la tête du Développeurs d’interface utilisateur, tout le monde dans toute l’équipe. Et merci beaucoup d’être venus nous rejoindre aujourd’hui ! Nous espérons que vous apprendrez quelque chose d’intéressant et nous sommes impatients de collaborer avec vous à l’avenir. Au revoir pour l’instant! Au revoir, merci !

Pour plus d’informations, consultez le Data Intelligence Content Sprint de SAP.

Ou cliquez ici pour voir l’automatisation intelligente en action !