Qualité des données : Un facteur crucial pour la réussite de l'IA dans le service à la clientèle

5 min de lecture
Partager
L'importance de la qualité des données pour le succès de l'IA dans le service client

Si vous avez déjà été attiré par les mots "intelligence artificielle" dans un argumentaire de vente ou si vous vous êtes demandé si l'apprentissage automatique pouvait améliorer votre activité, vous vous êtes peut-être aussi demandé si votre cas d'utilisation correspondait bien à ce que peut faire un modèle d'apprentissage automatique.

Une bonne façon de répondre à cette question est de considérer les données que vous devez fournir à ce système artificiellement intelligent pour qu'il produise le résultat promis en matière d'expérience client. Cela semble être un échange raisonnable, mais êtes-vous sûr de savoir ce que l'on entend par "données" dans ce contexte ?

Qu'est-ce que les données ?

Supposons que vous soyez intéressé par un modèle d'apprentissage automatique capable de prédire la raison du contact pour les courriels d'assistance entrants (surprise : il s'agit de Kustomer IQ !). Le modèle a besoin de voir des exemples de conversations d'assistance précédentes et la façon dont elles ont été étiquetées afin d'apprendre ce qu'il faut faire lorsque de nouveaux courriels non étiquetés apparaissent à l'avenir. Ces exemples constituent vos données : une collection d'entrées et de sorties appariées à partir desquelles un modèle d'apprentissage automatique extraira des modèles pour faire des prédictions.

L'importance de la qualité des données pour le succès de l'IA dans le service client

Dans ce cas, c'est à vous de déterminer les entrées ("Email d'assistance entrant") et les sorties ("Raison du contact") et les paires d'entrée-sortie qui représentent le mieux les prédictions que vous voulez que le modèle fasse. D'une manière générale, plus vous exposez la machine à des données, plus elle devient intelligente.

C'est logique ? Il s'agit de données. Sans données, les modèles d'apprentissage automatique ne peuvent pas fonctionner. Et un modèle d'apprentissage automatique n'apprend qu'à partir de ce qui se trouve dans les données d'apprentissage : ce qui n'apparaît pas explicitement dans l'ensemble de données restera inconnu du système.

La qualité des données dans le service à la clientèle

Comme nous l'avons dit précédemment, les modèles extraient des modèles afin d'appliquer des résultats. Vous remarquerez que dans le diagramme ci-dessus, nous n'avons pas indiqué au modèle comment nous avons pu déterminer la raison du contact. Nous prévoyons simplement de montrer des exemples d'entrées-sorties et nous espérons qu'il finira par trouver un moyen de déduire la "raison du contact" à partir d'un "courriel d'assistance entrant". C'est là que la qualité des données devient importante : si nous fournissons au modèle des données de mauvaise qualité, le modèle créera de mauvais modèles et, en fin de compte, des prédictions incorrectes.

Les données de mauvaise qualité sont bruyantes, contradictoires ou comportent trop peu d'exemples. Dans le diagramme ci-dessus, le dernier e-mail d'assistance entrant a été classé comme "échange". Nous avons déjà mentionné que c'est à vous de déterminer la sortie dans l'ensemble de données de formation, donc vous ou l'un de vos agents avez décidé que la raison du contact était un échange. Que se passe-t-il si un autre agent décide que la raison du contact est un "retour" ? Techniquement, un retour peut être nécessaire pour qu'un échange ait lieu, de sorte que l'agent a estimé que la catégorisation du retour était logique.

Que se passerait-il si vos agents commettaient cette erreur 50 % ou 25 % du temps ? Cela signifie que vos données d'entraînement ne reflètent pas la vérité de ce que vous voulez que le modèle prédise - parfois la conversation est étiquetée comme un "échange" et parfois le même type de conversation est étiqueté comme un "retour", mais il devrait toujours s'agir d'un échange. Dans ce cas, le modèle extraira un modèle qui pourrait ne pas l'amener à déduire de manière cohérente le motif de contact que vous préférez pour les futurs courriels d'assistance entrants.

C'est un exemple de l'une des principales causes de la mauvaise qualité des données : des limites floues et conflictuelles entre les catégories ou les sujets.

Voici les caractéristiques que doivent présenter vos données pour être considérées comme étant de "haute qualité" par Kustomer normes du QI:

  • Hétérogénéité (ce qui est démontré dans le scénario ci-dessus) : Des frontières claires et distinctes entre les différents tags et attributs.
  • Stabilité : Pas de grands changements de re-catégorisation 60-90 jours avant l'entraînement du modèle.
  • Volume : Entre 5 000 et 7 000 conversations par courriel au cours du mois précédent, soit environ 500 conversations par sujet.

Recommandations pour la création de données de haute qualité pour Kustomer IQ

Kustomer IQ s'appuie sur des modèles d'apprentissage automatique pour prédire les motifs de contact avec les clients et suggère des raccourcis de conversation aux agents. Il est important que vous disposiez de données de haute qualité pour que ces modèles fonctionnent comme prévu.

Il existe un certain nombre de mesures que vous pouvez prendre pour garantir la meilleure qualité de vos données et tirer parti de l'automatisation dès le début. Voici nos recommandations:

  • Concevez les balises et les champs personnalisés qui répondent le mieux à vos besoins. S'il est impossible de couvrir tous les cas, essayez de vous concentrer sur les plus importants en termes de volume attendu. Par exemple, l'état des commandes, les retours et les remboursements, ou les codes promotionnels.
  • Créez de nouvelles balises pour couvrir les informations non étiquetées plutôt que de tout redéfinir et remapper à partir de zéro.
  • Ajoutez de la granularité de façon progressive. Dans la mesure du possible, commencez par une grande catégorie, comme les animaux de compagnie, avant d'essayer de la diviser en plusieurs catégories plus spécifiques, comme les chats, les chiens ou les oiseaux.
  • Essayez d'utiliser des balises et des catégories clairement définies pour organiser vos informations. Une bonne règle de base est de les tester avec des personnes. Si votre équipe comprend correctement leurs limites et sait quand les appliquer, un algorithme d'apprentissage automatique sera capable d'en comprendre la signification.
  • Essayez de faire en sorte que votre équipe travaille de manière aussi cohérente que possible. Là encore, il est plus facile d'y parvenir lorsque les limites des balises sont claires.
  • Essayez de conserver des données stables pendant un certain temps afin de pouvoir augmenter le nombre d'exemples utilisant vos balises et vos champs personnalisés. Bien que vous puissiez itérer et redéfinir vos étiquettes et vos champs personnalisés à tout moment, le fait de modifier régulièrement ces informations affectera la quantité de points de données que vous obtiendrez. N'oubliez pas non plus que toute redéfinition des balises et des catégories nécessitera un nouvel entraînement du modèle.

Améliorez votre CX global avec Kustomer

L'analyse des données n'est qu'un des nombreux outils permettant de fournir un service client de qualité. Si vous avez besoin d'aide pour créer la meilleure expérience possible pour vos clients avec une solution logicielle de service client qui inclut le chat en direct, réservez une démonstration dès aujourd'hui.

Prêt à découvrir comment l'IA + les données + la gestion de la relation client sont synonymes de magie pour les clients ?

Voir le prixDemander une démo