2017 Schuhe - Damen - Cobb Hill Tori Wine Wine Wine Lace-Ups - Deutschland UNF50015332 451b33

Natural Language Processing (NLP) ist der Oberbegriff für das Erkennen, Erzeugen und Darstellen natürlicher Sprache durch den Computer. Für ein Unternehmen kann die Befähigung Texte automatisiert zu verarbeiten  sowohl massive Zeitersparnis bedeuten, als auch gänzlich neue Möglichkeiten eröffnen.

 

Wir betrachten die Möglichkeiten und Methoden von NLP anhand eines Beispielprojektes, der Auswertung von Tätigkeitsberichten von Feldtechnikern. In diesem Beispiel geben die Feldtechniker ihre Berichte in einer Online-Maske als Freitext ein. Es werden über zahlreiche Techniker und Standorte hinweg hunderte Berichte pro Tag generiert, oftmals mehrere Berichte zum gleichen Problem. Die damit einhergehenden Herausforderungen beinhalten nicht nur potentielle Schreibfehler, sondern auch unterschiedliche Sprachen oder das Einfügen langer technischer Logs.

2017 Schuhe - Herren - CAT Footwear Streamline EH CT Oxford Schwarz/Blau Lace-Ups - Deutschland BET8003021,Frauen Adidas Originals Sneaker Rosa Adidas Originals Everyn W Wonder Rosa Heißer Verkauf Schuhe Größe 9 UK 10 4 4 -2017 Schuhe - Damen - KEEN Concord Slip On Cascade Braun Slip-Ons - Deutschland NOA40039741,Frauen New Balance Sneaker Blau New Balance Wl 420 Fsb Heißer Verkauf Schuhe Größe 10 UK 9 7.5 9 -,2017 Schuhe - Damen - Chaco Abril Violet Quartz Sandalen - Deutschland INK600403732017 Schuhe - Kinder - Lacoste Kinder Marcel Sneaker Grade School Dark Grau Canvas Sneakers & Athletic Schuhe - Deutschland NQQ70039459,2017 Schuhe - Damen - Bass Harlem Sea Rock Suede Sandalen - Deutschland VBV30036418,2017 Schuhe - Herren - Alegria Alex Café Wax Nubuck Lace-Ups - Deutschland QFG50034390,Frauen Nike Sneaker Rot Nike Roshe Two Flyknit Sneaker Heißer Verkauf Schuhe Größe 7.5 UK 4 8.5 6 -,2017 Schuhe - Damen - Ahnu Tullia Eggplant Mary Janes - Deutschland UCM60022007,2017 Schuhe - Damen - Rockport Total Motion 55mm Quarter Strap Schwarz Smooth Casual Sandalen - Deutschland YIM3001699,2017 Schuhe - Damen - Crocs™, Inc. A-Leigh Leder Wedge Sandale Schwarz/Gold Sandalen - Deutschland OJZ0006563,2017 Schuhe - Damen - Clarks Lexi Alloy Schwarz Leder Sandalen - Deutschland UXP4008878,2017 Schuhe - Herren - Johnston & Murphy McGuffey Perfed Slip-On Taupe Nubuck Slip-Ons - Deutschland SOW30010609Männer New Balance Sneaker Grau New Balance U 520 Af Heißer Verkauf Schuhe Größe 4 UK 6 5.5 3 -,Frauen Lacoste Sneaker Blau Lacoste Carnaby Evo Bl 1 Spw Lässige Schuhe Größe 4.5 UK 3 4 6 -,Männer Nike Sneaker Schwarz Nike Air Jordan 9 Nrg Basketball Schuhe Größe 7.5 UK 4.5 7 9 -,Männer Nike Sneaker Grau Nike Blazer Zoom Niedrig Xt Basketball Schuhe Größe 10 UK 8.5 9 4.5 -2017 Schuhe - Damen - Kork-Ease Adel Golden Sand Full Grain Sandalen - Deutschland LIJ80034601,Frauen Reebok Sneaker Braun Reebok Face Hi 35 Heißer Verkauf Schuhe Größe 8.5 UK 10 7.5 7 -2017 Schuhe - Herren - ASICS® GEL-Equation® 8 Lightning/Electric Blau/Schwarz Sneakers & Athletic Schuhe - Deutschland PLK50031862,2017 Schuhe - Herren - Nautilus Safety Footwear 1801 Waterproof EH Comp Toe Safety Schuhe Schwarz/Blau Lace-Ups - Deutschland TGX00036155,2017 Schuhe - Herren - Aetrex Monterey Adjustable Sandale Braun Sandalen - Deutschland CDH30029514,2017 Schuhe - Damen - Taos Laka Schwarz Stiefel - Deutschland IJY80016634,2017 Schuhe - Damen - Eastland Currant Braun Leder Clogs & Mules - Deutschland KYJ300307322017 Schuhe - Damen - Azura Aketi Schwarz Sandalen - Deutschland RYE5005201,Frauen Puma Sneaker Weiss Puma Vikky Platform Patent Heißer Verkauf Schuhe Größe 8.5 UK 4 6 7.5 -2017 Schuhe - Damen - Mia Fiji Fuschia Sandalen - Deutschland SEE90031363,2017 Schuhe - Damen - Think! Soso Stone Thong KROT/Kombi Sandalen - Deutschland FVD10025251,2017 Schuhe - Herren - Clarks Slaten Free Denim Canvas Slip-Ons - Deutschland KWI50014266,

Zielsetzung ist als erstes eine Kategorisierung der Berichte um Themenschwerpunkte zu ermitteln. Weiterführend sollen durch die gesamtheitliche Auswertung Erkenntnisse generiert werden welche durch das lesen einzelner Berichte nicht zu gewinnen sind. Dazu werden die Berichte mit weiteren Daten verknüpft welche Rahmenbedingungen beinhalten. Zum Beispiel ob die Reparatur Erfolg hatte, wie aufwendig sie war, Daten über den Standort und die verwendete Technik.

Workflow Natural Language Processing

2017 Schuhe - Damen - Clarks Leisa Bora Schwarz Sandalen - Deutschland YVY000229,

Kommen wir zum interessanten Teil, der eigentlichen Verarbeitung. Bevor der Computer in der Lage ist die Tätigkeitsberichte zu verstehen müssen einige vorbereitenden Schritte erfolgen. Zuerst ermitteln wir die Sprache des jeweiligen Berichtes. Dazu werden im Text Buchstaben und Buchstaben Tupel gezählt, diese stehen in verschiedenen Sprachen in unterschiedlichem Verhältnis zueinander. Bereits nach einem Satz ist mit dieser Methode eine Genauigkeit erreicht welche die Erkennung der Sprache quasi fehlerfrei macht. Auch die technischen Einträge können auf diese Weise bereits identifiziert werden.

Männer K1x Sneaker Rosa K1x Encore High Heißer Verkauf Schuhe Größe 3 UK 10 4.5 4 -,

Als nächstes erfolgt mit Hilfe von Wortlisten und Dictionaries eine Sprachspezifische Verarbeitung. Es werden sogenannte Stop-Worte entfernt. Füllworte welchen im Rahmen der Sprachverarbeitung keine weitere Bedeutung zugemessen wird. Der erste Satz könnte dann so aussehen: „Natural Language Processing [ist] Oberbegriff Erkennen Erzeugen Darstellen natürlicher Sprache [durch] Computer“. Wenngleich sich dies für einen Menschen holprig liest nähert sich der Rechner einer Struktur an die er verstehen kann. Manche der Stop-Worte werden zwar entfernt, ihre Position und Bedeutung wird aber in den Metadaten zum Text beibehalten (ist,durch).

Männer Reebok Sneaker Schwarz Reebok Club C 85 Gs Heißer Verkauf Schuhe Größe 8.5 UK 7.5 7 5.5 -,

Der nächste Schritt ist das Stemming. Dabei werden die einzelnen Wörter auf ihren Wortstamm zurückgeführt. Dies kann anhand von Regeln oder Dictonaries erfolgen. Der verbleibende Text ist nun bereits in einer Form in der er vom Rechner grob verarbeitet werden kann. Zum Beispiel durch einfache Aufzählung der Worte in den Texten. Dadurch lassen sich bereits Themengebiete oder Zusammenhänge ermitteln.

2017 Schuhe - Herren - Vionic with Orthaheel Technology Stephen Schwarz Slip-Ons - Deutschland ELX80017759,

2017 Schuhe - Damen - Cobb Hill Tori Wine Wine Wine Lace-Ups - Deutschland UNF50015332 451b33

Ein interessanter Schritt ist nun ein weiterer Abstraktionsschritt. Dabei werden die Wortstämme und ihre Synonyme auf ein abstraktes Token zurückgeführt. Dies kann nun auch sprachübergreifend erfolgen. Damit ist unabhängig von der Ausgangssprache der Texte jeder Text mit seinem Inhalt maschinell erfasst. Erneut bietet sich an Kategorien zu bilden um bestimmte dominierende Themengebiete zu ermitteln welche mit der Tätigkeitsberichten in Zusammenhang stehen.

2017 Schuhe - Damen - Cobb Hill Tori Wine Wine Wine Lace-Ups - Deutschland UNF50015332 451b33

Neben den nun strukturierten Texten fließt nun ein semantisches Netz in die weitere Auswertung mit ein. Damit können nun Zusammenhänge erkannt werden welche vorher dem Rechner verborgen waren. Verschiedene Begriffe können zum gleichen Überbegriff gehören, wodurch Kategorien noch präziser Bestimmt werden können.  Weitere Techniken wie Entscheidungsbäume können nun zur Klassifikation ebenfalls eingesetzt werden.

Nun ist bereits das Zwischenergebnis erreicht das die eingehenden Tätigkeitsberichte der Feldtechniker automatisch klassifiziert und Kategorisiert werden können. Um die weiterführenden Ziele zu erfüllen werden nun mit der vorliegenden Datenbasis verschiedene Varianten des Machine Learning angewendet. Dabei werden zum Beispiel Modelle darauf trainiert einen Zusammenhang zwischen einer erfolgreichen Reparatur und den Tätigkeitsberichten herzustellen. Die bereits erzeugten Kategorien werden genutzt um verschiedene Fehlerbilder zu unterscheiden und aufgrund der künstlichen Erfahrung über alle Tätigkeitsberichte werden je Fehlerbild erfolgversprechende Maßnahmen ermittelt.

Das System kann nun für Feldtechniker einen nennenswerten Mehrwert schaffen, da diese nun bei Arbeiten am Standort das Fehlerbild in einer Applikation beschreiben können und der Rechner ihnen bereits Vorschläge zum Vorgehen unterbreiten kann.

 

Autoren: Oliver Werth & Sophie Blank