Data Science in der Praxis,
am Beispiel «Einkaufsanalyse»

Data Science in der Praxis, am Beispiel «Einkaufsanalyse»
Grossansicht Bild
Trend-Analyse Preis
16.06.2020 | Data Science Algorithmen könnten in vielen Situationen einen Mehrwert für Sie und Ihre Unternehmung generieren. Im Folgenden wird das Vorgehen am Beispiel der Einkaufsanalyse exemplarisch demonstriert. Das Ziel des Praxisbeispiels ist es, Preisausreisser und Trends in den Einkaufsdaten zu finden, um anschliessend mit den erarbeiteten Informationen Preisverhandlungen mit Zulieferern starten zu können.

Schritt 1: Bedarf und Motivation
Ein Data Science Projekt beginnt mit einem oder mehreren Problem- und Fragestellungen – es braucht einen Bedarf. Diese Fragestellungen werden idealerweise in einem interdisziplinären Team bestehend aus Mitarbeitenden aus dem Fachbereich, internen «Data Ownern» (diese wissen welche Daten in der Unternehmung vorhanden sind) und Datenanalysten (Data Scientists) erarbeitet.

Praxisbeispiel: Jeder Franken im Einkauf zu viel bezahlt ist rausgeworfenes Geld und schmälert den Gewinn. Bei einer grossen Anzahl an Artikeln im Einkauf, hohen Stückzahlen, verschiedensten Zulieferern und einem Team mit mehreren Einkäufern ist es schwierig den Überblick über alle Einzelpreise zu behalten. Daraus resultieren folgende Fragestellungen:
  • Bezahlt die Unternehmung für gewisse Artikel zu viel?
  • Gibt es Anomalien in der Preisgestaltung? (z.B. Steigende Preise mit steigender Bestellmenge)
  • Wie verändern sich die Preise von ähnlichen Artikeln verschiedener Anbieter? Gibt es Abweichler?
 
Schritt 2: Datenabklärungen
In diesem Schritt geht es um die Abklärung der Verfügbarkeit, der Qualität und der Interpretation der Daten:
  • Welche Daten sind für die Beantwortung der Fragestellungen notwendig?
  • Sind diese Daten bereits vorhanden? Falls nicht: Können sie beschafft werden? Wie?
  • Gibt es Lücken oder systematische Fehler in den Daten? Können diese gefüllt und/oder korrigiert werden?
  • Wie werden die Datenfelder und deren Inhalte interpretiert? Welche Relevanz für den Fachbereich haben diese?

Wie die Bedarfseruierung ist auch die Datenabklärung ein «Team Effort». Nur mit Hilfe der Fachunterstützung können Datenanalysten die Daten im nächsten Schritt 3 korrekt selektieren, kombinieren, aufbereiten und interpretieren.

Praxisbeispiel: Die Artikelbestellungen sind im internen SAP vorhanden, aber auf mehrere Tabellen verteilt. Lücken gibt es augenscheinlich keine, die Artikel-Identifikationsnummer ist aber nicht in jedem Fall eindeutig und muss als Kombination dreier weiterer Felder generiert werden. Zudem sind die Preise nur jeweils in ihrer Lokalwährung vorhanden (CHF, USD, EUR). Für die Analyse müssen diese Währungen in eine Währung konvertiert werden. Die Spaltennamen in den Datentabellen sind abgekürzt und müssen erklärt werden. Die Datentabellen können als einfache CSV-Dateien (Komma-separierte Textdateien) exportiert werden.
 


Schritt 3: Machbarkeit (Proof of Concept)
Sind die Fragestellungen definiert und ist die Datenbasis geklärt, dann ist es an der Zeit einen Testdatensatz für eine Machbarkeitsstudie zusammenzustellen. Die Datenbeschaffung wird normalerweise durch einen internen Data Owner durchgeführt.

Die Datenanalysten bereiten in einem ersten Schritt die Daten auf, strukturieren sie, füllen Lücken und fügen weitere Datenfelder hinzu. Danach werden geeignete Algorithmen aus der Data Science auf die nun strukturierten Daten angewandt, deren Eignung evaluiert und Resultate verglichen. Einzelne interessante Resultate werden ausgesondert und speziell visualisiert, damit sie mit dem Gesamt-Team besprochen werden können.
Trotz sorgfältiger Vorbereitung ist es möglich, dass die Fragestellungen nicht oder nicht zu genüge beantwortet werde können. Deshalb wird die Machbarkeitsstudie auf einem reduzierten Datensatz und reduzierter Fragestellungen durchgeführt. So bleiben die initialen Kosten für die Datenbeschaffung, Aufbereitung und Analyse überschaubar.

Erst wenn demonstriert wurde, dass die Fragestellungen mit dem Testdatensatz beantwortet werden können, wird die Analyse auf weitere Daten und Fragestellungen ausgeweitet.

Praxisbeispiel: Als Analyseumgebung wird R Studio mit der Programmiersprache R gewählt – diese eignet sich hervorragend für Data Science Projekte. Der reduzierte Datensatz enthält nur einige wenige Artikel aus den letzten drei Jahren. Bereits mit dem reduzierten Datensatz und den einfachen Modellen lassen sich interessante Zusammenhänge hervorheben. Es wird entschieden, einen Prototyp mit Verbesserungen und dem gesamten Datensatz zu entwickeln.
 


Schritt 4: Durchführung der Analyse, Prototypenerstellung und Feldtest/User Feedback
Ist die Machbarkeit gegeben, so kann die Analyse auf den Gesamtdatensatz und weitere Fragestellungen ausgeweitet werden.

Ausserdem besteht die Möglichkeit, die Algorithmen und Modelle in einen Applikations-Prototyp einzubauen, inkl. automatischer Datenaufbereitung, Analyse, Visualisierung und Reporting, sodass später der Fachbereich die Analysen selbstständig und mit tagesaktuellen Daten durchführen kann. Ein solcher Prototyp wird idealerweise in mehreren Feldtests evaluiert und mit dem gesammelten User Feedback inkrementell den Bedürfnissen des Fachbereiches angepasst.

Als Plattform für den Applikations-Prototyp bieten sich viele Technologien an: Als Webservice in der Cloud mit z. B. Microsoft PowerBI, Tableau, SAP Analytics Cloud, R Server mit Shiny/R oder auch als Desktop-Applikation.

Praxisbeispiel: Mit Shiny/R wird ein lauffähiger Prototyp erstellt, der in mehreren Iterationen zusammen mit Mitarbeitenden aus dem Einkauf laufend verfeinert wird. Es werden neue Modelle hinzugefügt, neue Such- und Filterfunktionen, neue Visualisierungen zur Hervorhebung von interessanten Artikeln, sowie bessere Reporting- und Exportmöglichkeiten. Es lassen sich mit den Preistrendmodellen für gewisse Produkte Preistrends aufzeigen, die sich augenscheinlich nicht intuitiv verhalten oder «ausscheren». Weitere vertiefte Analysen und Abklärungen durch die Einkäufer bringen versteckte Preissteigerung zutage, welche mit dem Anbieter diskutiert werden und zu Preiskorrekturen führen. Diese amortisieren die Projektkosten innert kürzester Zeit.
 


Schritt 5: Übergabe in die Produktion und erweiterte Funktionalität
Nach erfolgreichem Testen des Prototyps kann die Applikation gänzlich oder teilweise in die bestehenden Infrastrukturen integriert werden. Beispielsweise lassen sich die entwickelten Analysen in produktive Pipelines, z. B. in SAP umsetzen. So kann der Fachbereich automatisch und täglich mit den neuesten Daten arbeiten. Ausserdem lassen sich weitere Automatismen entwickeln, wie zum Beispiel automatische Benachrichtigungen, falls Unregelmässigkeiten oder Preistrends entdeckt werden (Dashboard).
 


Fazit
Damit Data Science Projekte erfolgreich sind, müssen sie gut aufgegleist werden. Erfolgreiche Projekte haben folgende Gemeinsamkeiten:

  • Eine oder mehrere Fragestellungen, die aus einem Bedarf aus dem (Daily) Business entstanden ist
  • Ein interdisziplinäres Team, bestehend aus Mitarbeitenden aus dem Fachbereich, Data Ownern, und Datenanalysten, welches eng zusammenarbeitet und Entwicklungen in kurzen Zyklen miteinander evaluiert. Datenanalysten umfasst dabei Spezialistinnen und Spezialisten aus der Data Science, Datenvisualisierung, Data Engineers, UX Design, etc.
  • Eine gute Datenbasis oder die Möglichkeit, diese aufzubauen

Bewertung Ø:
   
Meine Bewertung:

Fragen und Kommentare (0)