Statistik und Reports dürfen keine Vergangenheitsbewältigung sein

In Unternehmen werden verschiedenste Arten von Statistiken und Reports erstellt und regelmässig aktualisiert. Jede Abteilung legt sich ihre eigenen Kennzahlen, Ziele und entsprechende Auswertungen zurecht und überall fallen zahlreiche Arbeitsstunden dafür an. Diese Auswertungen sind natürlich eine Betrachtung der Vergangenheit und bestenfalls der aktuellen Situation. Die Vergangenheit kann aber nicht mehr verändert werden.

Reports die für den Benutzer keinen Nutzen in der Zukunft haben, gehören ersatzlos gestrichen. Eine Ausnahme bilden Buchhaltungsdaten. Nach meiner Erfahrung können unter dieser Voraussetzung die Hälfte aller Auswertungen eliminiert werden.

Beispielsweise Kundenstatistiken im Verkauf sollen in erster Linie dazu dienen Entwicklungsmöglichkeiten zu erkennen. Oder frühzeitig eine Verhaltensänderung von Kunden zu erfahren um entsprechend reagieren zu können. Meist ist es also nach wie vor so dass der Mitarbeiter einen Report erhält. Dieser enthält Zahlen und Informationen aus der Vergangenheit. Die Aufgabe des Mitarbeiters ist es nun zu analysieren, interpretieren und mögliche Massnahmen abzuleiten. Um ihm diese Arbeit zu erleichtern sollten Reports interaktiv sein. Ich kann also einen einzelnen Bereich genauer anschauen, oder mit einem Klick sehen welche Produkte meine Marge absinken liessen, oder welche Kunden am meisten unter Budget liegen und so meine Ziele gefährden, oder welche Produktgruppen bei welchen Kundengruppen am meisten oder wenigsten nachgefragt werden. Wenn ich das mit Listen erledigen möchte muss ich mit verschiedenen Listen arbeiten und die entsprechenden Einträge suchen. Deshalb sind Listen und Ausdrucke wenig geeignet und Erkenntnisse daraus zu gewinnen wesentlich zeitintensiver als mit einem interaktiven Dashboard.

Beispiele dafür gibt es genügend.

Durch die technologische Entwicklung kann der Mitarbeiter viel weiter begleitet werden. So können Teile der Analyse auch durch die Systeme übernommen werden. Beispielsweise eine Meldung an den Verkäufer wenn ein Kunde 3 Monate nichts mehr bestellt hat, oder keinerlei Kontakt zu unserer Firma hatte. Ein anderes Beispiel das bei Webshops gang und gäbe ist, und auch beim persönlichen Verkauf hilfreich wäre ist: „Kunden die dieses Produkt gekauft haben, oder dieses Verhalten aufweisen interessieren sich auch für diese Produkte.“

Hier gibts ein kleines Beispiel, wie ein solches Dashboard mit Microsoft Power BI aussehen könnte

Solche Funktionen waren in der Vergangenheit noch recht aufwändig. Mit modernen Datenanalyse Tools lassen sich derartige „intelligente“ Funktionen einfach einführen. Unterstützungsmittel die auf diese Art eingesetzt werden bieten den Mitarbeitern echte Unterstützung bei ihrer Arbeit und und helfen dabei die Ziele des Unternehmens effizienter erreichen zu können.

Wieso Reports aus ERP/CRM oft nur die zweitbeste Lösung ist

Die meisten Auftragsabwicklungen, CRM und ERP Programme ermöglichen es Reports zu erstellen um das Business zu analysieren. Wenn wir aber schauen wie sich das in der Praxis abspielt, entsteht der Verdacht dass solche Reports nur selten die Bedürfnisse der Anwender abdecken. Häufig wird nämlich dann Excel zur Hilfe genommen um die Ergebnisse so darzustellen das die verschiedenen Benutzergruppen auch damit arbeiten können. Ein grosser Nachteil von Auswertungen aus solchen Systemen ist die fehlende Flexibilität. So sind solche Reports sehr statisch und Anpassungen müssen oft durch den Dienstleister vorgenommen werden. Die aktuellen Anforderungen an Datenanalyse und die heutigen Unterstützungsmöglichkeiten sind kaum vorhanden oder nur aufwändig umzusetzen. Es reicht heute nicht mehr Umsatz- und Artikellisten täglich oder monatlich zur Verfügung zu stellen.

Heutige Systeme sollen die Mitarbeiter proaktiv unterstützen indem sie Benutzer beispielsweise darauf aufmerksam machen wenn ein Kunde schon länger nicht mehr bestellt hat, oder Kunden die A gekauft haben interessieren sich auch für B und vieles mehr.
Reports sollten an den Benutzer angepasst sein. So benötigt der Verkauf andere Zahlen als der Verkaufsleiter, dieser wiederum andere als die Geschäftsleitung. Die Datenbasis ist immer dieselbe nur die Darstellung und der Detaillierungsgrad sind unterschiedlich. Excel kann hier helfen, meist ist aber Handarbeit angesagt was zeitintensiv ist.
Um einen wirklichen Nutzen aus den Zahlen zu ziehen reichen übliche Listen nicht mehr aus. Die Reports oder Dashboards sollten es ermöglichen interaktiv schnell interessante Punkte oder einzelne Kunden zu analysieren.

Und all das muss möglichst aktuell und automatisiert zur Verfügung gestellt werden. Spezialisierte BI Tools wie Microsoft PowerBI bieten genau diese Möglichkeiten an. Sie ersetzen keine bestehenden Systeme, ergänzen sie aber sinnvoll durch die genau auf diese Bedürfnisse angepassten Funktionen. Wenn Sie regelmässig in der Situation sind, dass Sie Excel für Auswertungen zu Hilfe nehmen, oder die vorhandenen Reports Ihre Fragen nicht beantworten können, dann sollten Sie sich Microsoft PowerBI einmal anschauen.

Dieses Kurzvideo gibt einen kurzen Auszug über die Möglichkeiten von Microsoft PowerBI.

 

Klicken Sie auf den unteren Button, um den Inhalt von YouTube nachzuladen.
Inhalt laden

PGlmcmFtZSB3aWR0aD0iNTYwIiBoZWlnaHQ9IjMxNSIgc3JjPSJodHRwczovL3d3dy55b3V0dWJlLmNvbS9lbWJlZC8wTERvdS1pa3UtTSIgZnJhbWVib3JkZXI9IjAiIGFsbG93ZnVsbHNjcmVlbj48L2lmcmFtZT48L3A+

Hat Excel für Führungskräfte ausgedient?

Wie viele Stunden haben wir in Excel Sheets investiert, Beziehungen zwischen Feldern hergestellt und mit viel Eleganz und Unterstützung der Formelsammlung komplexe Berechnungen automatisiert und diese über Balken- Kuchen- oder Säulendiagramme grafisch perfekt dargestellt. Einen Wert austauschen? Kein Problem- eingeben und alles- weil bis zur letzten Möglichkeit verknüpft und das neue Resultat sofort da und das Diagramm gleich angepasst. Ich gebe es zu, ich liebte dieses Teil auch! Und das soll jetzt vorbei sein? Nie im Leben, da steckt zu viel Herzblut und Zeit darin.

Und trotzdem Hand aufs Herz. Wieviel Zeit stecke ich in ein neues Diagramm? Wie oft muss ich dann doch die Hilfe konsultieren? Ein Fehler in der Berechnung oder Verknüpfung von Felder, neue Randbedingungen? Kann ich alles noch Nachverfolgen oder baue ich alles nochmals von Vorne auf? Da verfliegt der Stolz jeweils sehr schnell. Wieviele Files muss ich für die nächste Geschäftsleitungs-Sitzung vorbereiten? Nur eines oder sind es doch mehrere? Und wie kann ich die Auswertungen zusammenführen? Über Word- nein danke… zu grosses Absturzrisiko. Und eine Woche später ist ja noch die Verwaltungsratssitzung- dieselben Zahlen liefern aber etwas anders dargestellt-stufengerecht…aber für mich dann doch einigermassen zeitintensiv. Und das Ganze jeden Monat von Neuem.

Wie ist es mit den aktuellen Grundlagedaten? Liefern die Bereichsleiter rechtzeitig oder muss ich sie selber beschaffen? Aber wo sind die schon wieder abgelegt und sind sie aktuell, habe ich die richtige Version erwischt- Kurt speichert doch immer alles zuerst auf dem Desktop, bevor er es freigibt…! Und wieviel Zeit verwenden diese Mitarbeiter noch mir die Grundlagen zu liefern? Klar für alle diese Aufgaben habe ich einen/e Mitarbeiter/in, die mir das erledigt. Aber weil es schnell gehen musste, habe ich es doch beim letzten Mal selber gemacht. Klar eine Nachtschicht liegt schon mal drin, dafür habe ich dann das was ich auch wirklich brauche und ohne lang erklären zu müssen.

Jetzt da ich mir das alles vor Augen führe, frage ich mich, ob ich diese Zeit nicht besser investieren könnte.
Excel ist ein mächtiges Tool- keine Frage, gerade für uns Unternehmer und Führungskräfte und in einigen Fällen auch eine gute Lösung. Wenn ich aber jederzeit eine dynamische Übersicht über meinen Geschäftsverlauf auf verschiedenen Stufen haben möchte dann könnte es Zeit sein, mein System zu überdenken.
Auch Microsoft hat erkannt, dass Excel zwar als Allzweckwaffe genutzt wird, aber keine Allzweckwaffe ist. Der nächste Schritt heisst Microsoft PowerBI. Es wird zum Cockpit in dem Auswertungen aus verschiedenen Gesichtspunkten in übersichtlichen Dashboards dargestellt werden. Nicht nur aus Excel sondern auch aus ERP, CRM, der Marketingplattform, Google Analytics und vielen weiteren Quellen.
Die Datenverwaltung und Aufbereitung fällt grundsätzlich weg. Die Informationen sind stets aktuell und vollständig. Der Fokus liegt nicht mehr beim Zusammentragen und Darstellen der Informationen, sondern bei den Analysen die nicht nur ich einsehen kann. Auf diese Weise kann gewährleistet werden dass jede Stelle im Unternehmen über die Informationen verfügt um den Job bestmöglich machen zu können, egal ob Inhouse oder unterwegs.

Der Zeitgewinn ist enorm, und kann in Analyse und Massnahmen investiert werden, und nicht in die Aufbereitung. – das ist weniger ein Versprechen als viel mehr tägliche, eigene Erfahrung!

Kaum zu glauben? Investieren sie eine halbe Stunde in unser Webinar– machen Sie sich selber ein Bild.

Datenquellen soll man nutzen können

Eine riesige Menge an Daten stehen uns heute zur Verfügung. Möchte man aber diese nutzen um neue Erkenntnisse zu gewinnen, so zeigt die Praxis dass es selten gleich losgehen kann. Oftmals liegen die Daten in unterschiedlichen Formaten ab. Teilweise sogar in einem Format, dass nur noch eine manuelle Bearbeitung möglich ist. Möchte man aber effizient die Daten nutzen, so ist eine automatische Verarbeitung immer anzustreben. Im folgenden möchte ich auf Punkte eingehen, welche ich aus der Praxis erlebt habe wenn es darum geht, Geschäftsprozesse durch Automatisierungen zu unterstützen.

Geschätzt Lesezeit 10 Minuten.

Eine grosse Herausforderung bei der automatischen Verarbeitung von Daten sind deren Quellen und wie die Daten zur Verfügung gestellt werden. Jede automatische Verarbeitung bedarf einer stabilen Datenquelle, welche klar strukturiert ist. Dies bedeutet, dass zu jedem Zeitpunkt die gelesenen Daten ohne menschlichen Eingriff verarbeitet werden können.

Im folgendem möchte ich auf diverse Punkte eingehen, die eine maschinelle Verarbeitung erschweren oder sogar verunmöglichen und wie man damit umgehen sollte.

 

Was der Computer zum Menschen unterscheidet

Im Unterschied zu uns Menschen ist es für einen Computer am besten, wenn Daten in strukturierter Form wie einer Tabelle vorliegen und keine Formatierung, keine Grafiken usw aufweisen. Für uns Menschen ist es ideal wenn z.B. eine Excel-Datei mit Titel, Rändern, Legenden usw.. beschrieben wird und wir so visuell einfacher zu Erkenntnissen kommen als wenn uns nur eine Tabelle vorliegen würde. Doch genau dies ist für die maschinelle Verarbeitung ein grosses Problem.

 

Herausforderung beim Daten organisieren

Bevor wir uns mit den Daten und deren Verarbeitung befassen möchte ich auf die Datenquelle und deren Verfügbarkeit zu sprechen kommen. Bei einmaliger Beschaffung von Daten z.B. für Analysen und Auswertung ist dies noch kein grosses Problem. Doch sobald Daten immer wieder beschafft werden sollen z.B. monatliche Reports, muss ein Automatismus möglich sein. Damit Daten einfach, automatisch verarbeitet werden können, sollte auch die Beschaffung (Download, Speicherung) automatisch funktionieren. Hier sind aber schon oftmals die ersten Hürden anzutreffen. Download-Portale welche erst nach Eingabe von Formularfeldern einen Download anbieten sind schwierig in einen Automatismus zu integrieren. Was für uns Menschen ein paar Klicks bedeutet, kann für die automatische Verarbeitung schon zum Show-Stopper werden. Daten sollten wenn möglich über API oder andere einfache Mechanismen angeboten werden können. Links sollten sich wenn immer möglich nicht ändern, oder nach einem klaren Schema definiert sein.

Auch wenn Daten auf einer Webseite z.B. als Liste angeboten werden, können diese nur mit Aufwand automatisch gespeichert und weiterverarbeitet werden. Für uns Menschen ist ein Copy&Paste schnell erledigt, doch Webseiten zu lesen und zu verarbeiten bedarf einiges an Programmierung und kann schnell einen grossen Aufwand bedeuten.

 

Datenformate

Wenn man nun die Datenquelle und deren Daten organisiert hat, kommt die nächste Herausforderung. Wie sind die Daten gespeichert, in welchem Format liegen diese vor.

Ein sehr oft verwendetes Datenformat für downloads ist CSV (Comma Separated Values), eine Textdatei welche die Daten in tabellarischer Form speichert. Dies ist sehr gut für die weitere Verarbeitung geeignet, da nahezu alle Programme und Programmiersprachen mit diesen Formaten umgehen können. Ein Nachteil dabei ist aber, dass in einem CSV keinerlei Informationen zu den Datentypen vorliegen. Z.B. ist nicht klar ob es sich bei einer Spalte mit Zahlen um eine Währung, Zahl, Temperatur usw.. handelt. Auch kann nicht sicher gesagt werden ob es sich um eine gerundete Zahl oder den effektiven Wert handelt. In den meisten Fällen kann man anhand der Datenquelle und deren Bedeutung die Herleitung machen, um was es sich handelt. Trotzdem kann es zu Missverständnissen kommen. Nehmen wir mal an, wir haben eine Spalte mit Datum und Uhrzeit. Erstens wäre es besser wenn das Datum und die Uhrzeit in je einer Spalte liegen würden, zum anderen gibt es aber keinerlei Hinweise um welche Zeit es sich handelt. Also, ist die Zeit die lokale Zeit und wenn ja, was ist die lokale Zeit der Datenquelle? Oder ist die Zeit von einer anderen Zeitzone, oder universal Zeit?

 

Wir könnten hier nun über jegliche Datenformate sprechen die es gibt und deren Vor- und Nachteile. Zusammengefasst kann man aber folgendes sagen, was immer berücksichtigt werden sollte:

Die effektiven Daten sollten immer in einer Tabellenform vorliegen. Jede Spalte sollte klar definiert sein um was es sich handelt. Ausser einem Header (Erste Zeile mit Spaltennamen) sollte sich nichts Weitere in der Quelldatei befinden.

Jede Datenquelle sollte weiter eine Beschreibung haben, was für ein Format jede Spalte besitzt. z.B. sollte bei einer Spalte mit Datum und Zeit beschrieben sein, um welche Zeitzone es sich handelt. Bei Fliesskommazahlen sollte beschrieben sein, ob es sich um gerundete Zahlen handelt. Bei Textspalten wäre es hilfreich zu wissen, was die maximale Zeichenlänge ist usw….  Diese Beschreibungen sollen unter keinen Umständen in der Datei der Daten sein, sondern separat angeboten werden. Ausnahme sind z.B. Datenformate wie Parquet, welche per Definition schon die Datentypen in der Datei Beschreiben.

Ein ganz wichtiger Punkt noch zum Abschluss dieses Themas sind die allgemeinen Dateiformats-Definitionen. Dazu gehört das Encoding, also in welchem Format wurde die Datei gespeichert. Da es diverse Formate wie Unicode UTF-8, UTF-16, Windows Latin 1 usw… gibt,  ist dies eine wichtige Information, damit Sonderzeichen auch korrekt angezeigt werden. Oftmals kann man dies manuell herausfinden, doch die Information direkt zu erhalten erleichtert die Arbeit sehr. Darunter fällt auch die Information des Zeilenumbruchs (Neue Zeile). Auch diese kann sich von den Steuerzeichen her je nach Betriebssystem unterscheiden. Unix, Mac und Windows besitzen da unterschiedliche Definitionen.

 

Excel als Datenformat

Da man Excel als die häufigste Form der Datenverarbeitung antrifft möchte ich hier explizit darauf eingehen. Excel hat den grossen Vorteil (Und gleichzeitig auch Nachteil) dass man Daten zusammen mit der visuellen Formatierung nutzen und präsentieren kann. Auch hier ist es für uns Menschen ein grosser Vorteil aus einer einfachen Tabelle eine grafisch angereicherte Tabelle mit Summe, farbigen Flächen, Titel, Beschreibung und Formeln zu machen, welche viel einfacher zu lesen und verstehen ist. Wer sich mit Makro auskennt weiss, dass diese kleinen Helfer die halbautomatische Verarbeitung unterstützen können.

Wenn man aber Excel-Dateien für die automatische Verarbeitung bekommt, ist dies selten ideal. Titel, Beschreibungen usw.. können noch einigermassen einfach entfernt werden (Sofern diese sich immer am selben Ort befinden), doch Zellen mit Formeln und Unterbrüche von Tabellen durch Zwischensummen machen eine Verarbeitung teilweise unmöglich oder sehr aufwendig.

Möchte man also Excel als Download-Format anbieten sollte immer eine alternative wie CSV dazu angeboten werden damit die maschinelle Verarbeitung möglich ist.

 

CSV richtig nutzen

Was für alle Formate gilt, aber oftmals bei CSV-Dateien nicht immer eingehalten wird ist die klare Definition wo eine Spalte beginnt und wo diese endet. Eigentlich ist eine CSV-Datei eine Datei die Spalten durch Komma trennt. Oftmal sieht man aber auch TAB oder Strichpunkte als Trennzeichen. Problematisch kann dies dann werden, wenn es z.B. eine Spalte mit Texte hat, in welchem sich wieder ein Text mit Komma, Strichpunkt oder TAB befindet. Um diesem Problem entgegen zu wirken, ist definiert dass Texte zwischen Anführungs- und Schlusszeichen zu stehen haben, Nummerische Werte wiederum müssen dies nicht haben. Was aber wenn man nun Text hat dies selber „;“ beinhalten? Man sieht also, das Datenformat zur Speicherung von Daten sollte immer so gewählt werden, dass die darin enthaltenen Daten das Format selber nicht beeinflussen.

 

Beispiele von Problemen zur automatischen Verarbeitung

Nachdem wir nun die Daten in einem Idealen Format vorliegen haben und auch wissen, mit was für Daten wir es zu tun haben, kommt die nächste Stufe der Verarbeitung. Dabei geht es um die Qualität der Daten. Um dies zu verdeutlichen ein paar Beispiele dazu:

 

Fehlende Werte

Selten ist eine Spalte zu 100% mit gültigen Werten ausgefüllt. Fehlende Werte können z.B. auftauchen wenn ein Messwert fehlt, es einfach keinen Wert braucht, Daten verloren gingen, Unterbrüche bei der Erfassung gab usw… Das wichtigste dabei ist, dass fehlende / nicht gültige oder unbekannte Werte klar gekenntzeichnet sind. Und diese Kennzeichnung sollte auch dokumentiert sein. In einer Textspalte ist meistens das leere Feld ein indiz dafür, doch bedeutet dies nun dass es keinen Eintrag gibt oder dieser fehlt? Bei Zahlen, Währungen und sonstigen Nummersichen Spalten ist eine Kennzeichnung durch Zeichen wie NA, NONE, NAN usw.. nicht ideal, da bei der Verarbeitung oftmals die Spalte als nummerisch definiert werden möchte, doch das vorhanden sein von Zeichenketten dies dann behindern. Leer lassen ist oftmals besser, oder bei nur positiven Zahlen könnte auch z.B eine -1 genutzt werden. Auch hier wichtig dass die dokumentiert ist.

 

Kommastellen und tausender Trennzeichen

Prinzipiell haben ausser Dezimaltrennzeichen keinerlei andere Zeichen etwas in nummerischen Spalten zu suchen. Ein Computer kann sehr gut mit grossen Zahlen umgehen und braucht keine visuelle Hilfe. Beim Dezimaltrennzeichen sind meistens Punkt oder Komma in Gebrauch. Auch hier gibt es Unterschiede, je nach System, Lokation, usw… In einer Datenquelle sollten Dezimaltrennzeichen unter keinen Umständen gemischt werden, entweder Punkt oder Komma.

Auch sieht man teilweise Leerzeichen, oftmals am Anfang oder Schluss der Werte. Was für uns unsichtbar und somit irrelevant ist, kann für die Verarbeitung mit dem Computer sehr aufwendig werden. Vermeiden Sie unbedingt Leerzeichen, diese haben höchstens in Fliesstext etwas zu suchen.

 

Datum und Uhrzeit

Sobald Datum und Uhrzeit als Daten vorliegen, ist besondere Aufmerksamkeit gefordert. Zuerst sollte man idealweise Datum und Uhrzeit in unterschiedlichen Spalten aufführen. Oftmals passiert es sonst dass diese als Zeichenkette erkannt werden und programmiertechnisch getrennt werden müssen. Der ideale Datum/Uhrzeit Beschrieb für die automatische Weiterverarbeitung ist ein Zeitstempel (Timestemp) da dieser ein nummerischer Wert ist, welcher eindeutig ist. Ist dies aber nicht möglich (Datum vor 1.1.1970 oder nach 2038) sollte die Datumsformatierung wie auch Zeitformatierung dokumentiert sein. Je nach Land oder eingesetzter Software werden Datum mit Punkt, Schrägstrich oder Bindestrich getrennt, Monat und Tag vertauscht usw… Auch bei der Uhrzeit ist das Trennzeichen nicht immer identisch. Doppelpunkt, Hochkomma, Punkt usw… werden oft genutzt.

Fehlende Daten sollte auch hier eindeutig gekennzeichnet sein, aber nicht das Format verändern. Weitere wichtige Angabe bei der Uhrzeit ist die Zeitzone, zu welcher diese gehört.

 

Spalten mit Kategorien

Sehr viele Spalten werden mit kategorischen Daten genutzt z.B. Währung, Ortschaft, Grössen wie S,M,L, oder sonstig definierte Kategorien. Kategorien sind im Unterschied zu reinen Textspalten so definiert, dass es eine klare Anzahl möglicher Werte gibt, welche eingesetzt werden können. Damit kann man später z.B. Gruppierungen machen und Zusammenhänge zwischen Kategorien feststellen. Wichtig dabei ist das Kategorien eindeutig sind und sich immer identisch wiederholen. Vor allem bei Ortschaft sollte unter keinen Umständen einmal „Wil“ und einmal „Wil SG“ stehen, da dies als unterschiedlich erkannt würde.

Am einfachsten um mit Kategorien umzugehen wäre, man bekommt eine separate Datendatei mit allen möglichen Kategorien und deren ID als Metadaten. In den effektiven Daten würde dann in der Spalte „Ortschaft“ nur noch die dazugehörige ID der Ortschaft stehen und somit die Verarbeitung massiv vereinfachen.

 

Beispiel Währung mit Metadaten

 

Preis WährungsID
100 3
130 2
120 1
130 3
ID Währung
1 CHF
2 $
3 Euro

 

Weiteres

Wenn man Prozentangaben macht, sollte dies mit nummerischen Werten gemacht werden und die Spalte entsprechend beschriftet sein. Prozentzeichen nach einem nummerischen Wert führen eher zu Problemen als dass diese hilfreich wären.

Gleich verhält es sich auch mit weiteren Sonderzeichen. Nach wie vor können diese bei systemübergreifenden Verarbeitungen zu Problemen führen, wenn diese falsch interpretiert werden oder der Computer auf eine andere Region / Land eingestellt ist.

 

Kontinuität der Verarbeitung

Oftmals möchte man Daten nicht einmalig sondern kontinuierlich aktualisieren. Je nach Veränderung der Daten kann dies jährlich, monatlich, oder noch in kürzeren Abständen passieren bis hin zu Echtzeit. Wichtig dabei ist, dass sich das Format und die Struktur der Daten nicht ändert, so dass die weitere Verarbeitung immer möglich ist.

Kann dies nicht über längere Zeit gewährleistet werden, sollten Datenformate wie z.B. XML, Parquet usw.. in Betracht gezogen werden. Bei Echtzeit- bzw. sehr kurzen Aktualisierungsabständen macht der Einsatz einer API Sinn. So kann ein Webservice angeboten werden, welcher einen Datenbezug nach Anforderung zulässt in einem klar strukturierten Format. Erweiterungen sind einfacher umzusetzen da diese keinen Einfluss auf die schon bestehende Struktur hat. Auch bei grösseren Aenderungen kann eine neue API-Version angeboten werden, so dass die Datenbezüger genügend Zeit für eine Anpassung haben.

 

Brauche ich Big Data?

Das Thema zu Big Data und Data Analytics wird in weiten Teilen des Internets gross vermarktet. Doch oftmals bleiben die Beiträge, Informationen und auch Einsatzbeispiele auf einer Höhe, mit der sich viele KMU’s nicht identifizieren können. Es werden Beispiele wie Google, Facebook, YouTube usw… genannt. Auch spricht man gerne von Petabyte an Daten und nicht zuletzt der grossen Menge welche IoT Devices generieren, wenn man denn ein paar tausend Stück davon hat.

Ich möchte in diesem Beitrag das Thema etwas auf den Boden bringen. Der grosse Anteil an Schweizer KMU’s hat weder riesige Datenmengen noch bewegt man sich in Konzerngrössen wie Google usw… Trotzdem ist das Thema auch für KMU’s wichtig.

Anzeichen vom Bedarf an Big Data Lösungen

Prinzipiell kann man in jeder Firma gewisse Anforderungen für Big Data finden. Es beginnt schon bei den unzähligen Excel-Dateien die auf Fileservern oder lokal gespeichert sind. Natürlich, Excel ist eine Allround-Waffe für ein Geschäft und hilft in vielen Bereichen ungemein. Doch meistens nur für eine Person. Möchten mehrere Personen damit arbeiten muss man sich schon absprechen wo die Datei zu liegen hat und wie man damit umgeht. Abgesehen davon, sobald mehrere Excel-Dateien existieren sind wichtige Daten verteilt und nur mühsam zusammenzubringen.

Ein weiterer Punkt sind die Daten, welche uns allen zur Verfügung stehen, nämlich im Internet. Diese sind, je nach Quelle, sehr wertvoll. Stellt man sich vor, dass man alle aktuellen, öffentlichen Daten zu seiner Konkurrenz innert Sekunden auf dem Bildschirm hat, oder immer mitbekommt was gerade im Markt wichtig ist, in dem man sich bewegt. Viele haben kaum Zeit sich immer aktuell zu halten, und wenn doch, dann ist dies sehr zeitaufwändig. Google ist Dein Freund….

Konkretes Beispiel

 

Dieses aktuelle Beispiel existiert effektiv bei einem Kunden von mir, und hoffe damit etwas Klarheit in die Möglichkeiten des Themas zu bringen. Im Einsatz ist ein ERP-System, welches über Jahre gewachsen ist. Man hat unzählige Anpassungen vorgenommen, so dass nun ca. 80% individuell sind. Das hat zwar den Vorteil dass das System sehr gut auf die Firma passt, doch Anpassungen sind aufwändig.

Interne Daten:
Im Bereich des Reportings kommen immer wieder Anforderungen von der Geschäftsleitung, welche Zahlen und Fakten aufbereitet haben möchten. Die IT-Abteilung hat viele Stunden Aufwand, um die gewünschten Reports auszuarbeiten.
Ein weiteres Problem ist, dass über viele Jahre die Reports mit Excel gemacht wurden. Inzwischen ist die Datenmenge aber doch so gross, dass diese nicht mehr mit Excel verarbeitet werden können. Deshalb muss auf gewisse historische Daten verzichtet werden.

Für Big Data ist die Datenmenge noch verhältnismässig klein. Die Datenbank des ERP ist gerade mal 80GB gross. Es sind auch nicht unzählige Reports, doch der Aufwand für Pflege und Anpassungen ist trotzdem sehr hoch. Hier sprechen wir prinzipiell von Business Intelligence, diese internen Daten sollen aber in Zukunft angereichert werden wie nachfolgend beschrieben.

Externe Daten:
Von Geschäftsseite wäre es interessant, gewisse externe Daten zu analysieren und in die Reports einzubeziehen. Der Verkauf  vermutet, dass die Nachfrage nach Produkten eine Abhängigkeit hat zu Informationen, welche öffentlich im voraus ersichtlich sind. Beispiel: Ausschreibungen sind öffentlich, diese werden voraussichtlich auch eine Nachfrage generieren. In gewissen Branchen lässt sich dies auch nachvollziehen.

Dies ist ein schönes Beispiel, wo Big Data zum Zug kommen kann. Zum einen soll das Reporting / Visualisierung vereinfacht werden, und zwar nach den Anforderungen der Geschäftsleitung. Zum anderen sollen Datenbestände vom ERP wie auch von extern zusammengeführt werden und so einen Mehrwert ergeben.

Wie kann man Big Data für sich selber nutzen?

Ich habe folgende Checkliste ausgearbeitet, welche man für sich selber durchspielen kann. Dabei geht es um unsere KMU’s und nicht um Weltkonzerne. Vielleicht finden Sie sich im einen oder anderen Punkt bestätigt. Dann wird es Zeit, sich um das Thema zu kümmern:

  • Sind bei mir Daten verteilt gespeichert, die Zusammen einen Mehrwert bilden könnten?
    –> Viele Excel-Dateien, Systeme die als Silos funktionieren, Informationsbruch zwischen Abteilungen
  • Gibt es externe Daten die ich gerne hinzuziehen würde, und so mehr Informationen hätte?
    –> Ausschreibungen, Baugesuche, Wetterdaten, Webseiten, Konkurrenzaktivitäten usw…
  • Ist der Aufwand bei uns intern zu gross, um Informationen aus Daten zu bekommen?
    –> Fehlendes KnowHow, Proprietäre Systeme, veraltete Lösungen, manuelle Arbeiten
  • Tragen wir Informationen vom einen System in das Nächste, ohne dabei einen Mehrwert zu generieren?
    –> Copy / Paste, Papierraporte, Scannen, Systeme die nicht miteinander kommunizieren
  • Welche Informationen würden mein Business unterstützen?
    –> Marktzahlen, Kundenzufriedenheit, Hype-Cycles, Wetterdaten oder Ereignisse
  • …und ich weiss nicht wie ich an diese herankomme.
    –> API’s, Schnittstellen, Datenaufbereitung
  • Haben wir Daten welche sich so schnell bewegen, dass wir die Informationen zu langsam mitbekommen
    –> Logdaten von Webserver, produzierende Maschinen, Kundenanforderungen, Supportanfragen usw….
  • Machen wir zu wenig aus unseren bestehenden Daten?
    –> CRM, Marketingergebnisse, Facebook, Webseite, Lager- und Absatzzahlen usw…

Die Liste ist schier endlos und soll in erster Linie als Gedankensanstoss helfen.

Mein Angebot

Ich würde mich freuen mit Interessierten in Kontakt zu treten und unverbindlich ein erstes Gespräch zu führen. Ich bin sicher dass sich schon nach einer Stunde Ideen zeigen, wie man das Thema für sich nutzen könnte. Für Kontaktaufnahme, hier geht es weiter: http://cyrilldurrer.com