Process Mining mit bupaR

5.5.2020 | 9 Minuten Lesezeit

Process Mining schafft Transparenz darüber, was wirklich in Unternehmen geschieht.
Im Prozessmanagement werden die Idealvorstellungen eines Prozesses meist langwierig definiert. In der Praxis ist die Qualität dieser Beschreibungen jedoch oft nicht eindeutig bestimmbar. Es ist zudem häufig unklar, inwieweit der beschriebene Prozess wirklich ausgeführt wird.

Auf Basis von existierenden Daten in IT-Systemen wird mit Process Mining der reale Prozess automatisiert identifiziert und visualisiert. So können mit diesem neu generierten Prozesswissen Schwachstellen und ungenutzte Potenziale von Geschäftsprozessen aufgedeckt werden.

Wir stellen Process Mining im Folgenden anhand eines einfachen Beispiels vor. Wir untersuchen den Ablauf von Arbeitsschritten, der zu Zahlungseingängen von Projekten führt. Dabei ist sowohl die Auftragsabwicklung als auch die Rechnungsstellung relevant. Allein mit dem Prozessplan können wir Indizien für Optimierungspotenziale wie beispielsweise einen ineffizienten Abrechnungsprozess aufdecken.

In diesem Blogpost möchten wir einen schnellen Einstieg in Process Mining mit der Open Source Software bupaR ermöglichen. Dazu geben wir zunächst einen Überblick über den Anwendungsfall und führen sowohl in Process Mining als auch in bupaR ein. Anschließend folgt eine Beschreibung der Vorgehensweise mit bupaR und unsere daraus resultierenden Erkenntnisse.

Was ist der Anwendungsfall?

Mit Process Mining identifizieren wir, welche Arbeitsschritte in welcher Reihenfolge wirklich erfolgen, bis ein Projektauftrag zu einer eingehenden Zahlung führt. Dazu nutzen wir Daten aus einer Unternehmenssoftware, die Arbeitsschritte zur Angebots- und Rechnungsabwicklung speichert. Die Arbeitsschritte werden in der Vertriebs- und Finanzabteilung durch das Bedienen der Software erzeugt. Jeder Arbeitsschritt ist eine sogenannte Aktivität. Wir beobachten insgesamt folgende fünf Aktivitäten:

Angebot erstellt
Auftrag erstellt
Rechnung erstellt
Fälligkeit erreicht
Zahlung erhalten

Die Ausführung der Aktivitäten zu bestimmten Zeitpunkten führt zu Ereignissen (z. B. Rechnung erstellt am 01.02.2020 um 12:01:20). Diese Ereignisse lassen sich einem eindeutigen Merkmal des Projekts zuordnen (z. B. Rechnung erstellt am 01.02.2020 um 12:01:20 für das Projekt „Process Mining“). Die daraus entstehenden Ereignisdaten sind demnach ein Tupel

einer Identifikationsnummer(ID),
einer Aktivität und
einer Zeitangabe.

Zusätzlich besteht die Möglichkeit, Metadaten wie beispielsweise Standort, Kunde oder Umsatz hinzuzunehmen, um die Analysemöglichkeiten zu erweitern.

Wir haben unstrukturierte Ereignisdaten aus der Unternehmenssoftware exportiert und mithilfe eines ETL-Tools aufbereitet. Eine Vorverarbeitung der Daten ist meist sinnvoll, um Inkonsistenzen zu beseitigen. So würde frühzeitig auffallen, dass z. B. Verknüpfungen in den Daten fehlen oder Widersprüche vorliegen. Zudem können die Daten dabei in das passende Format transformiert und zu einem Datensatz aggregiert werden. Ziel ist es, einen automatisierten Vorgang zu implementieren, um manuellen Aufwand zu minimieren und dynamische Daten nutzen zu können.

Was ist Process Mining?

Process Mining rekonstruiert auf Basis von in IT-Systemen gespeicherten Ereignisdaten den Geschäftsprozess. Diese Technik verbindet die klassische Prozessanalyse und Data Mining. Unter Data Mining kann eine systematische Anwendung von Methoden und Algorithmen zur automatisierten Extraktion von Zusammenhängen in Datenmengen verstanden werden.

Für die Umsetzung von Process Mining existieren eine Vielzahl von Algorithmen, die zur Ermittlung der Prozesse entwickelt wurden. Jeder davon hat das Ziel, den Prozess bestmöglich zu identifizieren und darzustellen. Der erste und wohl bekannteste Algorithmus ist der Alpha Miner. Viele Algorithmen greifen Ideen des ersten Miners auf und entwickeln diese weiter. Der Alpha Miner scannt die Prozessdaten nach bestimmten Mustern und stellt so Verbindungen her. Anhand eines kleinen Beispiels soll diese Vorgehensweise verdeutlicht werden.

Beispiel: Ein Prozess wird mit der Symbolik <> von einem anderen Prozess abgegrenzt. Die innerhalb eines Prozesses aufeinanderfolgenden Schritte (hier: a, b und c) sind durch Kommata getrennt. Wenn b auf a folgt, a aber nie auf b, dann wird angenommen, dass eine kausale Abhängigkeit zwischen b und a besteht. Die erkannten Muster werden üblicherweise mit einem Pfeil dargestellt.

Darauf aufbauend werden mit Process Mining, ähnlich wie im klassischen Prozessmanagement, die Prozesse oft in einem Prozessplan dargestellt. Dieser visualisiert die Reihenfolge der Arbeitsschritte in einem Flussdiagramm.

Darüber hinaus bietet Process Mining viele weitere Möglichkeiten, den Prozess zu analysieren und abzubilden. So können beispielsweise Durchlaufzeiten oder Doppelarbeiten detailliert untersucht werden, um Optimierungspotenziale aufzudecken.

Was ist bupaR?

bupaR (Business Process Analysis R) ist eine integrierte Suite der Programmiersprache R. Die Open Source Software entstand bei einer ehrenamtlichen Forschung an der Universität Hasselt (BEL), betreut von Gert Janssenswillen (bupaRs Page ).

Die Suite besteht aktuell aus acht Paketen. Das zentrale und gleichnamige Paket bupaR beinhaltet die Basisfunktionen und ermöglicht Process Mining auf verschiedenen Stufen der Prozessanalyse durchzuführen. Weitere Pakete konzentrieren sich u. a. auf die deskriptive Beschreibung des Prozesses oder auf die Prozessvisualisierung.

In bupaR werden die Ereignisdaten in Ereignisprotokollen gespeichert. Auf dieser Grundlage entwickelt der Algorithmus in bupaR iterativ die Reihenfolge der Aktivitäten. Es wird zudem sowohl der Apha Miner als auch der Inductive und Heuristic Miner in bupaR unterstützt.

Process Mining mit bupaR bietet neben der automatischen Erzeugung des Prozessplans weitaus mehr Möglichkeiten, um tiefer in die Prozessanalyse einzusteigen. So können u. a. einzelne Abfolgen von Aktivitäten oder Durchlaufzeiten intensiver untersucht werden.

Wie wird bupaR verwendet?

Die Anwendung von bupaR erfolgt in der Entwicklungsumgebung RStudio. Bevor das Ereignisprotokoll mit den Ereignisdaten erstellt wird und die Prozessanalyse starten kann, müssen die notwendigen Pakete installiert und geladen werden.

In unserem Anwendungsfall verwenden wir die Pakete bupaR und processmapR der bupaR Suite und readr zum Einlesen der Daten. Mit dem Laden des Pakets bupaR werden automatisch die verwandten Pakete mitgeladen (hier: processmapR).

#Installieren der notwendigen Pakete

install.packages(“readr”)        #Einlesen der Daten
install.packages (“bupaR”)       #Basisfunktionen Process Mining
install.packages (“processmapR”) #Visualisierung des Prozesses

#Laden der notwendigen Pakete

library(readr)
library(bupaR)

Im Rahmen der Vorverarbeitung haben wir die Daten bereits aufbereitet und in eine einheitliche Struktur zusammengeführt. Als Resultat haben wir den in Abbildung 1 dargestellten Datensatz mit den Spalten ID, Aktivität und Zeitangabe erhalten. Wichtig ist, dass die Zeitangabe als Datum formatiert ist.

Die aufbereiteten Daten werden mit der entsprechenden Funktion in RStudio eingelesen (hier: read_csv zum Einlesen der CSV-Datei).

#Einlesen der Daten

data <- read_csv("Documents/Offer2Cash.csv")

Danach überführen wir die Ereignisdaten mit der Funktion simple_eventlog in ein einfaches Ereignisprotokoll, welches Process Mining mit nur drei Parametern ermöglicht. Wir weisen dem Ereignisprotokoll die Spalten ID (case_id), Aktivität (activity_id) und Zeitangabe (timestamp) zu.

#Erstellen eines einfachen Ereignisprotokolls

eventlog_data <- simple_eventlog(data,
                    case_id ="CaseID",
                      activity_id = "Activity",
                       timestamp = "Timestamp")

Der in Abbildung 2 wiedergegebene Output gibt uns Einblicke in das erzeugte Ereignisprotokoll. Anhand der 2.578 eingelesenen Zeilen hat bupaR 128 unterschiedliche Prozessvarianten und insgesamt 662 Fälle identifiziert. Durch die Zuordnung der Spalten erkennt bupaR die fünf Aktivitäten (Activity) des Datensatzes automatisch. In unserem Anwendungsfall haben wir uns auf den Zeitraum vom 06.06.2019 bis 16.04.2020 beschränkt. Darüber hinaus besteht das Ereignisprotokoll aus vier Spalten mehr als der eingelesene Datensatz. Die Aktivitätsinstanzkennung (activity_instance_id) ermöglicht zusammengehörende Aktivitäten zu verbinden. Dies ist insbesondere dann relevant, wenn verschiedene Stati je Aktivität angegeben werden. So würden beispielsweise die Aktivitäten „Rechnung erstellt – Start“ und „Rechnung erstellt – Beendet“, die sich auf die gleiche Rechnung beziehen, eine identische Kennung erhalten. In unserem Anwendungsfall berücksichtigen wir keine Stati, so dass jede Aktivität eine eigene Kennung erhält. Die Ressourcenkennung (resource-id) bleibt bei der Verwendung eines einfachen Ereignisprotokoll undefiniert, da keine Zuordnung von Ressourcen in der Funktion erfolgt. Eine Ressource könnte beispielsweise ein Mitarbeiter, ein Standort o. ä. sein. Die Lebenszykluskennung (lifecycle_id) bezieht sich ebenfalls auf verschiedene Stati der Aktivitäten und bleibt somit in unserem Beispiel undefiniert. Anhand der Zeitangaben wird die Reihenfolge (order) von Aktivitäten in bupaR automatisch ermittelt.

Anschließend starten wir mit der Entdeckung des Prozesses. In unserem Anwendungsfall beschränken wir uns auf die Erstellung des Prozessplans. Mit der Funktion process_map wird die Reihenfolge der Aktivitäten automatisiert in einem Prozessplan visualisiert. In der Standardeinstellung werden alle Prozessvarianten dargestellt, sowie die Aktivitäten und Pfeile mit absoluten Häufigkeiten annotiert. Um sich weitere Versionen des Prozessplans ausgeben zu lassen, kann das sogenannte Frequenzprofil (frequency) und Performanceprofil (performance) angepasst werden.

Zunächst lassen wir uns den am häufigsten vorkommenden Prozess angeben. Dazu nutzen wir die Filterfunktion des Frequenzprofils (filter_trace_frequency). In diesem Fall lassen wir uns die häufigsten vorkommenden Prozessvariationen anzeigen bis 1 % aller Prozessvarianten erreicht ist.

#Erstellen des am häufigsten vorkommenden Prozesses

eventlog_data %>%
 filter_trace_frequency(perc = 0.01) %>%
  process_map()

In Abbildung 3 können wir anhand des Prozessplans erkennen, dass der häufigste vorkommende Prozess aus drei Aktivitäten besteht. In 105 Fällen beginnt der Prozess mit der Rechnungsstellung. Bevor die Zahlung eingeht, wird die Zahlungsfrist überschritten.

Mit der Änderung des Frequenzprofils erhalten wir weitere Informationen über den Prozess und erstellen einen erweiterten Prozessplan. Wir lassen uns mit der Filterfunktion bis zu 70 % der Prozessvarianten anzeigen. Zusätzlich ändern wir die Kommentierung der ausgehenden Verbindungspfeile je Aktivität (type_edges) zu relativen Häufigkeiten.

#Erstellen des erweiterten Prozessplans

eventlog_data %>%
 filter_trace_frequency(perc = 0.7) %>%
  process_map(type_edges = frequency("relative"))

Der erweiterter Prozessplan in Abbildung 4 liefert uns Informationen darüber, dass (nur) in 40 % der Fälle die Rechnungserstellung die erste Aktivität ist. Alternativ startet der Prozess mit der Erstellung des Auftrags oder Angebots. In der Regel startet ein Projekt mit einem Angebot und anschließendem Auftrag bevor erstmalig eine Rechnung erstellt wird. Die Angebots- und/oder Auftragserstellung liegt in den Fällen, die nicht mit dieser Reihenfolge starten, vermutlich vor dem gewählten Zeitraum. So ist eine Rückwärtssuche für diese Fälle sinnvoll, d. h. die Daten für die betreffenden Projekte werden um die Aktivitäten Angebotserstellung und ggf. Auftragserstellung mit den jeweiligen Zeitangaben ergänzt. Außerdem beobachten wir, dass in 41 % der Aufträge noch keine Rechnung erstellt ist und von den erstellten Rechnungen in 50 % die Zahlungsfrist überschritten wird. Darüber hinaus stellen wir fest, dass sogar Fälle vorkommen, in denen die Zahlung vor Fakturierung der Leistung eingeht.

Zusätzlich zum Frequenzprofil kann das Performanceprofil eingestellt werden. Wir erstellen einen Prozessplan mit Durchlaufzeiten und lassen uns die durchschnittliche Zeit je aufeinanderfolgende Aktivität in Tagen ausgeben. Diesmal geben wir die relativen Häufigkeiten je Aktivität (type_nodes) in Bezug auf die Gesamtzahl der Fälle an.

#Erstellen des Prozessplans mit Durchlaufzeiten

eventlog_data %>%
 filter_trace_frequency(perc = 0.7) %>%
  process_map(type_nodes = frequency("relative"),
   type_edges = performance(mean, "days"))

Mit der Hinzunahme des Performanceprofils entnehmen wir dem Prozessplan in Abbildung 5, dass die Dauer zwischen der Auftrags- und Angebotserstellung im Durchschnitt 19 Tage beträgt. Zudem fällt auf, dass sofern die Zahlungsfrist der Rechnung überschritten wird, die Zahlungen durchschnittlich weitere 11 Tage später verbucht werden. Gehen die Einnahme vor der Rechnungsstellung ein, beträgt die Bearbeitungszeit im Durchschnitt 26 Tage.

Was sind unsere Erkenntnisse?

Process Mining mit bupaR ermöglicht, mit einfachen Ereignisdaten und einem Bruchteil der Analysemöglichkeiten bisher unbekannte Erkenntnisse über den Prozess zu erhalten. So kann die Qualität bestehender Prozessbeschreibungen überprüft oder sogar die langwierige Definition von Prozessen ersetzt werden. Wir haben mithilfe des Frequenzen- und Performanceprofils drei verschiedenen Prozesspläne erstellt. Anhand dieser haben wir die tatsächliche Reihenfolge der Aktivitäten von Projektangebot bis Zahlungseingang ausfindig gemacht.

Wir haben festgestellt, dass bei einer Vielzahl der Rechnungen die Zahlungsfrist überschritten wird. Diese Information kann uns Aufschluss über die Zahlungsbereitschaft der Kunden geben und auf mögliche Liquiditätsengpässe hindeuten.

Zudem haben wir erkannt, dass zu bestehenden Aufträge noch keine Rechnung erstellt wurde. Dies kann zur Folge haben, dass zustehende Einnahmen nicht beansprucht werden.

Darüber hinaus beobachten wir, dass zum Teil Zahlungen vor der Rechnungsstellung eingehen. Dies kann ein Indiz dafür sein, dass der Abrechnungsprozess nicht effizient ist.

Insgesamt lässt sich sagen, dass Process Mining mit bupaR bereits mit wenig Aufwand realisierbar ist. Die Open Source Software bupaR bietet umfangreiche Möglichkeiten, um Process Mining kostengünstig zu verproben.

Wir haben Ihre Neugierde an den Möglichkeiten von Process Mining geweckt? Kontaktieren Sie uns für ein unverbindliches Erstgespräch direkt.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Anna Lukas

Product Owner & Agile Coach

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

OpenAPI direkt in VS Code schreiben – geht das?

OpenAPI-Spezifikationen (OAS) beschreiben standardisiert und Programmiersprachen-unabhängig HTTP-APIs. Für die Erstellung von OAS gibt es verschiedene Möglichkeiten, häufig werden sie auch generiert. Das ist aber nicht für alle Programmiersprachen und...

API
Open Source

28.3.2024 | 7 Minuten Lesezeit

Mirabell Büscher

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Wie als Software-Entwickler sichtbar werden?

Egal ob Junior, Medior oder Senior, introvertiert oder extrovertiert: Jeder Software-Entwickler kann seine Sichtbarkeit mit unterschiedlichen Werkzeugen erhöhen und sollte dem Thema eine gewisse Bedeutsamkeit beimessen. Die Frage dabei ist nur: wie und...

Weiterbildung
Softwareentwicklung
Community
Open Source

21.2.2024 | 6 Minuten Lesezeit

Edgar Klepek

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Datenbanken testen mit Testcontainers in Mule4

Hier erfährst du die Möglichkeiten Testcontainers in Mule4 zu nutzen, um deine Datenbankaufrufe zu testen. Vor einiger Zeit hat mein Kollege Christian Langmann eine Blogartikelserie veröffentlicht, in welcher er aufzeigt, wie man in Mule3 Munit-Tests...

Community
Softwareentwicklung
Testing
API
Open Source
Datenbank
Container
Integration

19.1.2024 | 3 Minuten Lesezeit

Benjamin Lüdicke

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Erfahre, wie du mit dem Tool Mule Flow Landscape den Überblick über alle Mule Flows und deren Abhängigkeiten behältst. Die Integrationsplattform Mule ermöglicht es uns, Integrationen mittels einer Low-Code-Entwicklungsplattform umzusetzen. Die Bausteine...

Softwareentwicklung
API
Open Source
Dokumentation
Integration

13.8.2023 | 3 Minuten Lesezeit

Benjamin Lüdicke

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

Höhere Business Agility durch den aktiven Umgang mit Push- und Pull-Systemen...

Im Rahmen agiler Transformationen entstehen häufig starke Reibungsflächen in der Ablauforganisation. Ein verbreitetes Beispiel ist das Aufeinandertreffen klassischer Projekt- bzw. Budgetplanungen auf der einen und einer agilen Arbeitsweise in den operativen...

Agilität
Agile
Agile Transformation
Change Management
Process Management

9.12.2022 | 10 Minuten Lesezeit

Timo Böhm

P5.JS: Zeichnen mit der Open-Source-JavaScript-Bibliothek

Im Rahmen eines kleinen Projekts, bei dem es um das Thema Berechnung von Flugrouten ging, brauchten wir eine einfache und leichtgewichtige Möglichkeit, die Route und andere Bereiche auf der Karte zu visualisieren. Bei der Suche nach einem passenden ...

JavaScript
Framework
Open Source

28.11.2022 | 14 Minuten Lesezeit

Danny Steinbrecher

Tastaturen selbst bauen

Wir verwenden sie alle jeden Tag: die Tastatur. Aber woraus besteht die Tastatur eigentlich? Wie baue ich eine Tastatur? Und wer legt fest, wie ich an das @ komme? All das haben wir bei einem Ausflug auf Texel erfahren und selbst Tastaturen gebaut. Dieser...

Raspberry Pi
Open Source

31.10.2022 | 6 Minuten Lesezeit

Robert Meißner

Streaming Wikipedia mit Apache Kafka

Apache Kafka ist in aller Munde und entwickelt sich im Kontext von verteilten Systemen zum De-facto-Standard als Plattform für Event Streaming. Im Rahmen unserer OffProject Time (Weiterbildungszeit) haben wir uns die Plattform auch näher angeschaut und...

Kotlin
Data
Java
Messaging
Spring

15.8.2022 | 10 Minuten Lesezeit

Christoph Metzger

Felix Rieß

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

In diesem Artikel möchte ich euch mit einem Python Jupyter Notebook zeigen, wie ihr Anwendungsfälle der Tourenoptimierung inklusive Nebenbedingungen lösen und visualisieren könnt. Außerdem zeige ich euch, wie ihr mit OpenStreetMaps die Route zwischen...

Data

21.6.2022 | 7 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

In diesem Artikel möchte ich euch zeigen, wie ihr Probleme der Tourenoptimierung in einem Python Jupyter Notebook lösen und visualisieren könnt. Am Beispiel eines Fahrradkurierdienst zeige ich außerdem, wie das Grundproblem um gängige Nebenbedingungen...

Data

16.6.2022 | 9 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung (1/3)

In vielen Unternehmen fallen täglich verschiedene Transportprozesse an. Klassische Beispiele sind die Optimierung von Warenein- und ausgängen, die Einsatzplanung von Servicetechnikern oder die optimale Reihenfolge der Auslieferung bei Lieferdiensten....

Data

12.6.2022 | 8 Minuten Lesezeit

Lukas Heidemann

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Die Qualität bzw. Nützlichkeit von Machine-Learning-Modellen lässt sich mit Hilfe von Testdaten und Metriken bewerten. Allerdings in welchem Umfang? Manuell, automatisiert, einmalig, regelmäßig? Manuell lassen sich die ersten Modelle als Ergebnis eines...

Data
Machine Learning
Softwareentwicklung
CI/CD

7.12.2021 | 7 Minuten Lesezeit

Berthold Schulte

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Machine Learning (ML) kann nur durch Modelle in der Produktion Business Value erzeugen. Allerdings kann die Zeitspanne zwischen der Entwicklung der nächsten Iteration eines Modells und dessen Einsatz in einer Produktionsumgebung massiv sein. Dies gilt...

Accelerate
Cloud
Data
Google Cloud
Machine Learning

26.7.2021 | 11 Minuten Lesezeit

Niklas Haas

Timo Böhm

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Heutzutage steht fast alles, was mit den Labels „künstliche Intelligenz (KI)“ oder „Machine Learning (ML)“ versehen ist, für Fortschritt. Seltsamerweise schließt diese Assoziation jedoch häufig die Themen Daten und Dateninfrastruktur nicht ausreichend...

Kultur
Data
Machine Learning

21.6.2021 | 12 Minuten Lesezeit

Marcel Mikl

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Process Mining mit bupaR

Was ist der Anwendungsfall?

Was ist Process Mining?

Was ist bupaR?

Wie wird bupaR verwendet?

Was sind unsere Erkenntnisse?

Wir haben Ihre Neugierde an den Möglichkeiten von Process Mining geweckt? Kontaktieren Sie uns für ein unverbindliches Erstgespräch direkt.

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

OpenAPI direkt in VS Code schreiben – geht das?

Green Cloud: Daten und Emissionen sparen

Wie als Software-Entwickler sichtbar werden?

Charge your APIs Volume 23: REST vs. gRPC

Datenbanken testen mit Testcontainers in Mule4

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Bessere SQL-Datenpipelines mit dbt

Höhere Business Agility durch den aktiven Umgang mit Push- und Pull-Systemen...

P5.JS: Zeichnen mit der Open-Source-JavaScript-Bibliothek

Tastaturen selbst bauen

Streaming Wikipedia mit Apache Kafka

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

Einführung in die Welt der Tourenoptimierung (1/3)

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Schnelles Training eines Recommendation-Modells durch BigQuery ML

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten