Deployment von Machine-Learning-Modellen mit Seldon Core

9.9.2019 | 7 Minuten Lesezeit

In diesem Artikel sehen wir uns an, wie wir Machine-Learning- und Deep-Learning-Modelle mit Seldon Core deployen können. Seldon Core ist eine Open-Source-Plattform, um Modelle auf einem Kubernetes-Cluster in Betrieb zu nehmen. Bevor wir uns Seldon Core widmen, werfen wir einen kurzen Blick auf Container und Kubernetes in der Data-Science-Welt. Als praktisches Beispiel deployen wir ein ONNX-Modell zur Emotionserkennung mit Seldon Core auf einem Kubernetes-Cluster.

Die Rolle von Kubernetes in der Data-Science-Welt

Docker und Container gehören heute für einen Großteil der Software-Entwickler zum Tagesgeschäft. Der Mehrwert von Containern ist, dass eine Applikation mit deren Abhängigkeiten zu Softwarepaketen und -bibliotheken als ein Paket ausgeliefert werden kann. Dies erleichtert die Inbetriebnahme und Weiterentwicklung der Applikation.

Kubernetes ist ein Open-Source-System für die Orchestrierung von Containern. Die Orchestrierung bezieht sich auf Deployment, Scaling und Management der Container-Applikationen. Dadurch wird der manuelle Aufwand für die Verwaltung der Container auf ein Minimum reduziert. Ausfallsicherheit und Monitoring sind bei der Konzeptionierung von Kubernetes berücksichtigt. Des Weiteren werden bei einem Kubernetes-Cluster die verfügbaren Ressourcen wie Memory oder CPU der Server zusammengeschlossen und individuell für die Anwendungen verteilt.

In der Data-Science-Welt sind Reproduzierbarkeit der Experimente und Portierbarkeit der Umgebungen essentiell für die erfolgreiche Implementierung. Diese zwei Kernaspekte können mit Kubernetes abgebildet werden. Weiterhin haben wir den Vorteil, dass wir unsere entwickelten Komponenten und Pipelines je nach Bedarf skalieren können. Bei der lokalen Entwicklung der Data-Science-Projekte muss Software entwickelt werden, die in der Lage ist, große Datenmengen zu verarbeiten und Modelle zu trainieren. Mithilfe von Kubernetes können wir anschließend unsere Software unproblematisch in der Cloud oder im Rechenzentrum skalieren.

Für das Modelldeployment müssen mehr Konzepte aus DevOps als aus Data Science berücksichtigt werden. Dazu gehören beispielsweise Rolling-Updates, Monitoring und automatisierte Skalierung. In der Software-Welt gehören diese Themen den Best Practices an. Diese Konzepte sind in Kubernetes integriert. Im Zuge der Professionalisierung von Data Science kann sowohl die Modellentwicklung als auch das Modelldeployment durch den Einsatz von Kubernetes profitieren, wenn es ein bestehendes Kubernetes-Cluster gibt.

Seldon Core

Seldon Core ist eine Plattform, mit der Modelle auf einem Kubernetes-Cluster in Betrieb genommen werden können. Seldon Core fokussiert sich dabei auf die Inferenz der Modelle. Die Plattform enthält eine umfangreiche Anzahl von Features für das Modelldeployment. Einige der Core Features sind im Folgenden aufgelistet:

Deployment: Das Deployment bezieht sich auf Inbetriebnahme, Skalierung und Update des Modells. Seldon Core stellt passenden Komponenten zur Verfügung, um ein Modell auf dem Kubernetes-Cluster zu deployen und zu skalieren. Das Ausrollen einer neuen Modellversion geschieht unter dem Zero-Down-Time-Aspekt. Das bedeutet, dass die alte Version eines Modells solange erreichbar ist, bis die neue Version erfolgreich deployed wurde. Des Weiteren können verschiedene Modellversionen mithilfe von A/B Testing verglichen werden.
API des Modells: Nur das Deployment eines Modells liefert keinen Mehrwert für das Unternehmen. Erst wenn das Modell in den Unternehmenskontext integriert ist, wird ein Mehrwert über die Automatisierung von datengetriebenen Entscheidungen erschaffen. Dazu muss die Schnittstelle der Laufzeitumgebung des Modells in existierende Anwendungen und neue Produkte integriert werden. Seldon Core stellt das Modell als REST- oder GRPC-Schnittstelle zur Verfügung.
Inferenz-Optimierung: Durch den hohen Grad an Konfigurationsmöglichkeiten mithilfe von Kubernetes kann die Ausführungszeit der Inferenz auf die Infrastruktur angepasst werden. Dadurch können wir die Latenz und den Durchsatz der Laufzeit für unseren Anwendungsfall optimieren.

Deployment eines ONNX-Modells mit Seldon Core als Docker Container

Wir schauen uns an wie wir mit Seldon Core ein ONNX-Modell als Docker Container deployen können. Als Anwendungsfalls wollen wir ein Modell deployen, das in der Lage ist, anhand von Gesichtsbildern Emotionen wie neutral oder glücklich zu erkennen. Dazu verwenden wir ein bereits trainiertes Deep Convolutional Neural Network . Als Input für das Modell wird erwartet, dass die Bilder im Grayscale Format (1, 64, 64) vorliegen.

Inferenz mit nGraph

nGraph Compiler Möglichkeiten

Seldon Core verwendet für die Ausführung von ONNX-Modellen den nGraph Compiler. Der nGraph Compiler zielt darauf, die Inferenz der Modelle je nach vorliegender Hardware zu beschleunigen. Dies bedeutet, dass der Compiler passend zur Hardware die optimalen Instruktionen finden. Im Vergleich zu den nativen Deep Learning Frameworks, wirbt nGraph mit einer 45-fachen Beschleunigung der Workloads. Das funktioniert sowohl für die CPU als auch GPU. nGraph kann als Python-Paket installiert werden.

Python und Docker Wrapping des ONNX-Modells

Die Inferenz des Modells wird für Seldon Core in Python-Code entwickelt. Wir erstellen die Klasse EmotionModel, die die Inferenz mit nGraph implementiert. Dazu müssen wir in der Klasse die Methode predict() implementieren. Zusätzlich haben wir noch eine Softmax- und Postprocess-Funktion hinzugefügt, um als Rückgabewert den Labelnamen und dessen zugehörige Wahrscheinlichkeit zurückzugeben.

Anschließend erstellen wir ein zugehöriges Dockerfile. Darin müssen wir für Seldon Core folgende Umgebungsvariable spezifizieren:

MODEL bezeichnet den Name des Python-Scripts das ausgeführt wird.
API_TYPE bezeichnet die Art der Schnittstelle. Gültige Werte sind REST oder GRPC
SERVICE_TYPE bezeichnet, um welche Art von Service es sich handelt. Für den Artikel beschränken wir uns hier auf den MODEL. Eine vollständige Liste der möglichen Service-Konfigurationen gibt es hier .
PERSISTENCE hat als die 0 und 1 als die gültigen Werte. Mit dem Wert 0 werden keine Daten gespeichert. Mit dem Wert 1 werden auf einem Redis Input und das Ergebnis gespeichert.

Die Applikation ist als REST-Schnittstelle unter dem Port 5000 erreichbar. Um eine Prediction auszuführen, müssen wir den Endpoint /predict mit einem POST Request aufrufen. Mit dem folgenden Script können wir ein Bild als Payload gegen den Endpoint schicken, um ihn zu testen.

Deployment von Seldon Core auf einem Kubernetes-Cluster

Als Nächstes wird das Modell auf einem Kubernetes-Cluster deployed. Das vollständige Tutorial steht auf GitHub zur Verfügung. In diesem Artikel werden die relevanten Befehle gezeigt. Folgende Pakete werden benötigt, um das Tutorial zu absolvieren:

minikube : Lokales Kubernetes-Cluster
helm : Paket-Manager für Kubernetes
s2i (source-to-image) : Container erstellen mithilfe von Templates und Quellcode.

Zuerst müssen wir das Kubernetes-Cluster erstellen und starten. Dazu führen wir minikube start in der Shell aus.

1. Docker Container mit Source-to-image erstellen

Kubernetes ist für die Orchestrierung von Containern zuständig. Aus diesem Grund müssen wir aus unserem Modell sowie zugehörigem Code einen Container erstellen. Seldon empfiehlt dazu s2i (source-to-image). s2i erstellt anhand eines Templates und dem Quellcode einen Container. Seldon hat das Template seldonio/seldon-core-s2i-python37:0.11 erstellt. Die Benutzerbedienung des Templates kann mit dem Befehl s2i usage seldonio/seldon-core-s2i-python37:0.11 erhalten werden. Die Umgebungsvariablen, die im Dockerfile angelegt wurden, müssen in die Datei .s2i/Environment kopiert werden. Mit dem folgenden Befehl erstellen wir das Image emotion-service:0.1.

eval $(minikube docker-env) && s2i build . seldonio/seldon-core-s2i-python37:0.11 emotion-service:0.1

2. Seldon Core Operator auf Kubernetes-Cluster installieren

Anschließend installieren wir den Paket-Manager helm auf dem Cluster, um seldon-core-operator zu installieren. Dazu führen wir den Befehl helm init aus. Als Nächstes können wir den seldon-core-operator installieren. Er kümmert sich um das Deployment der Modelle. Operatoren bieten in Kubernetes die Möglichkeit, eine Applikationen auf einem Cluster zu installieren und zu deployen. Ein Operator besteht aus einer Custom Resource Definition (CRD) und einem Controller, der im Cluster deployed wird. Das CRD ist eine Art Template, mit dem die zugehörige Applikation sowie deren Eigenschaft in das Kubernetes-Cluster deployed werden können. In unserem Fall spezifizieren hierzu anhand des Templates unsere Modellapplikationen. Für mehr Details kann ich den Artikel von meinem Kollegen Roman Seyffarth empfehlen.

Der seldon-core-operator wird über helm installiert. Dazu müssen wir das Repository des Operators hinzufügen und anschließend installieren.

helm repo add seldon https://storage.googleapis.com/seldon-charts
helm install seldon/seldon-core-operator --version 0.4.0

Nachdem wir den Operatoren installiert haben, spezifizieren wir das Deployment des Modells. Dazu nehmen wir die YAML Vorlage des seldon-core-operator und erstellen anschließend die Datei emotion_service_deployment.json .

Das Deployment erstellen wir anschließend mit dem Befehl kubectl create -f emotion_service_deployment.json. Anschließend haben wir das Modell für die Inferenz in Kubernetes deployed.

3. Gateway Ambassador installieren

Ein Problem an dieser Stelle ist, dass der Modellendpunkt nicht außerhalb des Kubernetes-Clusters zur Verfügung steht. Um den Endpunkt nach außen zur Verfügung zu stellen und somit das Modell ansteuern zu können, müssen wir Ambassador im Cluster deployen. Ambassador ist ein API Gateway für Kubernetes, der ebenfalls über helm installiert werden kann.

helm install stable/ambassador --name ambassador --set crds.keep=false

Testen des Models

Übersicht des Kubernetes Cluster und Modellierung eines Requests

Um das Modell zu testen benötigen wir die IP des Kubernetes-Cluster und den Port von Ambassador:

minikube ip
kubectl get svc ambassador -o jsonpath='{.spec.ports[0].nodePort}'

Der Endpoint besteht anschließend aus http:// {minikube ip}: {ambassador port} / seldon / {namespace} / {deployment name} /api/v0.1/predictions und kann als POST Request erreicht werden.

curl -vX POST http://192.168.99.100:30809/seldon/default/seldon-emotion/api/v0.1/predictions -d @payload.json --header "Content-Type: application/json"

Der Code sowie das vollständige Kubernetes-Tutorial können im GitHub Repository naxty/seldon-core-onnx gefunden werden.

Fazit

Das Data-Science-Ökosystem von Kubernetes wächst. Mit Seldon Core haben wir eine umfangreiche Plattform, mit der Modelle in ein Kubernetes-Cluster deployed und skaliert werden können. Die Modelle können als GRPC- oder REST-Schnittstelle deployen. Weiterhin bietet Seldon Core umfangreiche Operationen, um die Daten zu transformieren und co. Der seldon-core-operator vereinfacht die Deployments eines Modells.

Credits

Ein Großteil des Tutorials wurde auf Basis von der Entwicklerdokumentation von Seldon Core erstellt und kann hier gefunden werden.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Nico Axtmann

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

Data Science in der Praxis: Häufige Fehler und Vorgehen

In diesem Artikel gehen wir auf die Besonderheiten von Data Science in der Praxis ein. Wir konzentrieren uns auf die technischen Unterschiede, häufige Fehler und Herausforderungen. Dabei lassen wird die sozialen und kommunikativen Aspekte außen vor. ...

Agilität
Machine Learning
Data

28.8.2019 | 11 Minuten Lesezeit

Nico Axtmann

Portability between deep learning frameworks – with ONNX

In recent years, the number of frameworks for deep learning has exploded. Companies such as Google, Facebook and Amazon have made their deep learning frameworks TensorFlow , PyTorch and MXNet available open-source or are actively involved in developing...

Data
Machine Learning
AI
Python

27.8.2019 | 6 Minuten Lesezeit

Nico Axtmann

Core ML – inference on iOS

In machine learning, we are training a model for a particular task, e.g. distinguishing dogs and cats in pictures. Inference refers to the application of the model. Most of the inference applications are addressed via a client-server API or used in batch...

AI
Data
iOS
Machine Learning
Mobile

19.8.2019 | 7 Minuten Lesezeit

Nico Axtmann

Inbetriebnahme eines scikit-learn-Modells mit ONNX und FastAPI

Dieser Artikel befasst sich mit dem Deployment eines Machine-Learning-Modells, das den Wert eines Hauses in Boston anhand gewisser Merkmale wie der Kriminalitätsrate des Bezirks und der Anzahl der Räume in einer Wohnung bestimmen kann. Im ersten Schritt...

Data
Python
Künstliche Intelligenz
Machine Learning

6.8.2019 | 3 Minuten Lesezeit

Nico Axtmann

Core ML – Inferenz unter IOS

Beim maschinellen Lernen wird ein Modell für eine gewisse Aufgabe wie bspw. das Unterscheiden von Hunden und Katzen auf Bildern trainiert. Die Inferenz bezeichnet die Anwendung des Modells. Ein Großteil der Inferenz-Anwendungen wird über eine Client-...

14.5.2019 | 8 Minuten Lesezeit

Nico Axtmann

Skalierbare Bildklassifizierung mit ONNX und AWS Lambda

In meinem Blogartikel ONNX – Portabilität von Deep-Learning-Modellen haben wir bereits ONNX kennengelernt und was es damit auf sich hat. Zur Erinnerung: ONNX ist ein Open Source geführter Standard, mit dem Modelle zwischen verschiedenen Deep-Learning...

13.5.2019 | 7 Minuten Lesezeit

Nico Axtmann

ONNX – Portabilität von Deep-Learning-Modellen

In den vergangenen Jahren ist die Anzahl an Frameworks für Deep Learning explodiert. Unternehmen wie Google, Facebook und Amazon haben ihre Deep Learning Frameworks TensorFlow , PyTorch und MXNet quelloffen zur Verfügung gestellt oder entwickeln aktiv...

Künstliche Intelligenz
Python

10.4.2019 | 6 Minuten Lesezeit

Nico Axtmann

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Große Sprachmodelle: Was ist ein LLM?

Große Sprachmodelle (Large Language Models oder LLM) haben in den letzten Jahren enorme Fortschritte gemacht und spielen eine entscheidende Rolle in verschiedenen Anwendungen. Aber was ist ein LLM? Es ist sinnvoll zu erklären, was ein „einfaches“ Sprachmodell...

Machine Learning

20.6.2023 | 4 Minuten Lesezeit

Elvira Siegel

Green Cloud: Nachhaltig skalieren

Wenn Softwareprojekte in die Cloud gebracht werden, versprechen wir uns davon hohe Verfügbarkeit, planbare Kosten und eine immer dem Bedarf entsprechende Skalierung. Aufgrund der grenzenlosen Angebote ist es aber auch leicht, die Komponenten eines Systems...

Cloud
Softwarearchitektur
Green IT

12.6.2023 | 5 Minuten Lesezeit

Dennis

Green Cloud: Ideen für eine nachhaltigere Architektur

Die ökologische Nachhaltigkeit eines Systems ist aktuell häufig noch kein Thema. Nachhaltigkeit bedeutet für mich in diesem Kontext die Reduktion der verursachten Emissionen durch gesenkten Ressourcenverbrauch – egal ob die Emissionen beim Cloudprovider...

Cloud
Softwarearchitektur
Green IT

5.5.2023 | 5 Minuten Lesezeit

Dennis

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

Wir alle kennen es. Wir bekommen neuen Code und irgendwie macht der merkwürdige Sachen. Teilweise müssen wir Reverse Engineering betreiben. Wir wundern uns, warum eine Umgebungsvariable nicht korrekt gesetzt wird oder der Login schief geht. Bis wir merken...

Python
Softwareentwicklung
Softwarearchitektur

30.11.2022 | 7 Minuten Lesezeit

Robert Meißner

Open Policy Agent – Maschinen, die auf Regeln starren

Der Open Policy Agent (OPA) ist eine universell einsetzbare, quelloffene Policy Engine, also eine Sammlung von Komponenten, die eine einheitliche und effiziente Umsetzung von Regeln aller Art erlaubt. Dieser Artikel zeigt ein kleines Praxisbeispiel. ...

CI/CD
Softwarearchitektur
IT-Security

19.10.2022 | 5 Minuten Lesezeit

Marco Paga

GitHub Copilot – Pair Programming mit der KI

Vor drei Monaten konnte ich zum ersten Mal mit GitHub Copilot von Microsoft auf die Startbahn gehen. Ob der Flug erfolgreich war oder ob ich es gar nicht in die Luft geschafft habe, möchte ich euch einmal berichten. Was ist GitHub Copilot? Der Copilot...

Künstliche Intelligenz
GitHub
Microsoft

6.10.2022 | 8 Minuten Lesezeit

Danny Steinbrecher

Microstream – das Ende der O/R-Mapper?

Über eine Suche nach Alternativen zu O/R-Mappern und Persistenz-Frameworks für NoSQL-Datenbanken bin ich auf Microstream aufmerksam geworden und war ziemlich schnell interessiert. Zum einen, weil Microstream wie ich aus der Oberpfalz kommt, aber haupts...

Java
Datenbank
Softwarearchitektur

29.9.2022 | 13 Minuten Lesezeit

Felix Rieß

Hotwire: Ein neuer (alter) Ansatz für moderne Webanwendungen

Hotwire (HTML over the wire) wurde Ende 2020 von Basecamp vorgestellt und verspricht einen alternativen Ansatz zur Entwicklung moderner Webanwendungen mit weniger JavaScript:Hotwire is an alternative approach to building modern web applications without...

Frontend
Softwarearchitektur
Microservices
JavaScript
Webdevelopment

24.8.2022 | 9 Minuten Lesezeit

Felix Rieß

Streaming Wikipedia mit Apache Kafka

Apache Kafka ist in aller Munde und entwickelt sich im Kontext von verteilten Systemen zum De-facto-Standard als Plattform für Event Streaming. Im Rahmen unserer OffProject Time (Weiterbildungszeit) haben wir uns die Plattform auch näher angeschaut und...

Kotlin
Data
Java
Messaging
Spring

15.8.2022 | 10 Minuten Lesezeit

Christoph Metzger

Felix Rieß

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

In diesem Artikel möchte ich euch mit einem Python Jupyter Notebook zeigen, wie ihr Anwendungsfälle der Tourenoptimierung inklusive Nebenbedingungen lösen und visualisieren könnt. Außerdem zeige ich euch, wie ihr mit OpenStreetMaps die Route zwischen...

Data

21.6.2022 | 7 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

In diesem Artikel möchte ich euch zeigen, wie ihr Probleme der Tourenoptimierung in einem Python Jupyter Notebook lösen und visualisieren könnt. Am Beispiel eines Fahrradkurierdienst zeige ich außerdem, wie das Grundproblem um gängige Nebenbedingungen...

Data

16.6.2022 | 9 Minuten Lesezeit

Lukas Heidemann

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Deployment von Machine-Learning-Modellen mit Seldon Core

Die Rolle von Kubernetes in der Data-Science-Welt

Seldon Core

Deployment eines ONNX-Modells mit Seldon Core als Docker Container

Inferenz mit nGraph

Python und Docker Wrapping des ONNX-Modells

Deployment von Seldon Core auf einem Kubernetes-Cluster

1. Docker Container mit Source-to-image erstellen

2. Seldon Core Operator auf Kubernetes-Cluster installieren

3. Gateway Ambassador installieren

Testen des Models

Fazit

Credits

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Data Science in der Praxis: Häufige Fehler und Vorgehen

Portability between deep learning frameworks – with ONNX

Core ML – inference on iOS

Inbetriebnahme eines scikit-learn-Modells mit ONNX und FastAPI

Core ML – Inferenz unter IOS

Skalierbare Bildklassifizierung mit ONNX und AWS Lambda

ONNX – Portabilität von Deep-Learning-Modellen

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Green Cloud: Daten und Emissionen sparen

Charge your APIs Volume 23: REST vs. gRPC

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Große Sprachmodelle: Was ist ein LLM?

Green Cloud: Nachhaltig skalieren

Green Cloud: Ideen für eine nachhaltigere Architektur

Bessere SQL-Datenpipelines mit dbt

ChatGPT im Alltag eines Python-Entwicklers

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

Open Policy Agent – Maschinen, die auf Regeln starren

GitHub Copilot – Pair Programming mit der KI

Microstream – das Ende der O/R-Mapper?

Hotwire: Ein neuer (alter) Ansatz für moderne Webanwendungen

Streaming Wikipedia mit Apache Kafka

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten