KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

29.7.2020 | 10 Minuten Lesezeit

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man viele Use Cases ohne Investment in KI-Forschung mittels bestehender KI-Technologie umsetzen. Ein Beispiel hierür ist die (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen.

Warum es daher auch für kleine und mittelständischen Unternehmen spannend sein kann, sich mit KI zu beschäftigen, haben wir im Blogpost KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen beschrieben.

In diesem Artikel zeigen wir nun, wie ein solches Vorhaben exemplarisch auf AWS umgesetzt werden kann. Dazu trainieren wir mithilfe von Amazon Rekognition ein Modell und integrieren es mittels Lambda-Functions und Elastic Beanstalk perspektivisch in einen Prozess, der manuelle Nachkorrekturen in der Qualitätskontrolle erlaubt.

Der Code zu diesem Projekt befindet sich im Repository aws-automated-quality-inspection .

Architektur des KI-Systems

Die folgende Abbildung zeigt unsere Beispielarchitektur auf AWS.

Vogelperspektive der Implementierung auf AWS

Um ein KI-Modell zur Automatisierung zu erhalten, verwenden wir den Machine-Learning-Service Rekognition. Dieser ermöglicht es, ein State-of-the-Art-KI-Modell zur Bildklassifizierung auf einem eigenen Datensatz in wenigen Schritten zu trainieren. Darüber hinaus können die so trainierten Modelle direkt über den Service gehostet werden.

Da das Modell alleine noch keinen Mehrwert bietet, binden wir es exemplarisch in einen Prozess ein. Dabei werden Bilder von Bauteilen zunächst in einen S3-Bucket abgelegt. Der Upload eines Bildes triggert eine Lambda-Function, welche das gehostete KI-Modell aufruft und so das Bild klassifiziert. Das Ergebnis der Vorhersage wird dann zur weiteren Verarbeitung in eine SQS(Simple Queue Service)-Queue abgelegt.

Die SQS-Queue triggert eine zweite Lambda-Function. Diese enthält die Verarbeitungslogik, um eingehende Bilder anhand des Ergebnisses der Klassifikation zu sortieren. Vorhersagen, deren Konfidenz unter einem vorher definierten Schwellwert liegen, werden als „unsicher“ definiert. Solche Bilder müssen in einem weiteren Schritt durch Facharbeiter*innen nachbearbeitet werden. Diese Nachbearbeitung kann über eine auf Elastic Beanstalk gehostete Demo-Anwendung beispielhaft durchgeführt werden.

Um alle Komponenten dieses KI-Systems zum Laufen zu bringen, sind die folgenden drei Schritte notwendig:

Vorbereitung, Training und Serving mit Rekognition
Integration des Modells mit Lambda-Functions
Deployment der Applikation zur manuellen Nachbearbeitung mit Elastic Beanstalk

Diese werden wir im weiteren Verlauf des Artikels genauer beschreiben.

Voraussetzungen

Für dieses Tutorial wird Zugang zu verschiedenen AWS-Services benötigt. Hierzu haben wir der Einfachheit halber ein AWS-Konto mit AdministratorAccess eingerichtet. In einer realen Produktionsumgebung sollte das „principle of least privilege“ erfüllt und das Konto oder ggf. die Konten entsprechend eingeschränkt werden. Zur Interaktion mit den AWS-Services verwenden wir die AWS CLI und setzen voraus, dass die nachfolgenden Umgebungsvariablen gesetzt sind oder die Befehle über ein entsprechendes AWS-Profil für die CLI ausgeführt werden.

AWS_ACCESS_KEY_ID="my-admin-account-access-key-id"
AWS_SECRET_ACCESS_KEY="my-admin-account-secret-access-key"
AWS_DEFAULT_REGION=eu-west-1

Für unser Beispiel verwenden wir den Datensatz casting product data for quality inspection von Kaggle. Dieser beinhaltet Aufnahmen von Unterwasserpumpen-Bauteilen, die entweder als „okay“ oder „defect“ klassifiziert sind.

Der vollständige Code zum Projekt kann aus dem Repository aws-automated-quality-inspection heruntergeladen werden.

Vorbereitung, Training und Serving mit Amazon Rekognition

Nachdem die Daten von Kaggle heruntergeladen sind, werden diese entpackt und im data-Ordner gespeichert. Nach dem Entpacken hat das Verzeichnis die Struktur:

data
└── casting_data
    ├── test
    │   ├── def_front
    │   │   ├── ....
    │   │   └── new__0_9334.jpeg
    │   └── ok_front
    │       ├── ....
    │       └── cast_ok_0_9996.jpeg
    └── train
        ├── def_front
        │   ├── ...
        │   └── cast_def_0_9997.jpeg
        └── ok_front
            ├── ...
            └── cast_ok_0_9998.jpeg

Um ein KI-Modell mit Rekognition zu trainieren, müssen die Daten zunächst in einen S3-Bucket hochgeladen werden. Da Rekognition mit custom-labels derzeit in Europa nur in der Region EU-WEST-1 verfügbar ist, erstellen wir dort den Bucket und laden die Daten hoch.

TRAINING_DATA_BUCKET="product-quality-data"
aws s3 mb s3://${TRAINING_DATA_BUCKET}
aws s3 cp data/casting_data s3://${TRAINING_DATA_BUCKET}/ --recursive

Nun verwenden wir das Rekognition-UI, um den Service initial einzurichten. Dabei wird unter anderem ein zusätzlicher S3-Bucket erstellt, welchen Rekognition intern als Speicher verwendet.

Initiales Einrichten von Rekognition

Als nächstes erstellen wir ein Project in Rekognition, dieses dient insbesondere der Verwaltung zusammengehöriger Datensätze und Modelle.

Projekt erstellen in Rekognition

Nun kann in Rekognition der Trainings- und Testdatensatz erstellt werden. Hierzu importieren wir die Daten aus dem vorher angelegten S3-Bucket und setzen die Label automatisch anhand der Ordnerstruktur.

Trainingsdatensatz in Rekognition erstellen

Um dem Rekognition-Service Zugang zu den Daten zu erlauben, muss die im UI angezeigte Permission für den TRAINING_DATA_BUCKET gesetzt werden.

Nach dem Import ist es möglich, die Daten in Rekognition zu inspizieren. Dies ist vor allem hilfreich, um die Datenqualität selektiv zu begutachten. Jetzt kann das Training des Modells gestartet werden. Hierzu wählen wir den vorher erstellten Training- und Testdatensatz aus.

Trainieren des Rekognition-Modells

Nach dem Training bekommt man eine erste Evaluation des Modells auf dem Testdatensazu direkt angezeigt. Hier kann man sich verschiedene Gütekriterien wie beispielsweise F1-Score anzeigen lassen. Weiterhin sind verschiedene Möglichkeiten gegeben, das Modell sowie dessen Vorhersagen interaktiv zu visualisieren.

Nun können wir das trainierte Modell als Service Endpoint starten.

aws rekognition start-project-version --project-version-arn "arn:aws:rekognition:eu-west-1:452161433274:project/product_quality/version/product_quality.2020-07-17T09.39.14/1594971554815" --min-inference-units 1 --region eu-west-1

Vorsicht: Ein laufendes Modell erzeugt Kosten von 4 Dollar pro Stunde.

Integration des Modells mit Lambda-Functions

Die Integration des Rekognition-Modells erfolgt über die zwei Lambda-Functions Prediction und Moving. Die Umsetzung ist im nachfolgenden Bild visualisiert.

Integration des Rekognition-Modells mit Lambda-Functions

Für jeden Bild-Upload in den INBOUND_BUCKET wird die Prediction-Funktion automatisch ausgeführt. Die Funktion klassifiziert das Bild mit dem Rekognition-Modell-Endpoint. Anschließend schreibt sie das Ergebnis auf in eine SQS-Queue. Hierdurch wird wiederum die Moving-Funktion getriggert. Diese beinhaltet die Logik, um die Bilder anhand des Klassifizierungsergebnisses zu sortieren.

Vorbereitungen

Bevor wir die Lambda-Functions einsetzen können, müssen wir eine „executioner role“ mit entsprechenden Berechtigungen erstellen. In einer realen Produktionsumgebung sollten wir hier erneut das „principle of least privilege“ erfüllen. In dieser Demo halten wir es jedoch einfach und erstellen eine Rolle für beide Funktionen.

Zunächst erstellen wir die executioner role über:

aws iam create-role --role-name lambda-ex --assume-role-policy-document '{"Version": "2012-10-17","Statement": [{ "Effect": "Allow", "Principal": {"Service": "lambda.amazonaws.com"}, "Action": "sts:AssumeRole"}]}'

Anschließend fügen wir die Policies AWSLambdaFullAccess, AmazonSQSFullAccess and AmazonRekognitionCustomLabelsFullAccess hinzu:

aws iam attach-role-policy --role-name lambda-ex --policy-arn arn:aws:iam::aws:policy/AWSLambdaFullAccess
aws iam attach-role-policy --role-name lambda-ex --policy-arn arn:aws:iam::aws:policy/AmazonSQSFullAccess
aws iam attach-role-policy --role-name lambda-ex --policy-arn arn:aws:iam::aws:policy/AmazonRekognitionCustomLabelsFullAccess

Diese executioner-Rolle werden wir nun verwenden, um die Lambda-Functions zu deployen.

Prediction

Als Erstes werden die benötigten Umgebungsvariablen gesetzt:

ACCOUNT_ID="my-account-id"
MODEL_ARN="my-rekognition-mode-arn"
INBOUND_BUCKET="my_prediction_bucket"
PREDICTION_QUEUE="my_prediction_queue"
PREDICT_LAMBDA_NAME="predict_picture"

Hier ist die ACCOUNT_ID die ID des AWS-Kontos. Die MODEL_ARN ist die ARN des Rekognition-Modells, welches im vorherigen Schritt deployt wurde. Die ARN kann aus dem Rekognition-UI entnommen werden. Die Namen für den Bucket INBOUND_BUCKET und die SQS-Queue PREDICTION_QUEUE können frei gewählt werden. Der Wert für PREDICT_LAMBDA_NAME muss nicht geändert werden.

Dann erstellen wir den INBOUND_BUCKET und die PREDICTION_QUEUE.

aws s3 mb s3://${INBOUND_BUCKET}
SQS_QUEUE_URL=$(aws sqs create-queue --queue-name ${PREDICTION_QUEUE} --query "QueueUrl")

Hier speichern wir den Wert SQS_QUEUE_URL, da wir diesen in einem späteren Befehl benötigen. Als nächstes zippen wir den Code für die Lambda-Function mit:

cd lambda_functions/predict
zip predict_function.zip predict.py
cd ../..

Schließlich deployen wir über

aws lambda create-function \
--function-name ${PREDICT_LAMBDA_NAME} \
--zip-file fileb://lambda_functions/predict/predict_function.zip \
--runtime python3.7 \
--role arn:aws:iam::452161433274:role/lambda-ex \
--handler predict.lambda_handler \
--environment Variables="{model_arn=${MODEL_ARN},sqs_queue=${PREDICTION_QUEUE}}"

die Lambda-Function. Um die Lambda-Function bei jedem Upload eines Bildes in den INBOUND_BUCKET zu triggern, müssen wir als nächstes dem S3-Bucket die Erlaubnis erteilen, die Lambda-Function auszuführen.

aws lambda add-permission \
--function-name ${PREDICT_LAMBDA_NAME} \
--action lambda:InvokeFunction \
--statement-id s3invoke \
--principal s3.amazonaws.com \
--source-arn arn:aws:s3:::${INBOUND_BUCKET} \
--source-account ${ACCOUNT_ID}

Nun können wir die Event-Notification für den Bucket erstellen.

aws s3api put-bucket-notification-configuration \
 --bucket ${INBOUND_BUCKET} \
 --notification-configuration file://lambda_functions/s3triggerNotification.json

Hierzu muss die ARN der Lambda-Function im File s3triggerNotification.json angepasst werden.

Moving

Die Moving-Function verarbeitet Nachrichten auf der PREDICTION_QUEUE. Die Verarbeitungslogik ist im folgenden Bild dargestellt.

Verarbeitungslogik der Lambda-Function, die durch eine SQS-Queue getriggert wird.

Sobald eine Nachricht eintrifft, löst das die Moving-Lambda-Function aus. Diese verarbeitet die Ergebnisse anhand der Konfidenz, dem Label und dem Schwellwert. Abhängig von diesen drei Werten wird das zugehörige Bild vom INBOUND_BUCKET in die spezifischen Verzeichnisse des PREDICTION_BUCKET bewegt:

okay: Bilder, auf denen kein Fehler erkannt wurde.
defect: Bilder, auf denen ein Fehler erkannt wurde.
unclear: Bilder, bei denen sich das Modell unsicher ist. In diesem Fall liegt die Konfidenz unter dem gewünschten Schwellwert.

Vor dem Deployment legen wir zunächst die folgenden Umgebungsvariablen an.

PREDICTION_BUCKET="my_prediction_bucket"
PREDICTION_THRESHOLD="0.8"
MOVE_LAMBDA_NAME="move_picture"

Hier kann der Name PREDICTION_BUCKET für den Bucket frei gewählt werden. Der PREDICTION_THRESHOLD definiert die Schwelle für Vorhersagen, die wir für unlcear halten. Der Name MOVE_LAMBDA_NAME muss nicht geändert werden.

Zunächst erstellen wir den S3-Bucket:

aws s3 mb s3://${PREDICTION_BUCKET}

Dann zippen wir den Code für die Lambda-Function

cd lambda_functions/move
zip move_function.zip move.py
cd ../..

und deployen sie mittels

aws lambda create-function \
--function-name ${MOVE_LAMBDA_NAME} \
--zip-file fileb://lambda_functions/move/move_function.zip \
--runtime python3.7 \
--role arn:aws:iam::452161433274:role/lambda-ex \
--handler move.lambda_handler \
--environment Variables="{prediction_bucket=${PREDICTION_BUCKET}, prediction_threshold=${PREDICTION_THRESHOLD}}"

Anschließend erstellen wir das Event-Source-Mapping, welches die Lambda-Functions über die SQS-Queue triggert

SQS_QUEUE_ARN=$(aws sqs get-queue-attributes --queue-url ${SQS_QUEUE_URL//\"} --attribute-names All --query Attributes.QueueArn)

aws lambda create-event-source-mapping \
 --function-name ${MOVE_LAMBDA_NAME} \
 --batch-size 1 \
 --event-source-arn ${SQS_QUEUE_ARN//\"}

Dabei benötigen wir den Wert SQS_QUEUE_URL von zuvor.

Deployment der Applikation zur manuellen Nachbearbeitung mit Elastic Beanstalk

Bei den unklaren Fällen wird der Input von Facharbeiter*innen benötigt. Über eine simple Webapplikation stellen wir hierfür die Bilder aus dem unclear-Verzeichnis des PREDICTION_BUCKET im Browser dar. Auf diese Weise können die Bauteile im Detail kontrolliert und manuell eingeteilt werden.

Die folgende Abbildung zeigt die Architektur der Applikation.

Architektur der Applikation mit Elastic Beanstalk, FastAPI, React und S3

Die Applikation ist in Python mit FastAPI entwickelt und liefert mittels einer statischen Webseite ein React-Frontend aus.

Vorbereitungen

Um die Anwendung mit Elastic Beanstalk deployen zu können, verwenden wir die EB CLI .

Zuerst wechseln wir in das ebs_app/-Verzeichnis und initialisieren das Deployment über

eb init product-quality-api --platform python-3.7  --region eu-west-1

Dadurch wird unter anderen der Ordner .elasticbeanstalk angelegt, in dem nun die Konfigurationsdatei config.yml der Anwendung liegt. Als nächstes erstellen wir die Laufzeitumgebung der Anwendung mittels

eb create product-quality-api-env --single

Das --single-Flag baut die Umgebung mit einer einzigen EC2-Instanz und ohne Load Balancer, daher sollte diese Umgebung nur zum Testen etwa unserer Demo-Anwendung verwendet werden. Für produktive Anwendungen muss eine geeignete Konfiguration der Umgebung vorgenommen werden. Das Bereitstellen der Umgebung benötigt einige Minuten. Sobald die Umgebung erstellt ist deployen wir nun die Anwendung.

eb deploy product-quality-api-env

Schließlich können wir die Anwendung über eb open im Browser öffnen:

Webanwendung, um unsichere Bilder zu inspizieren – Bilder werden manuell als „Ok“ oder „Defect“ klassifiziert.

Die Applikation liest nun im PREDICTION_BUCKET das unclear-Verzeichnis aus. Um sie zu testen, kann ein Bild in das Verzeichnis hochgeladen werden. Nachdem das Bild manuell klassifiziert wurde, wird es im Verzeichnis human_decided mit dem Prefix des Labels abgespeichert.

Wie teuer ist der Betrieb dieses KI-Systems?

Eine Frage, die bei dem Betrieb einer solchen Cloud-Anwendung aufkommt, sind die Kosten. Grundsätzlich ist es schwierig, ohne konkreten Use Case eine genaue Kalkulation der Kosten aufzustellen. Neben der Anzahl an Aufrufen spielt auch noch das Umfeld der Lösung eine wichtige Rolle. Dennoch möchten wir an dieser Stelle auf die Kosten eingehen. Wir unterscheiden hierbei zwischen einmaligen, fixen und dynamischen Kostenpunkten:

Einmalig: Kosten beispielsweise für das Modelltraining
Fix: Kosten für die Verfügbarkeit der Anwendung. Zum Beispiel der Service Endpoint des Modells und Bereitstellung der Webanwendungen mit Elastic Beanstalk
Dynamisch: Kosten, die durch Benutzung und Auslastung anfallen, wie beispielweise Speicherplatz in S3 und Rechenzeit für Lambda-Functions.

Die folgende Tabelle listet die Haupt-Kostenpunkte des Systems ohne Bezug zum Netzwerk-Traffic:

Auflistung der Kosten ohne Netzwerktraffic
Einmalig	Fix	Dynamisch
Rekognition: Modell-Training 1 $ pro Stunde	Rekognition: Modell-Deployment 4 $ pro Stunde	S3: – Datenspeicherung: 0,023 $ pro GB (Erste 50 TB/Monat) – Netzwerk (ausgehender Traffic): 0,09 $ pro GB (Bis 10,000 TB) – Schreiben und Auflisten pro Objekt: 0,005 $ pro 1000 Vorgänge – Lesen und Abrufen pro Objekt: 0,0004 $ pro 1000 Vorgänge
	Elastic Beanstalk: t2.medium Instanz pro Stunde und Instanz 0,05 $	Lambda Functions: – Aufrufe: 0.20 $ pro 1M Aufrufe – Rechenzeit bei 128 MB: 0.0000002083 $ pro 100ms

Um dennoch eine initiale Vorstellung der Kosten zu konkretisieren, gehen wir von der folgenden Annahmen aus:

Jeden Tag fallen 1.000 Bilder mit je 1 MiB an.
5 % der Bilder werden als unsicher klassifiziert.
Die Anwendung läuft 24h am Tag über 30 Tage hinweg.

In diesem Kontext ergeben sich die nachfolgenden Kosten:

Einmalig:
- Modell-Training: 1,08 $ * ~2 Stunden = 2,16 $
Fix:
- Modell-Deployment: 4 $ * 24 Stunden * 30 Tage = 2880 $
- Elastic-Beanstalk-Anwendung: 0,05 $ * 24 Stunden * 30 Tage = 36 $
Dynamisch:
Die dynamischen Kosten fallen in unserem Beispiel nur marginal ins Gewicht, weshalb wir diese mit den folgenden Volumen abschätzen:
- S3: < 1,5 $
- Lambda-Functions: < 1 $

Hierbei berücksichtigen wir das Free Tier von AWS nicht.

Anhand dieser Rechnung ist klar erkennbar, dass das Modell-Deployment die höchsten Kosten verursacht. Diese Kosten können gegebenenfalls weiter reduziert werden, beispielsweise durch ein gezieltes Ein- und Ausschalten des Modells.

Fazit

In diesem Blog-Artikel haben wir gezeigt, wie man in wenigen Schritten ein initiales KI-System zur Semi-Automatisierung in der Qualitätskontrolle, auf AWS umsetzen kann.

Der Einsatz von Cloud-Computing-Diensten ermöglicht es, datengetriebene Services und Produkte einerseits schnell zu prototypisieren und andererseits mit überschaubarer Fertigungstiefe produktiv zu setzen. Insbesondere ermöglichen es Services wie Elastic Beanstalk und Lambda-Functions Entwickler*innen, sich mehr auf die eigentliche Wertschöpfung zu fokussieren und weniger mit dem operativen Betrieb der Anwendungen auseinanderzusetzen.

Zur Bilderkennung mittels KI kann heutzutage ein ausreichend gutes KI-Modell ohne mühsamen Aufwand entwickelt werden. Dadurch sinkt die Eintrittsbarriere zur Validierung datengetriebener Produkte. KI-Projekte können durch die technologischen Fortschritte in der Cloud-Entwicklung im Speedboot-Verfahren durchgeführt werden.

Unserer Herangehensweise an KI-Projekte haben wir in unserem On-Demand-Webinar (Deutsch) vorgestellt.

Jetzt einen unverbindlichen Austausch anfordern über ki@codecentic.de .

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*innen

Marcel Mikl

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Nico Axtmann

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Marcel Mikl

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Heutzutage steht fast alles, was mit den Labels „künstliche Intelligenz (KI)“ oder „Machine Learning (ML)“ versehen ist, für Fortschritt. Seltsamerweise schließt diese Assoziation jedoch häufig die Themen Daten und Dateninfrastruktur nicht ausreichend...

Kultur
Data
Machine Learning

21.6.2021 | 12 Minuten Lesezeit

Marcel Mikl

DISH-O-TRON – Train that vision model!

With this article we continue our endeavor of building dish-o-tron – an AI system designed to prevent the sudden appearance of dirty dishes in the community kitchen sink, and hence turning the community kitchen into a place of peace and harmony. This...

AI
Computer Vision

11.10.2020 | 11 Minuten Lesezeit

Marcel Mikl

Oliver Moser

DISH-O-TRON – Gather that DATA you must!

This is the second article in our dish-o-tron series (a non-standard Deep Learning tutorial) in which we tackle one of the biggest problems in community kitchens: coming across someone else’s dirty dishes. We are facing this problem by building a state...

AI
Computer Vision
Machine Learning

24.9.2020 | 11 Minuten Lesezeit

Marcel Mikl

Oliver Moser

DISH-O-TRON – No more dirty dishes thanks to AI

Sadly, to tell you the truth, doing dishes is still a thing. However, so far most of our readers still like our non-standard Deep Learning tutorial. Typically, AI is demonstrated as solving various toy problems. AI plays chess and Go, AI plays video ...

10.9.2020 | 7 Minuten Lesezeit

Marcel Mikl

Oliver Moser

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

Thinking AI means re-thinking data

While doing AI is sexy and cool, data infrastructure is typically not considered any of this. However, production-grade machine learning applications heavily rely on proper data infrastructure. Hence, in order to generate actual business value, solid...

AI
Big Data
Data
Machine Learning

27.5.2020 | 7 Minuten Lesezeit

Marcel Mikl

Wie man Data-Science-Projekte nicht in die PoC-Sackgasse manövriert

Warum gelingt es Data-Science-Initiativen häufig nicht, einen echten Mehrwert zu schaffen? Wir haben einige Ursachen dafür ausgemacht. In diesem Blogpost stellen wir vier typische Fallen für Data-Science-Projekte vor und geben Tipps, wie Du sie umschiffen...

Machine Learning
Data
Künstliche Intelligenz
Softwareentwicklung

27.3.2020 | 11 Minuten Lesezeit

Marcel Mikl

Great Expectations: Validating datasets in machine learning pipelines

Typically your favorite machine learning model doesn’t care whether or not your input dataset is professionally and technically correct. However, particularly for machine learning algorithms, the all-encompassing truth garbage in, garbage out holds true...

Python
Data
Machine Learning

17.2.2020 | 6 Minuten Lesezeit

Marcel Mikl

Remote training with GitLab-CI and DVC

In many Data Science projects there is a point in time where the workstation under your desk is not the ideal machine to perform the model training anymore. More potent processors and GPUs are required, e.g. a suitable server in your company’s rack or...

Git
Machine Learning
CI/CD
AI
GitLab

27.1.2020 | 15 Minuten Lesezeit

Marcel Mikl

Bert Besser

E-Mail-Klassifizierung mit SpaCy

Noch vor kurzer Zeit war E-Mail-Klassifikation mittels Deep Learning nur mit Spezialwissen und ausreichend Data Science Know-how möglich. Heute existieren sehr gute Open-Source-Bibliotheken mit fertigen Deep-Learning-Modellen, welche sehr weit optimiert...

Data
Machine Learning

28.4.2019 | 8 Minuten Lesezeit

Marcel Mikl

Kunden-E-Mails effizient verarbeiten – mit künstlicher Intelligenz

Einleitung Künstliche Intelligenz (KI) findet sich heutzutage scheinbar überall. Bereits ohne den derzeitigen Hype-Faktor um KI ist der Begriff nur schwer zu greifen. Viele Unternehmen sehen sich unter Zugzwang, KI als neue Technologie einzusetzen und...

Data
Künstliche Intelligenz

7.4.2019 | 7 Minuten Lesezeit

Marcel Mikl

Oliver Moser

Wie trainiert man eigentlich neuronale Netze?

Neuronale Netze sind für Außenstehende häufig von einer mystischen Aura umgeben. Sie werden regelmäßig in Verbindung mit menschlichen Gehirnen gebracht, und ihnen wird eine sich verselbständigende Intelligenz zugeschrieben. Das macht sie für viele mysteriös...

Künstliche Intelligenz

27.8.2018 | 8 Minuten Lesezeit

Marcel Mikl

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Public Cloud im regulierten Sektor: Das ist zu beachten

Es war längere Zeit ein weit verbreitetes und in strategischen Debatten häufig zitiertes Missverständnis, dass die Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) dem Einsatz von Public-Cloud-Anbietern wie AWS, Azure und Co. einen Riegel vorschiebt...

Cloud
Compliance

10.4.2024 | 6 Minuten Lesezeit

Marc Bialowons

Björn Bohn

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

AZ-900-Zertifizierung: Mein How-to!

Was ist AZ-900? Azure bietet eine Reihe verschiedener Zertifizierungen an. Zu finden sind sie hier. Darunter befindet sich auch die Zertifizierung AZ-900. Bei diesem Zertifikat handelt es sich um Microsoft Certified: Azure Fundamentals. Diese prüft unter...

Azure
Cloud

2.1.2024 | 5 Minuten Lesezeit

Ege Inanc

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

In der Welt der Cloud-Technologie und insbesondere bei AWS (Amazon Web Services) ist die effiziente Verwaltung von Ressourcen von entscheidender Bedeutung, um unnötige Kosten zu vermeiden. Dieser Blogbeitrag konzentriert sich auf AWS S3 und die teuren...

AWS
Cloud

27.11.2023 | 4 Minuten Lesezeit

Lukas Miliunas

Maximilian Mayer

Cloud FinOps

Cloud FinOps bietet einen etablierten Prozess, um Kosten für den Cloudbetrieb zu reduzieren (s. auch diesen Artikel). Zu diesem Zweck bietet es ein etabliertes Cloud-unabhängiges Vorgehen, das eine Organisation schrittweise aufgreifen kann. Das Tooling...

Cloud
Cloud Native
Green IT

26.10.2023 | 5 Minuten Lesezeit

Lukas Miliunas

Marco Paga

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Mehr Struktur in der Cloud mit Azure Landing Zones

Die Migration in die Cloud bringt einige Herausforderungen mit sich. Viele Unternehmen stehen vor der Frage, wie ein effizienter und sicherer Aufbau einer skalierbaren Cloud-Infrastruktur umzusetzen ist. Die Antwort auf diese Herausforderung liegt in...

Cloud
Azure
IT-Governance

4.8.2023 | 4 Minuten Lesezeit

Florian Moll

Nils Bauroth

CI/CD-Pipelines mit AWS CDK CodePipeline

Das Aufsetzen der CI/CD-Pipeline ist ein typischer Task in der Anfangszeit eines Projekts. Ist die Pipeline dann aufgesetzt, sind Änderungen nur noch selten notwendig. Dementsprechend wenig Routine entwickeln Programmierende im Umgang mit der Konfiguration...

Cloud
CI/CD
AWS

17.7.2023 | 4 Minuten Lesezeit

Dennis

Große Sprachmodelle: Was ist ein LLM?

Große Sprachmodelle (Large Language Models oder LLM) haben in den letzten Jahren enorme Fortschritte gemacht und spielen eine entscheidende Rolle in verschiedenen Anwendungen. Aber was ist ein LLM? Es ist sinnvoll zu erklären, was ein „einfaches“ Sprachmodell...

Machine Learning

20.6.2023 | 4 Minuten Lesezeit

Elvira Siegel

Green Cloud: Nachhaltig skalieren

Wenn Softwareprojekte in die Cloud gebracht werden, versprechen wir uns davon hohe Verfügbarkeit, planbare Kosten und eine immer dem Bedarf entsprechende Skalierung. Aufgrund der grenzenlosen Angebote ist es aber auch leicht, die Komponenten eines Systems...

Cloud
Softwarearchitektur
Green IT

12.6.2023 | 5 Minuten Lesezeit

Dennis

Crossplane: Eine Lösung für hybride Cloud-Herausforderungen?

Crossplane ist ein plattformübergreifendes Kontrollsystem (Control-Plane), das das Management von Cloud-Ressourcen vereinfachen und automatisieren soll. Das Tool ermöglicht es, verschiedene Cloud-Provider und lokale Ressourcen, z. B. Kubernetes-Cluster...

Cloud
Cloud Native

12.5.2023 | 2 Minuten Lesezeit

Matthias Niehoff

Green Cloud: Ideen für eine nachhaltigere Architektur

Die ökologische Nachhaltigkeit eines Systems ist aktuell häufig noch kein Thema. Nachhaltigkeit bedeutet für mich in diesem Kontext die Reduktion der verursachten Emissionen durch gesenkten Ressourcenverbrauch – egal ob die Emissionen beim Cloudprovider...

Cloud
Softwarearchitektur
Green IT

5.5.2023 | 5 Minuten Lesezeit

Dennis

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Wenn wir Erkenntnisse aus großen Datenmengen gewinnen wollen, bieten uns Cloud Service Provider inzwischen Lösungen an, dank derer wir uns kein Data Warehouse oder Hadoop-Cluster mehr in den Keller stellen müssen. AWS hat mit Athena, RedShift und EMR...

Cloud
Big Data
AWS
Serverless
GitLab

21.3.2023 | 16 Minuten Lesezeit

Maik Fleuter

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Architektur des KI-Systems

Voraussetzungen

Vorbereitung, Training und Serving mit Amazon Rekognition

Integration des Modells mit Lambda-Functions

Vorbereitungen

Prediction

Moving

Deployment der Applikation zur manuellen Nachbearbeitung mit Elastic Beanstalk

Vorbereitungen

Wie teuer ist der Betrieb dieses KI-Systems?

Fazit

War dieser Beitrag hilfreich?

Ja

Blog-Autor*innen

Kontakt aufnehmen

Kontakt aufnehmen

Kontaktiere Marcel

Kontaktiere Nico

Weitere Beiträge

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

DISH-O-TRON – Train that vision model!

DISH-O-TRON – Gather that DATA you must!

DISH-O-TRON – No more dirty dishes thanks to AI

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Thinking AI means re-thinking data

Wie man Data-Science-Projekte nicht in die PoC-Sackgasse manövriert

Great Expectations: Validating datasets in machine learning pipelines

Remote training with GitLab-CI and DVC

E-Mail-Klassifizierung mit SpaCy

Kunden-E-Mails effizient verarbeiten – mit künstlicher Intelligenz

Wie trainiert man eigentlich neuronale Netze?

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Public Cloud im regulierten Sektor: Das ist zu beachten

Green Cloud: Daten und Emissionen sparen

Charge your APIs Volume 23: REST vs. gRPC

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

AZ-900-Zertifizierung: Mein How-to!

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

Cloud FinOps

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mehr Struktur in der Cloud mit Azure Landing Zones

CI/CD-Pipelines mit AWS CDK CodePipeline

Große Sprachmodelle: Was ist ein LLM?

Green Cloud: Nachhaltig skalieren

Crossplane: Eine Lösung für hybride Cloud-Herausforderungen?

Green Cloud: Ideen für eine nachhaltigere Architektur

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Bessere SQL-Datenpipelines mit dbt

ChatGPT im Alltag eines Python-Entwicklers

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten