Schnelles KI-Prototyping mit Google Cloud AutoML Vision

17.5.2021 | 5 Minuten Lesezeit

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ist verhältnismäßig lang. Hinzu kommt die Zeit, bis das Modell in der Produktion eingesetzt wird. Zu diesem Zeitpunkt weiß man auch noch nicht, ob sich ein ML-Ansatz überhaupt für den vorliegenden Use Case eignet.

Hier kann der Service AutoML (Automated Machine Learning) der Google Cloud Platform (GCP) verwendet werden. AutoML (siehe auch diesen Blogpost ) eignet sich somit, wenn sich ein Betrieb einen Vorteil von der Benutzung von Machine Learning verspricht, aber noch keine bis wenige Berührungspunkte damit hatte. Mit AutoML kann zügig (in wenigen Wochen) und ohne viel Vorwissen ein erster Prototyp entwickelt werden. Dies wollen wir im Folgenden anhand eines Anwendungsbeispiels vorstellen.

Use Case: Qualitätskontrolle in der Verpackungsindustrie

Wir haben uns mit der automatischen Qualitätskontrolle in der industriellen Fertigung beschäftigt. Ziel war es, für einen Kunden einen ML-Prototyp zu entwerfen. Dieser sollte in die bestehende Fließbandproduktion integriert werden und beschädigte Verpackungen erkennen, um diese auszusortieren. Als Grundlage hat der Kunde uns ca. 50.000 gelabelte Bilder zur Verfügung gestellt, wovon wir ca. die Hälfte für das Training verwendet haben. Da es sich bei unserer Problemstellung um eine binäre Klassifikation handelt, wurden die Bilder in correct und damaged unterteilt. Bedingt durch den Einsatz am Fließband gab es zusätzlich die Anforderung, dass die Klassifizierung und Übertragung nicht länger als 600 ms in Anspruch nehmen dürfen. Folgend sieht man eine symbolhafte Darstellung des Use Cases.

Quelle: Denis Stalz-John

Umsetzung auf der Google Cloud mit AutoML Vision

Die Google Cloud Platform (GCP) bietet eine Vielzahl von Cloud-Computing-Services an. Hierzu zählen beispielsweise Datenbanklösungen, Infrastruktur-Modernisierung und AI- & ML-Services. Zum Zeitpunkt der Veröffentlichung dieses Blogposts bietet Google zudem 300 $ Free Credits an.

In der GCP haben wir folgende Schritte ausgeführt:

Daten-Upload
Daten-Labeling
Modell-Training
Modell-Validierung
Deployment

Für AutoML und AI Platform (Unified) gibt es eine Weboberfläche, die die oben genannten Schritte ermöglicht. Folgend wird die AI Platform (Unified) mit einem einfachen Beispiel gezeigt, wobei die gezeigten Teile sehr ähnlich zu dem Gegenstück von AutoML sind. Sobald man ein Google-Cloud-Projekt erstellt hat und zu der AI Platform (Unified) navigiert, sieht man folgendes Bild. Um nun ein Modell zu erstellen, wird zunächst ein Datensatz erstellt.

Startseite der AI Platform (Unified)

Daten-Upload

Für diesen Datensatz werden Bilder benötigt, die man ganz einfach über den Browser hochladen kann.

Daten Upload

Sobald Bilder von der lokalen Festplatte ausgewählt wurden, werden sie hochgeladen und in der Oberfläche angezeigt. Beim Hochladen wird automatisch ein Cloud Storage Bucket erstellt, der unten in der Oberfläche benannt werden kann, bevor man den Datensatz erstellt. Leider können über die AutoML-Oberfläche zum Zeitpunkt der Veröffentlichung dieses Posts nur 500 Bilder auf einmal hochgeladen werden. Um dieses Problem zu umgehen, können Bilder direkt in einen Cloud Storage Bucket hochgeladen werden. Bei dieser Möglichkeit muss der GCP-Nutzer allerdings selber eine CSV-Datei erstellen, die die Bilder in Klassen aufteilt. Diese Datei wird dann in Verbindung mit dem GCS Bucket von AutoML genutzt, um den Datensatz zu erstellen.

Daten Upload

Daten-Labeling

Sofern die Bilder wie hier gezeigt über die UI hochgeladen werden, müssen diese danach noch gelabelt werden. Um dies zu erreichen, wird ein neues Label erstellt und auf alle neuen Bilder angewendet. Eine weitere Möglichkeit ist es, die Bilder mit einer CSV-Datei aus einem Google Cloud Storage Bucket in den Datensatz zu laden und automatisch in Klassen aufzuteilen.

Daten-Labeling

Modell-Training

Der vorherige Schritt wird nun für jede Bildklasse wiederholt; sobald sich alle Daten im Datensatz befinden, kann das Training gestartet werden.

Modell-Training

Ein Budget (node hours) wird für das Training, das bei unseren Tests zwischen 4 und 12 Stunden gedauert hat, festgelegt. Nach Abschluss stellt Google in der GCP eine Analyse des produzierten Modells zur Verfügung. Diese Analyse beinhaltet verschiedene in der Deep-Learning-Umgebung übliche Metriken, um ein Modell zu evaluieren.

Modell-Validierung

In dem oben zu sehenden Evaluate-Tab wird die Analyse des Modells angezeigt. Hier werden verschiedene Metriken zur Verfügung gestellt, um die Qualität des Modells zu bewerten. Über den Confidence Threshold kann man einstellen, wie sicher sich das Modell sein muss, um ein Bild einer Klasse zuzuordnen. Im gezeigten Beispiel muss sich das Modell zu mindestens 50 % sicher sein, um ein Bild als correct zu klassifizieren.

Deployment

Dieses Modell kann in der GCP deployt werden oder eine Modell-Datei kann in fünf verschieden Formaten heruntergeladen werden. Der Vorteil des lokalen Hostings liegt bei niedrigeren Latenzen, was für eine schnelle und effiziente Fließbandproduktion essenziell ist. Außerdem fallen keine laufenden Kosten innerhalb der GCP für den Kunden an.

Export Optionen

Disclaimer: Zu Beginn des Projekts war AutoML noch ein alleinstehendes Produkt in der GCP. Mittlerweile ist AutoML jedoch Teil der AI Platform (Unified) auf der GCP. Die hier gezeigten Screenshots entstammen der Variante auf der AI Platform (Unified), jedoch sollte es keine großen Unterschiede bei den gezeigten Schritten geben.

Unblackboxing mit Explainable AI

Ein Nachteil von AutoML ist, dass das erzeugte Modell eine Black Box ist und somit auch nicht erweiterbar oder modifizierbar ist. Als Nutzer muss man Google vertrauen, dass bspw. die besten Hyperparameter gewählt werden. Allerdings kann es durch Explainable AI besser verstanden werden.

In unserem Use Case möchte man eine visuelle Begründung der Vorhersage erhalten. Es wäre also wünschenswert zu wissen, welche Pixel auf dem Bild jeweils für oder gegen spezifische Klassifizierungen sprechen. Ist bspw. der Bildhintergrund ausschlaggebend für die Entscheidung?

Fazit

Abschließend können wir sagen, dass AutoML mit der AI Platform (Unified) dabei unterstützen kann, einen Prototyp eines Machine-Learning-Modells in sehr kurzer Zeit, mit begrenzten Ressourcen und ohne Expertenwissen zu erstellen. Somit kann ein ML Use Case schnell validiert werden. Die Weboberfläche ist benutzerfreundlich sowie minimalistisch und übersichtlich gestaltet. Einziger Nachteil: Zum aktuellen Zeitpunkt hat AutoML eher Black-Box-Charakter, der jedoch kontinuierlich mit neuen Explainable-AI-Services abgeschwächt wird.

Give it a try.

Ressourcen

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*innen

Nils Bauroth

Cloud Consultant

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Sven Rediske

Infrastructure Engineer

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Nils Bauroth

Disaster-Recovery-Strategien in AWS

Disaster Recovery (DR) ist ein elementarer Bestandteil der IT-Sicherheit für Unternehmen. Ein DR-Plan hilft dabei, sich auf den Ausfall kritischer Systeme oder Infrastrukturen vorzubereiten und diese schnellstmöglich wiederherzustellen. In den nachfolgenden...

11.8.2023 | 5 Minuten Lesezeit

Nils Bauroth

Michael Schnitzler

Mehr Struktur in der Cloud mit Azure Landing Zones

Die Migration in die Cloud bringt einige Herausforderungen mit sich. Viele Unternehmen stehen vor der Frage, wie ein effizienter und sicherer Aufbau einer skalierbaren Cloud-Infrastruktur umzusetzen ist. Die Antwort auf diese Herausforderung liegt in...

Cloud
Azure
IT-Governance

4.8.2023 | 4 Minuten Lesezeit

Florian Moll

Nils Bauroth

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Public Cloud im regulierten Sektor: Das ist zu beachten

Es war längere Zeit ein weit verbreitetes und in strategischen Debatten häufig zitiertes Missverständnis, dass die Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) dem Einsatz von Public-Cloud-Anbietern wie AWS, Azure und Co. einen Riegel vorschiebt...

Cloud
Compliance

10.4.2024 | 6 Minuten Lesezeit

Marc Bialowons

Björn Bohn

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

AZ-900-Zertifizierung: Mein How-to!

Was ist AZ-900? Azure bietet eine Reihe verschiedener Zertifizierungen an. Zu finden sind sie hier. Darunter befindet sich auch die Zertifizierung AZ-900. Bei diesem Zertifikat handelt es sich um Microsoft Certified: Azure Fundamentals. Diese prüft unter...

Azure
Cloud

2.1.2024 | 5 Minuten Lesezeit

Ege Inanc

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

In der Welt der Cloud-Technologie und insbesondere bei AWS (Amazon Web Services) ist die effiziente Verwaltung von Ressourcen von entscheidender Bedeutung, um unnötige Kosten zu vermeiden. Dieser Blogbeitrag konzentriert sich auf AWS S3 und die teuren...

AWS
Cloud

27.11.2023 | 4 Minuten Lesezeit

Lukas Miliunas

Maximilian Mayer

Cloud FinOps

Cloud FinOps bietet einen etablierten Prozess, um Kosten für den Cloudbetrieb zu reduzieren (s. auch diesen Artikel). Zu diesem Zweck bietet es ein etabliertes Cloud-unabhängiges Vorgehen, das eine Organisation schrittweise aufgreifen kann. Das Tooling...

Cloud
Cloud Native
Green IT

26.10.2023 | 5 Minuten Lesezeit

Lukas Miliunas

Marco Paga

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Mehr Struktur in der Cloud mit Azure Landing Zones

Cloud
Azure
IT-Governance

4.8.2023 | 4 Minuten Lesezeit

Florian Moll

Nils Bauroth

CI/CD-Pipelines mit AWS CDK CodePipeline

Das Aufsetzen der CI/CD-Pipeline ist ein typischer Task in der Anfangszeit eines Projekts. Ist die Pipeline dann aufgesetzt, sind Änderungen nur noch selten notwendig. Dementsprechend wenig Routine entwickeln Programmierende im Umgang mit der Konfiguration...

Cloud
CI/CD
AWS

17.7.2023 | 4 Minuten Lesezeit

Dennis

Große Sprachmodelle: Was ist ein LLM?

Große Sprachmodelle (Large Language Models oder LLM) haben in den letzten Jahren enorme Fortschritte gemacht und spielen eine entscheidende Rolle in verschiedenen Anwendungen. Aber was ist ein LLM? Es ist sinnvoll zu erklären, was ein „einfaches“ Sprachmodell...

Machine Learning

20.6.2023 | 4 Minuten Lesezeit

Elvira Siegel

Green Cloud: Nachhaltig skalieren

Wenn Softwareprojekte in die Cloud gebracht werden, versprechen wir uns davon hohe Verfügbarkeit, planbare Kosten und eine immer dem Bedarf entsprechende Skalierung. Aufgrund der grenzenlosen Angebote ist es aber auch leicht, die Komponenten eines Systems...

Cloud
Softwarearchitektur
Green IT

12.6.2023 | 5 Minuten Lesezeit

Dennis

Crossplane: Eine Lösung für hybride Cloud-Herausforderungen?

Crossplane ist ein plattformübergreifendes Kontrollsystem (Control-Plane), das das Management von Cloud-Ressourcen vereinfachen und automatisieren soll. Das Tool ermöglicht es, verschiedene Cloud-Provider und lokale Ressourcen, z. B. Kubernetes-Cluster...

Cloud
Cloud Native

12.5.2023 | 2 Minuten Lesezeit

Matthias Niehoff

Green Cloud: Ideen für eine nachhaltigere Architektur

Die ökologische Nachhaltigkeit eines Systems ist aktuell häufig noch kein Thema. Nachhaltigkeit bedeutet für mich in diesem Kontext die Reduktion der verursachten Emissionen durch gesenkten Ressourcenverbrauch – egal ob die Emissionen beim Cloudprovider...

Cloud
Softwarearchitektur
Green IT

5.5.2023 | 5 Minuten Lesezeit

Dennis

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Wenn wir Erkenntnisse aus großen Datenmengen gewinnen wollen, bieten uns Cloud Service Provider inzwischen Lösungen an, dank derer wir uns kein Data Warehouse oder Hadoop-Cluster mehr in den Keller stellen müssen. AWS hat mit Athena, RedShift und EMR...

Cloud
Big Data
AWS
Serverless
GitLab

21.3.2023 | 16 Minuten Lesezeit

Maik Fleuter

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Use Case: Qualitätskontrolle in der Verpackungsindustrie

Umsetzung auf der Google Cloud mit AutoML Vision

Daten-Upload

Daten-Labeling

Modell-Training

Modell-Validierung

Deployment

Unblackboxing mit Explainable AI

Fazit

War dieser Beitrag hilfreich?

Ja

Blog-Autor*innen

Kontakt aufnehmen

Kontakt aufnehmen

Kontaktiere Nils

Kontaktiere Sven

Weitere Beiträge

Disaster-Recovery-Strategien in AWS

Mehr Struktur in der Cloud mit Azure Landing Zones

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Public Cloud im regulierten Sektor: Das ist zu beachten

Green Cloud: Daten und Emissionen sparen

Charge your APIs Volume 23: REST vs. gRPC

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

AZ-900-Zertifizierung: Mein How-to!

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

Cloud FinOps

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mehr Struktur in der Cloud mit Azure Landing Zones

CI/CD-Pipelines mit AWS CDK CodePipeline

Große Sprachmodelle: Was ist ein LLM?

Green Cloud: Nachhaltig skalieren

Crossplane: Eine Lösung für hybride Cloud-Herausforderungen?

Green Cloud: Ideen für eine nachhaltigere Architektur

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Bessere SQL-Datenpipelines mit dbt

ChatGPT im Alltag eines Python-Entwicklers

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten