Einführung in Computer Vision mit OpenCV und Python

5.6.2017 | 13 Minuten Lesezeit

Computer Vision ist eine spannende Disziplin in der Informatik. Die Forschung beschäftigt sich bereits seit Jahrzehnten mit dem Thema, aber erst durch aktuelle Fortschritte in den Bereichen Big Data und künstliche Intelligenz ergeben sich beeindruckende neue Möglichkeiten. Mittels Cloud-Technologien sowie neuen GPUs wird die Verarbeitung immer billiger und schneller. „Pay-as-you-go-Modelle“ erlauben einen „risikolosen“ Einstieg – ohne große Vorabinvestitionen. Kleine Embedded Systeme (z.B. NVIDIA Jetson) ermöglichen innovative, mobile und smarte Geräte mit hoher Rechenleistung bei geringem Stromverbrauch.

Was heute mit Computer Vision möglich ist, könnt ihr in unserem neuen codecentric.AI YouTube-Channel sehen. Hier fliegen wir mit einer Drohne durch unser Büro in Solingen und werten die Bilder mit Object Detection Algorithmen aus (am besten auf Fullscreen anschauen!): Hier geht es direkt zum Video

Wer mehr über künstliche Intelligenz erfahren möchte, dem empfehlen wir unsere neue Themen-Seite zum Thema KI: https://www.codecentric.de/kuenstliche-intelligenz/

Vor vielen Millionen Jahren, kam es in der Evolution zur kambrischen Explosion. Dabei ist in einem „relativ kurzen“ Zeitraum die Artenvielfalt auf der Erde „explodiert“. Einige Forscher sind der Meinung, dass eine Ursache dafür die Entwicklung des Sehens war, und dass wir heute im Bereich Computer Vision auf einem ähnlichen Weg sind [1]. Allerdings entwickeln sich die visuellen Fähigkeiten von Computern sehr, sehr viel schneller, als es in der Evolution der Fall war.

Autos, Roboter und Drohnen beginnen zu verstehen, was in Bildern und Videos zu sehen ist. Die Schnittstelle „Computer Vision“ zwischen Mensch und Maschine wird in den nächsten Jahren wahrscheinlich stark an Bedeutung gewinnen.

Dieser Artikel ist der erste in einer Serie und soll Interessierten einen schnellen Einstieg in das Thema Computer Vision ermöglichen. Am Beispiel einer interaktiven Drohne versuche ich zu erklären, wie man (mit einfachen Mitteln) Objekte und Personen in einem Video erkennen kann

… hier die Demo aus unserem Projekt http://cvdrone.de:

OpenCV, Python und verfügbare Frameworks – Getting Started

Es existieren diverse Frameworks für Computer Vision. Das wohl populärste ist OpenCV (http://www.opencv.org ) und ebenfalls empfehlenswert ist dlib (http://dlib.net ).

“ … OpenCV is released under a BSD license and hence it’s free for both academic and commercial use. It has C++, C, Python and Java interfaces and supports Windows, Linux, Mac OS, iOS and Android. OpenCV was designed for computational efficiency and with a strong focus on real-time applications. Written in optimized C/C++, the library can take advantage of multi-core processing. Enabled with OpenCL, it can take advantage of the hardware acceleration of the underlying heterogeneous compute platform. …“ – http://www.opencv.org

Je nach Vorliebe/Vorwissen kann man damit auf unterschiedlichsten Plattformen entwickeln. Für einen leichten Einstieg empfehle ich, eine Entwicklungs-Umgebung auf Ubuntu 16.04 mit Python 3.x und OpenCV 3.x aufzubauen. Auf meinem Macbook verwende ich eine virtuelle Maschine auf Basis von vmware Workstation (hier funktioniert die Integration von externer Hardware im Vergleich zu anderen Virtualisierungs-Lösungen oft stabiler). Die Komponenten lassen sich auch auf anderen Betriebssystemen zum Laufen bringen – hier ist evtl. aber fortgeschrittenes „Versions-Konflikt-und-Dependency-Gefummel“ notwendig.

dlib ist zwar bei weitem nicht so umfangreich wie OpenCV, aber manche Funktionen sind einfach sehr gut – beispielsweise die „Facial Landmark Detection“ oder der Correlation Tracker … Siehe hier

Weiterhin gibt es einen OpenVX-Standard. Dieser macht sich zur Aufgabe, Grafik-Hardware zu abstrahieren und diese damit besser nutzbar zu machen. Eine Implementierung davon ist NVIDIA’s VisionWorks (TM). Hier wurde viel Aufwand betrieben, um die wichtigsten CV-Algorithmen speziell für die Ausführung auf GPUs zu optimieren. Wer viel Performance bei geringem Stromverbrauch sucht, sollte sich VisionWorks genauer anschauen.

GPU oder CPU – ist das hier die Frage?

Einige Algorithmen basieren auf CUDA zur Nutzung der GPU. Dafür benötigt man eine Grafikkarte von NVIDIA. Hat man diese nicht, kann man auf AWS eine GPU-Instanz mieten oder man besorgt sich ein Entwickler-Board (z.B. NVIDIA Jetson TK1). Für einen ersten Einstieg ist das nicht unbedingt notwendig – aufwändigere Algorithmen (neuronale Netze, Deep Learning etc.) laufen mit Hardware-Beschleunigung aber oft um Größenordnungen schneller. In diesem Bereich fährt man übrigens nicht unbedingt gut, wenn man auf latest-greatest Versionen setzt. Evtl. ist ein älteres Ubuntu und ein nicht ganz aktueller Linux Kernel nötig, um alle Treiber und Abhängigkeiten kompilieren zu können. Im AWS Marketplace findet man GPU-Instanzen, bei denen bereits OpenCV, Python, CUDA etc. lauffähig vorinstalliert sind (basierend auf Ubuntu 14.04 – Stand Mai 2017).

Installation von OpenCV mit Python Wrappern

Es gibt im Internet viele Anleitungen, wie man OpenCV installieren kann – ich werde daher nicht das Rad neu erfinden, sondern verweise auf den lesenswerten Blog von Adrian Rosebrock [3]. Also zunächst eine Ubuntu VM aufsetzen und dann folgenden Artikel Schritt für Schritt nachvollziehen: http://www.pyimagesearch.com/2016/10/24/ubuntu-16-04-how-to-install-opencv/

OpenCV ist zwar in C geschrieben, mir ist aber der Einstieg mit den Python Wrappern leichter gefallen. Je nach Vorwissen kommt man damit deutlich schneller zu funktionierenden Prototypen. Der Performance-Unterschied ist dabei in vielen Fällen vernachlässigbar gering.

Computer Vision Basics

Der Fortschritt im Bereich Computer Vision passiert zwar vor allem mit Hilfe von neuronalen Netzen und Deep Learning, für einen Einstieg in das Thema sollte man sich vielleicht aber zunächst mit den Basics beschäftigen.

Hier ein Video mit einer kurzen Darstellung der Basics, sowie Code-Beispielen, wie wir den simplen Objekt-Detektor im Drohnen-Video realisiert haben:

Bilder sind multidimensionale Arrays

Ein Bild wird im Computer als multidimensionaler Array repräsentiert. In Python ist der Datentyp „numpy“ in C ist es „Mat“. Die Koordinate (0, 0) ist in der linken oberen Ecke. Bei einem farbigen Bild stehen an jeder Koordinate 3 Farbwerte. Je nach Auflösung und Farbraum können die Arrays unterschiedlich groß sein. Die Farbwerte reichen jeweils von 0 bis 255. In OpenCV gibt man als erstes die Y und dann die X Koordinate an (das ist teilweise verwirrend).

Folgender Code liest ein Bild ein und führt einige Basic-Operationen auf Pixel-Ebene aus:

1import cv2
2 
3# lese Bild von Festplatte
4image = cv2.imread("test.png")
5 
6# lese Farbwerte an Position y, x
7y = 100
8x = 50
9(b, g, r) = image[y, x]
10 
11# gib Farbwerte auf Bildschirm aus
12print(b,g,r)
13 
14# setze Farbwerte auf Rot (im BGR-Farbraum)
15image[y, x] = (0, 0, 255)
16 
17# waehle ein Region auf Interest an Punkt: (y, x) mit Dimension 50x50 Pixel
18region_of_interest = image[y:y+50, x:x+50]
19 
20# zeige Bild in Fenster an
21cv2.imshow("Bild", image)
22 
23# zeige Region of Interest an
24cv2.imshow("ROI", region_of_interest)
25 
26# setze ROI auf Gruen
27region_of_interest[:, :] = (0, 255, 0)
28 
29# die ROI ist ein "Zeiger" auf das urspruenglich geladene Image. Es enthaelt nun eine gruene Box!
30cv2.imshow("Bild modifiziert", image)
31 
32# warte auf Tastendruck (wichtig, sonst sieht man das Fenster nicht)
33cv2.waitKey(0)

Farbräume

Der default-Farbraum in OpenCV ist BGR – also Blue Green Red. Normalerweise kennt man es eher als RGB – also auch hier wieder leichte Verwirrung am Anfang. Aber dafür gibt es einen guten Grund: „War so, ist so und wird daher so bleiben!“ Je nachdem in welchem Farbraum man arbeitet, hat dies Vor- und Nachteile für die jeweilige Applikation. Beispielsweise ist ein Farbraum wie HSV leichter zu handhaben, wenn man nach bestimmten Farben filtert. Möchte ich im BGR-Farbraum alles filtern, was irgendwie „orange“ ist, ist das nicht so leicht zu implementieren – in HSV ist das deutlich einfacher. Auch ist dieser Farbraum z.B. nicht so anfällig für Änderungen der Helligkeit (durch Wolken/Sonne). Konvertiert man ein Bild in Graustufen, hat es nur noch einen Farb-Kanal. Dies macht zum Beispiel Sinn, um Datenmengen und Rechenzeit zu reduzieren.

Hier wieder ein kleines Beispiel:

1import cv2
2 
3# initialisiere WebCam
4cam = cv2.VideoCapture(0)
5 
6# lese ein Bild von der WebCam
7ret, image = cam.read()
8 
9# konvertiere das Bild in Graustufen
10image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
11 
12# zeige das Bild an
13cv2.imshow("Bild modifiziert", image)
14 
15# warte auf Tastendruck (wichtig, sonst sieht man das Fenster nicht)
16cv2.waitKey(0)

Gängige Algorithmen / Methoden

In der Computer Vision muss man teilweise etwas um die Ecke denken, um komplexere Funktionen zu implementieren. Der Computer versteht ja erstmal nicht wirklich, was in einem Bild zu sehen ist, sondern er sieht nur Zahlen, die Farbwerte repräsentieren. Ich möchte hier einige Methoden hervorheben, die zum Grundwerkzeug des Computer Visionärs gehören …

Thresholding

Thresholding wird häufig verwendet, um Bereiche eines Bildes, die bestimmte (Farb-)Eigenschaften haben, zu filtern. Es gibt verschiedene Thresholding-Methoden – eine davon ist „Binary Thresholding“. Dabei definiert man einen Schwellwert, und man erhält als Output ein Schwarz/Weiß-Bild. Pixel, die den Schwellwert überschreiten, sind weiß – alle anderen Pixel sind schwarz. Damit kann man dann zum Beispiel alle Pixel im Bild „suchen“, die orange sind (so wie der Marker in unserem Demo Video).

Diese Thresholding-Masken sind dann oft Grundlage für weitere Analysen.

Das Video dazu und der Code zu dem Video:

1## ermittle Farbwerte eines Tennisballs
2 
3import cv2
4 
5# initialisiere Webcam
6cam = cv2.VideoCapture(0)
7 
8# definiere Region of Interest
9x, y, w, h = 400, 400, 100, 100
10 
11# zeige Stream von WebCam an
12while cam.isOpened():
13    # lese frame von WebCam
14    ret, frame = cam.read()
15 
16    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
17    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
18 
19    # zeichne Rechteck in Bild
20    cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 255), thickness=1)
21 
22    # gebe Hue-Wert an der linken oberen Ecke der ROI aus, um Farbwerte des Tennis balls zu ermitteln:
23    cv2.putText(frame, "HSV: {0}".format(frame[y+1, x+1]), (x, 600),
24                cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), thickness=2)
25 
26    # zeige Frame an
27    cv2.imshow("frame", frame)
28 
29    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
30    key = cv2.waitKey(1) & 0xff
31 
32    # wenn ESC gedrückt, beende Programm
33    if key == 27:
34        break

Mit den Farbwerten filtern wir nach Range:

1import cv2
2 
3# initialisiere Webcam
4cam = cv2.VideoCapture(0)
5 
6# definiere Farb-Ranges
7lower_yellow = (18, 100, 210)
8upper_yellow = (40, 160, 245)
9 
10# zeige Stream von WebCam an
11while cam.isOpened():
12    # lese Frame von WebCam
13    ret, frame = cam.read()
14 
15    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
16    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
17 
18    # filtere Bild nach Farbgrenzen
19    mask = cv2.inRange(frame, lower_yellow, upper_yellow)
20 
21    # zeige Frame an
22    cv2.imshow("threshold", mask)
23 
24    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
25    key = cv2.waitKey(1) & 0xff
26 
27    # wenn ESC gedrückt, beende Programm
28    if key == 27:
29        break

Konturen finden

Für Schwarz/Weiß-Bilder existieren effiziente Algorithmen, um darin Konturen zu finden. Diese erkennen zusammenhängende Pixel und gruppieren diese zu Blobs. Zusätzlich kann man diverse Eigenschaften dieser Konturen für weitere Analysen verwenden – zum Beispiel die Fläche oder die Kantenlänge der Kontur, und man kann sich eine Bounding Box zurückgeben lassen. In unserem Demo-Video verwenden wir dies, um die Position des orangenen Markers zu finden – dabei suchen wir nur Konturen heraus, die eine gewisse Mindestfläche haben (so können wir einzelne „noisy“ Pixel herausfiltern, die im Orange-Bereich liegen).

Hier versuchen wir jetzt den Tennisball im Bild zu finden und filtern die noisy Pixel heraus.

1import cv2
2 
3# initialisiere Webcam
4cam = cv2.VideoCapture(0)
5 
6# definiere Farb-Ranges
7lower_yellow = (18, 100, 210)
8upper_yellow = (40, 160, 245)
9 
10# zeige Stream von WebCam an
11while cam.isOpened():
12    # lese frame von WebCam
13    ret, frame = cam.read()
14 
15    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
16    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
17 
18    # filtere Bild nach Farbgrenzen
19    mask = cv2.inRange(frame, lower_yellow, upper_yellow)
20 
21    # finde Konturen in der Maske, die nur noch zeigt, wo gelbe Pixel sind:
22    _, contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL,
23                                      cv2.CHAIN_APPROX_SIMPLE)
24 
25    # suche die größte Kontur heraus (diese ist höchst wahrscheinlich der Tennisball)
26    # dazu nehmen wir die Fläche der Kontur:
27    if len(contours) > 0:
28        tennis_ball = max(contours, key=cv2.contourArea)
29 
30        # zeichne die Bounding box des Tennisballs in das Video-Bild ein:
31        x, y, w, h = cv2.boundingRect(tennis_ball)
32        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), thickness=3)
33 
34    # zeige Frame an
35    cv2.imshow("frame", frame)
36 
37    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
38    key = cv2.waitKey(1) & 0xff
39 
40    # wenn ESC gedrückt, beende Programm
41    if key == 27:
42        break

Background Subtraction

Wenn man eine statische Kamera hat, gibt es diverse (relativ einfache) Methoden, um Bewegung in einem Bild zu erkennen. Man geht dann davon aus, dass das was sich nicht bewegt der Hintergrund ist. Einfach gesagt subtrahiert man die Pixel-Farb-Werte vom aktuellen Frame mit denen vom vorhergehenden Frame. Dort, wo sich nichts verändert hat, ergibt dies 0 – also keine Bewegung. Dieses Modell ist aber für die Praxis meist zu simpel, denn durch leichte Veränderungen der Lichtverhältnisse oder Umwelteinflüsse, wie z.B. Wind erhält man zu viel „Noise“. Über die letzten Jahrzehnte wurde eine Vielzahl von Algorithmen entwickelt, die alle ihre Vor- und Nachteile haben. Einen „One-Fits-All“-Algorithmus, der in allen Situationen 100% funktioniert, gibt es nicht. Ein gute Übersicht über bekannte Verfahren gibt es hier: https://github.com/andrewssobral/bgslibrary/wiki/List-of-available-algorithms

Ein häufig genutzter Algorithmus setzt auf ein Gaussian Mixture Model (GMM) oder MoG2, wie es in OpenCV genannt wird. Neuere Algorithmen sind zum Beispiel SubSENSE [2]

Hier ein kurzes Beispiel Video.

Detektoren

Bei OpenCV oder dlib sind bereits diverse „Standard“-Detektoren integriert. Ein Programm, das in einem Webcam Stream Gesichter finden soll, ist in ein paar Zeilen Python schnell zusammengehackt. Taugen solche Programme auch für praktische Einsatzzwecke? – Wohl eher nicht. Die Standard-Detektoren haben hohe Fehlerraten (viele False Positives und False Negatives). „Klassisch“ benutzt man vor allem folgende Methoden, um Gesichter in einem Bild zu finden…

Haar Cascade Classifier:

Sie gehen zurück auf ein Paper von Viola und Jones aus dem Jahr 2000. Der Algorithmus ist relativ schnell – man kann ihn in abgespeckter Auflösung und Framerate auf einem Raspberry Pi laufen lassen. OpenCV bringt bereits einige vortrainierte Haar Cascade Classifier mit – unter anderem um Gesichter von Menschen oder Katzen zu erkennen. Allerdings erkennt dieser Classifier auch regelmäßig die Rückenlehne meines Stuhls als Gesicht.

HOG Detektoren:

HOG steht für Histogram of oriented Gradients. Dabei wird ein Bildausschnitt in ein Grid unterteilt. Für jede Box des Grids werden die dominanten Kanten ermittelt und in Zahlenwerte für die Ausrichtung der dieser Kanten umgewandelt. Auf diesen Werten wird dann ein Modell trainiert. Die benötigte Rechenleistung ist dabei deutlich höher als bei Haar Cascade Classifiern – man kann damit aber unter Umständen bessere Detektions-Ergebnisse erzielen.

Eine vereinfachte Visualisierung eines HOG Feature Vektors kann man sich so vorstellen. Die dominanten Gradienten in jeder Box des Grids sind insgesamt eindeutig als Gesicht zu erkennen:

   ______
  / _  _ \
 |   /    |
 |   __   | 
  \ ____ /

In unserem Drohnen-Demo-Video verwenden wir einen Haar Cascade Classifier, der nur nach Gesichtern in der Nähe des detektierten orangenen Marker sucht. Damit können wir die Zahl der False Negatives so weit reduzieren, dass wir insgesamt ein gutes Ergebnis erzielen.

Hier der Video-Ausschnitt, zum Facedetektor in der Nähe des Markers:

Ausblick Deep Learning

Zum Schluss möchte ich noch einen kleinen Ausblick auf das Thema Deep Learning geben. Viele Forscher beschäftigen sich mit dem Gebiet, und man findet regelmäßig neue beeindruckende Demos und Algorithmen auf youtube. Einer davon ist YOLO [4]. Damit ist nicht das Jugendwort aus 2012 gemeint, sondern es steht für „You Only Look Once“. Dahinter steckt ein Convolutional Neural Network, das in Echtzeit (auf entsprechender Hardware) verschiedenste Klassen von Objekten erkennen kann.

Wir haben den Algorithmus einmal ausprobiert. Dazu haben wir unsere Drohne durch unser Büro fliegen lassen. Auf AWS haben wir eine GPU-Instanz gemietet und dort YOLO installiert. Wir haben dazu ein vorkonfiguriertes „TensorFlow Image“ aus dem Amazon Marketplace gestartet und sind der Anleitung auf https://pjreddie.com/darknet/yolo/ gefolgt. Man kann natürlich auch selbst eine Instanz aufsetzen – aber alle Abhängigkeiten zum Laufen zu bringen, ist nicht trivial. Wer es probieren möchte, hier eine Starthilfe: http://cvdrone.de/install-opencv-on-aws-with-cuda.html . An dieser Stelle haben wir auch ganz deutlich gemerkt, wieviel Unterschied eine GPU bringt: Während der Algorithmus auf CPU etwa 15-20 Sekunden pro Frame rechnete, brauchte er mit GPU-Unterstützung gerade noch 6ms für die gleiche Arbeit.

Das Ergebnis unseres Drohnen-Fluges kann man hier sehen.

Weitere interessante Beispiele sind

„Convolutional Pose Machines „
„Style Transfer „
(… und noch viele mehr …)

Wer sich tiefer in das Thema einarbeiten möchte, dem empfehle ich das Buch „Deep Learning“ von Ian Goodfellow et al. Laut dem Buch verdoppeln sich Artificial Neural Networks alle 2,4 Jahre, und 2015 lag die Anzahl der Neuronen der größten Netzwerke wie GoogLeNet zwischen dem Gehirn einer Biene und dem eines Froschs. Dennoch waren einige spezialisierte ANNs dem Menschen in ganz bestimmten Aufgaben bereits überlegen. Geht die Entwicklung so weiter, erwartet man, dass die größten neuronalen Netzwerke um 2056 in der Größenordnung des menschlichen Gehirns liegen werden.

Ich hoffe, dass ich mit diesem Artikel etwas Interesse für Computer Vision wecken konnte. Ich freue mich über Shares und Feedback (gerne über: https://twitter.com/moseroli ). Wenn du mit mir über Computer Vision sprechen möchtest, findest du mich bei Ask-the-Expert .

References

[1] – Fei-Fei Li – Professor at Stanford University. https://youtu.be/qLCKtc9moks
[2] – SuBSENSE – https://www.ncbi.nlm.nih.gov/pubmed/25494507
[3] – http://pyimagesearch.com
[4] – YOLO – https://pjreddie.com/darknet/yolo/

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Oliver Moser

Partner und Key Account Manager

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Oliver Moser

Simple Web Reports, #NoMoreCookies und #BanTheCookieBanners

Jeder kennt sie, keiner mag sie: Die Rede ist von Cookie-Bannern, die gerade im Laufe des Jahres 2020 immer lästiger geworden sind. Eine echte Plage. Grundsätzlich steckt dahinter eine gute Idee, nämlich die Benutzer*innen davor zu schützen, dass sie...

21.12.2020 | 2 Minuten Lesezeit

Oliver Moser

DISH-O-TRON – Train that vision model!

With this article we continue our endeavor of building dish-o-tron – an AI system designed to prevent the sudden appearance of dirty dishes in the community kitchen sink, and hence turning the community kitchen into a place of peace and harmony. This...

AI
Computer Vision

11.10.2020 | 11 Minuten Lesezeit

Marcel Mikl

Oliver Moser

DISH-O-TRON – Gather that DATA you must!

This is the second article in our dish-o-tron series (a non-standard Deep Learning tutorial) in which we tackle one of the biggest problems in community kitchens: coming across someone else’s dirty dishes. We are facing this problem by building a state...

AI
Computer Vision
Machine Learning

24.9.2020 | 11 Minuten Lesezeit

Marcel Mikl

Oliver Moser

DISH-O-TRON – No more dirty dishes thanks to AI

Sadly, to tell you the truth, doing dishes is still a thing. However, so far most of our readers still like our non-standard Deep Learning tutorial. Typically, AI is demonstrated as solving various toy problems. AI plays chess and Go, AI plays video ...

10.9.2020 | 7 Minuten Lesezeit

Marcel Mikl

Oliver Moser

codecentric.AI Bootcamp ist online!

Im letzten Jahr haben wir bei codecentric eine AI-Initiative gestartet. Wir haben uns zum Ziel gesetzt, einen Online-Kurs zum Thema Machine Learning und künstliche Intelligenz in deutscher Sprache zu entwickeln. Natürlich gibt es bereits mehrere sehr...

Computer Vision
Künstliche Intelligenz
NLP

26.5.2019 | 4 Minuten Lesezeit

Oliver Moser

Kunden-E-Mails effizient verarbeiten – mit künstlicher Intelligenz

Einleitung Künstliche Intelligenz (KI) findet sich heutzutage scheinbar überall. Bereits ohne den derzeitigen Hype-Faktor um KI ist der Begriff nur schwer zu greifen. Viele Unternehmen sehen sich unter Zugzwang, KI als neue Technologie einzusetzen und...

Data
Künstliche Intelligenz

7.4.2019 | 7 Minuten Lesezeit

Marcel Mikl

Oliver Moser

Simple Deep Learning mit Amazon SageMaker

In unserem neuesten codecentric.AI-Video geben wir eine kurze Einführung in Amazon SageMaker und zeigen, wie man damit schnell und einfach ein Bildklassifikationsmodell trainieren kann, das Brillenträger von Nicht-Brillenträgern unterscheidet. Mit...

Big Data
AWS
Cloud
Data
Machine Learning
Künstliche Intelligenz
Python

11.7.2018 | 5 Minuten Lesezeit

Shirin Elsinghorst

Oliver Moser

Künstliche Intelligenz Initiative: „codecentric.AI“

Im April 2018 haben wir bei codecentric eine AI (Artificial Intelligence bzw. KI = künstliche Intelligenz) Initiative gestartet. Unter dem Projektnamen „codecentric.AI “ werden wir versuchen zu zeigen, was heute mit künstlicher Intelligenz möglich ist...

Computer Vision
Künstliche Intelligenz
Python

10.4.2018 | 3 Minuten Lesezeit

Oliver Moser

Shirin Elsinghorst

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

Wir alle kennen es. Wir bekommen neuen Code und irgendwie macht der merkwürdige Sachen. Teilweise müssen wir Reverse Engineering betreiben. Wir wundern uns, warum eine Umgebungsvariable nicht korrekt gesetzt wird oder der Login schief geht. Bis wir merken...

Python
Softwareentwicklung
Softwarearchitektur

30.11.2022 | 7 Minuten Lesezeit

Robert Meißner

GitHub Copilot – Pair Programming mit der KI

Vor drei Monaten konnte ich zum ersten Mal mit GitHub Copilot von Microsoft auf die Startbahn gehen. Ob der Flug erfolgreich war oder ob ich es gar nicht in die Luft geschafft habe, möchte ich euch einmal berichten. Was ist GitHub Copilot? Der Copilot...

Künstliche Intelligenz
GitHub
Microsoft

6.10.2022 | 8 Minuten Lesezeit

Danny Steinbrecher

„Strawberry JSON Fields Forever“: Filtern nach JSON-Feldern mit GraphQL...

Schon die Beatles besangen ein uraltes Problem in ihrem Song „Strawberry JSON Fields Forever“ : Wie lässt sich mit der GraphQL Library Strawberry für Python nach Werten in JSON-Feldern einer PostgreSQL-Datenbank filtern?SetupUm das zu zeigen, braucht...

Frontend
API
Python

26.6.2022 | 4 Minuten Lesezeit

Michael Eichenseer

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Die Corona-Krise ist weiterhin in aller Munde und wird uns mit hoher Wahrscheinlichkeit noch etwas länger begleiten. Wie man aus unterschiedlichen Statistiken erfährt, schwanken die Fallzahlen weiter und sorgen für zusätzliche Restriktionen. Diese werden...

Computer Vision
Künstliche Intelligenz
IoT
Machine Learning

13.12.2021 | 7 Minuten Lesezeit

Michel Ehmen

Wie man Java-Klassen in Python benutzt

Generell sollte man zwar für jedes Problem das passende Werkzeug nutzen. Aber oftmals wird man gezwungen, den Hammer Java zu nutzen, weil der Rest des Hauses mit diesem Hammer gebaut wurde. Eine moderne Lösung dieses Problems ist natürlich die Microservice...

Künstliche Intelligenz
Java
Python

15.11.2021 | 8 Minuten Lesezeit

Hendrik Schawe

Automatisch skaliertes Cloud Native Consent Management in der Google Cloud

Immer häufiger ersetzen unsere Kunden lokale Rechenzentren durch eine Cloud-Infrastruktur. Die Gründe sind Ausfallsicherheit, Wartbarkeit und vor allem Skalierbarkeit. Mit dem letzten dieser Aspekte befassen wir uns in diesem Blogartikel anhand eines...

APM
Python
Cloud
Google Cloud
Infrastructure
Softwarearchitektur
Serverless

28.6.2021 | 16 Minuten Lesezeit

Markus Lüger

Christopher

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Technologien lösen keine Probleme ― es sind die Menschen dahinter

Software zu entwickeln bedeutet, Mehrwert für den Kunden zu schaffen. Zu oft wird hierbei der menschliche Faktor im System missachtet. Stefanie Hasler, Senior Fullstack Developerin bei codecentric, gibt einen kleinen Einblick auf ihre Sicht der Dinge...

Künstliche Intelligenz
Softwareentwicklung
Remote Work
HR
Collaboration
Kultur

22.3.2021 | 6 Minuten Lesezeit

Kathrin Schaugg

Stefanie Hasler

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

BIE Spotty – unsere Lösung beim BIE City Hackathon

Typischerweise sind bei Hackathons viele Soft- und Hardware-Entwickler zu finden, die innerhalb eines begrenzten Zeitraums versuchen, kreative und ungewöhnliche Lösungen in Form von Code und ersten Prototypen für vorher definierte Challenges zu erarbeiten...

IoT
Computer Vision
IT-Security
Machine Learning

2.7.2020 | 5 Minuten Lesezeit

Meike Wocken

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Machine Learning und künstliche Intelligenz sind aktuell in aller Munde und versprechen vielfältige Einsatzmöglichkeiten im Unternehmen. Trotzdem tun sich viele Unternehmen aktuell noch schwer, das Potential der Technologie zu nutzen. „Der Fokus liegt...

Künstliche Intelligenz
Data
Community
Machine Learning

27.5.2020 | 1 Minuten Lesezeit

Matthias Niehoff

Schülerpraktikum bei codecentric

Jeder in der 9. Klasse muss ein Praktikum machen. Nachdem ich einen, diesem hier ähnlichen, Blog-Beitrag gesehen hatte und ihn sehr interessant fand, wollte ich mein Praktikum bei codecentric in Frankfurt machen. Jetzt, am letzten Tag, kann ich sagen...

HR
Python

13.4.2020 | 2 Minuten Lesezeit

Veronika Schwan

Hacker School in Dortmund – Scratch & Python

Anfang März hatte die codecentric AG in Dortmund die Hacker School und 20 neugierige Kids zu Besuch. Bei dieser Gelegenheit konnten die Kinder die Programmiersprachen Scratch und Python kennenlernen und sich Wissen im Handwerk des Programmierens aneignen...

Raspberry Pi
IT-Security
Python

7.4.2020 | 5 Minuten Lesezeit

Christopher

Wie man Data-Science-Projekte nicht in die PoC-Sackgasse manövriert

Warum gelingt es Data-Science-Initiativen häufig nicht, einen echten Mehrwert zu schaffen? Wir haben einige Ursachen dafür ausgemacht. In diesem Blogpost stellen wir vier typische Fallen für Data-Science-Projekte vor und geben Tipps, wie Du sie umschiffen...

Machine Learning
Data
Künstliche Intelligenz
Softwareentwicklung

27.3.2020 | 11 Minuten Lesezeit

Marcel Mikl

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Einführung in Computer Vision mit OpenCV und Python

OpenCV, Python und verfügbare Frameworks – Getting Started

GPU oder CPU – ist das hier die Frage?

Installation von OpenCV mit Python Wrappern

Computer Vision Basics

Bilder sind multidimensionale Arrays

Farbräume

Gängige Algorithmen / Methoden

Thresholding

Konturen finden

Background Subtraction

Detektoren

Haar Cascade Classifier:

HOG Detektoren:

Ausblick Deep Learning

References

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Simple Web Reports, #NoMoreCookies und #BanTheCookieBanners

DISH-O-TRON – Train that vision model!

DISH-O-TRON – Gather that DATA you must!

DISH-O-TRON – No more dirty dishes thanks to AI

codecentric.AI Bootcamp ist online!

Kunden-E-Mails effizient verarbeiten – mit künstlicher Intelligenz

Simple Deep Learning mit Amazon SageMaker

Künstliche Intelligenz Initiative: „codecentric.AI“

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

ChatGPT im Alltag eines Python-Entwicklers

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

GitHub Copilot – Pair Programming mit der KI

„Strawberry JSON Fields Forever“: Filtern nach JSON-Feldern mit GraphQL...

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Wie man Java-Klassen in Python benutzt

Automatisch skaliertes Cloud Native Consent Management in der Google Cloud

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Technologien lösen keine Probleme ― es sind die Menschen dahinter

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

BIE Spotty – unsere Lösung beim BIE City Hackathon

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Schülerpraktikum bei codecentric

Hacker School in Dortmund – Scratch & Python

Wie man Data-Science-Projekte nicht in die PoC-Sackgasse manövriert

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten