Site Reliability Engineering: Software in Produktion betreiben

12.7.2021 | 7 Minuten Lesezeit

In letzter Zeit hat Site Reliability Engineering (SRE) viel Aufmerksamkeit erregt. Mit SRE kamen Metriken wie Service-Level Objectives (SLO), Service-Level Indicator (SLI) und Error Budget auf. Ebenso widmet sich SRE stark dem Betrieb von Software in der Produktion. Aber die oben genannten Schlagworte beschreiben mehr oder weniger nur das, was Site Reliability Engineers ermöglicht, ihre Arbeit zu erledigen.
Es gibt noch ein weiteres Schlagwort: „production-ready“. Hier geht es mehr darum, was ein SRE oder Softwareentwickler tun kann, um die Software hinter den Metriken zu verbessern. Dieser Blog-Beitrag wird einen Blick darauf werfen, wie diese Schlagwörter zusammenwirken – und ob es nur Schlagwörter sind oder mehr dahintersteckt.

Die oben genannten Themen sind nicht nur Schlagwörter. Über sie wurden Bücher geschrieben. Es gibt die Google-SRE-Bücher und es gibt auch Bücher über produktionsreife Software:
„Production-ready Microservices ” von Susan Fowler und
„Release It! — Design and Deploy Production-Ready Software ” von Michael Nygard .

Abgesehen davon, dass es Schlagwörter sind, die Bücher füllen, helfen diese Konzepte, Software besser zu machen. Obwohl es um Microservices geht, gilt dies auch für Software, die auf Servern, als Funktionen oder auf Edge-Geräten läuft. Schauen wir uns also genauer an, worum es geht. Beginnen wir dazu mit zwei Beispielen, die für die meisten Anwendungen gültig sein sollten: Protokollierung und wiederholte Verbindungsversuche.

Protokollierung

Nehmen wir als Beispiel diese Fehlermeldung irgendwo in einem Protokoll:


Zeitüberschreitung der Verbindungsanfrage.

Falls sich deine Software mit nur einem Dienst verbindet, mag diese Meldung in Ordnung sein, nicht schön, aber in Ordnung. Sobald zwei oder mehr Backend-Dienste in der Software genutzt werden, tauchen Fragen auf. Welchen Host versuchst du zu erreichen? Welchen Port hast du verwendet? Nach welcher Zeit hast du die Zeitüberschreitung erhalten?
Diese Protokollnachricht ist hilfreicher:


Zeitüberschreitung beim Verbindungsversuch zu Host service.abc.de auf Port 12345 nach 100ms.

Auf den ersten Blick mag das 100-ms-Timeout seltsam erscheinen. Dies kann eine gültige Zeitüberschreitung sein, falls der konsumierte Dienst im selben Rechenzentrum ausgeführt wird. Es ist definitiv nicht gültig, wenn sich der Dienst auf der anderen Seite der Welt befindet. Bei diesem Beispiel stellen sich andere Fragen. Ist diese Zeitüberschreitung aufgrund einer Fehlkonfiguration aufgetreten? Blockiert eine Firewall die Verbindung? Oder ist das Backend nicht verfügbar? Zu diesen Fragen wäre man auch bei der ersten Log-Meldung gekommen, aber erst, nachdem auch die oben genannten Fragen beantwortet wären. Diese zusätzlichen Informationen in den Protokollen helfen also, wertvolle Zeit zu sparen und Nerven zu schonen.

Diese Log-Meldung führt direkt zu unserem nächsten Beispiel.

Wiederholte Verbindungsversuche

Falls kein Backend verfügbar ist, sollte die Software nicht nach dem ersten Versuch aufgeben. Vielleicht hat ein Load Balancer das Backend gewechselt oder ein Switch irgendwo auf dem Weg wurde neu gestartet. Einfach noch einmal versuchen. Nicht direkt, sondern nach einer kurzen Pause. Mit der Protokollmeldung des vorherigen Abschnitts könnte dies so aussehen:


... zu Host service... auf Port 12345 nach 100 ms. Versuche: 2/5

In den meisten Fällen muss man es nicht selbst umsetzen, z. B. hat es Google als HTTP-Client in Java implementiert . Es ist auch schön, diese Informationen über die Anzahl der Versuche hinzuzufügen oder dass der Client aufgegeben hat. Dies hilft bei der Fehlersuche.

Dies sind zwei gängige Beispiele. Wie du anhand der oben genannten Büchern erraten kannst, gehört mehr dazu, Software produktionsreif zu machen. Diese Beispiele sollen dir lediglich den Einstieg erleichtern, anstatt dich über das gesamte Thema aufzuklären.

Schon diese beiden kleinen Beispiele helfen der Software und noch mehr den Leuten, die die Software in der Produktion betreiben. Dazu später mehr.

Aber nicht alle Kapitel der Production-ready- oder SRE-Bücher gelten für jede Software. So muss etwa eine Backoffice-Versicherungssoftware nicht innerhalb von Sekunden von 100 auf 1000 Benutzer hochskaliert werden. Sie muss auch nicht einige Minuten später herunterskaliert werden. Aber es ist auch gut zu wissen, dass dies nicht notwendig ist. Daher ist es nützlich, auch solche Punkte zu dokumentieren.

Es gehört mehr dazu, Software in Produktion auszuführen

In diesem Artikel geht es jedoch um das Ausführen von Software in Produktion, nicht nur um produktionsreife Software. Es gehört also mehr dazu.

„Production-ready“ beschreibt meist die in die Software integrierte Funktionalität. Diese Funktionalität hilft, Situationen zu bewältigen, die während des Betriebes in Produktion auftreten. Um Software in der Produktion ausführen zu können, muss man sich auch um einige Infrastrukturen, Systeme und Prozesse rund um die Software kümmern.

Schauen wir uns noch einmal zwei Beispiele an: Sicherung/Wiederherstellung und Zertifikate.

Sicherung/Wiederherstellung

Stateless ist ein Schlagwort, das ich oben nicht erwähnt habe. Und obwohl du zustandslose Dienste anstreben solltest, hast du irgendwo in deiner Anwendung irgendeine Art von Zustand. Und dieser Zustand benötigt eine Sicherung.
Die Fragen, die sich hier stellen werden, sind:

Wie oft müssen die Daten gesichert werden?
Wie lange müssen die Backups aufbewahrt werden?
…

Diese Funktionalität wird nicht Bestandteil der Software sein, aber diese Fragen stellen sich früher oder später. Andernfalls kann ein Ausfall zu einem vollständigen Datenverlust führen. Dies ist z. B. GitLab schon vor einiger Zeit passiert . Wir sollten GitLab dafür nicht an den Pranger stellen, sondern eher dankbar sein, dass sie ein Postmortem darüber veröffentlicht haben, aus dem wir lernen können.

Zertifikate

Dein Dienst wird höchstwahrscheinlich über HTTPS zugänglich sein. Oder er greift über eine Art gesichertes Kommunikationsprotokoll auf andere Dienste zu. Daher sind einige Themen, die von der Software nicht abgedeckt werden, aber bei Nichtbearbeitung zu erheblichen Ausfallzeiten führen können, die folgenden:

Benötigt die Software ein Client-Zertifikat?
Werden Zertifikate automatisch verlängert?
Sind selbst signierte Zertifikate beteiligt?

Abhängig von den Antworten auf diese Fragen benötigst du möglicherweise zusätzliche Prozesse rund um die Software, damit sie reibungslos funktioniert. Andernfalls können Dinge wie diese passieren:

Man war so freundlich, dies in einem öffentlich zugänglichen Ticket zu diskutieren. Und wie man im Screenshot sehen kann, erlaubt der Browser nicht einmal, fortzufahren. Dieses defekte Zertifikat ist also eigentlich ein Dienstausfall. Vielen Dank an Jenkins für die öffentliche Diskussion und die Möglichkeit, daraus zu lernen.

Aber – warum?

Nehmen wir die entgegengesetzte Perspektive ein. Was könnte möglicherweise schiefgehen?

Doch zunächst eine Definition.
Manche Leute haben eine sehr spezifische Definition dessen, was ein verteiltes System ist. Für diesen Artikel verwenden wir eine nicht so strenge Definition:

Ein verteiltes System ist nach der Definition von Andrew S. Tanenbaum ein Zusammenschluss unabhängiger Computer, die sich für den Benutzer als ein einziges System präsentieren.

https://de.wikipedia.org/wiki/Verteiltes_System

Die Irrtümer

Nach der Definition im vorherigen Absatz ist also fast jedes System, das heutzutage entwickelt wird, ein verteiltes System. Werfen wir in diesem Zusammenhang einen Blick auf die Irrtümer bezüglich verteilter Systeme:

Das Netzwerk ist ausfallsicher.
Die Latenzzeit ist gleich null.
Der Datendurchsatz ist unbegrenzt.
Das Netzwerk ist sicher.
Die Netzwerktopologie wird sich nicht ändern.
Es gibt immer nur einen Netzwerkadministrator.
Die Kosten des Datentransports können mit null beziffert werden.
Das Netzwerk ist homogen.

https://de.wikipedia.org/wiki/Fallacies_of_Distributed_Computing

Eine detailliertere Erklärung zu jedem Irrtum findest du in diesen Blog- Artikeln .

Manche erscheinen offensichtlich, manche sind unvermeidlich. Aber du kannst einige dieser Irrtümer dank produktionsreifer Software umgehen. Das ist einer der Gründe, warum “production-ready“ deine Software robuster macht.

Allerdings sind nicht alle Irrtümer auszuschließen. Je komplexer die Systeme werden, desto mehr gilt folgendes Zitat:

… complex systems run as broken systems. The system continues to function because it contains so many redundancies and because people can make it function, despite the presence of many flaws.

https://how.complexsystems.fail/#5

Kurzer Umweg

Hier kommt die Beobachtbarkeit (Observability) einer Software ins Spiel. Da immer etwas kaputt geht, möchtest du wissen:

Was ist kaputt?
Wo ist der defekte Teil im System?
Wie wirkt sich das auf die Nutzer aus?

Aber das ist bei mehr als einer Handvoll Büchern ein ganz anderes Thema.

Die Irrtümer und Public Clouds

Wichtig ist, dass du dir dieser Irrtümer bewusst bist und deine Software entsprechend vorbereitest. Allerdings befinden sich nicht alle Teile unter deiner Kontrolle. Falls deine Software in einer öffentlichen Cloud ausgeführt wird, bieten die Cloud-Anbieter Einblicke, wie du deine Dienste auf ihren Plattformen robuster machen kannst:

Die Amazon Builders‘ Library
Azure-Anwendungsarchitekturleitfaden
Google Cloud – Cloud Architecture Center

Wie bereits oben erwähnt, kann dieser Artikel nicht das gesamte Thema abdecken. Er kann nur einige Hinweise geben, um dir den Einstieg zu erleichtern.

Fazit

Basierend auf unserer Erfahrung mit dem Betrieb von Software in der Produktion bieten wir Production-Readiness-Review-Workshops (ein anderer Begriff aus dem SRE) zu diesen Themen an. Sie richten sich nicht speziell an diejenigen, die die Software in der Produktion ausführen. Alle, die Software in Produktion betreiben, werden an Antworten auf o. g. Fragen interessiert sein.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Christian Zunker

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Christian Zunker

Overview of hardened container base images

How to choose the best container base image? What does “best” mean in this context? This blog post will not try to determine the best base image. We will pick just one of the aspects: security. We will have a look at how you can give your container base...

CI/CD
IT-Security

9.8.2021 | 6 Minuten Lesezeit

Christian Zunker

Site Reliability Engineering: Running software in production

Lately, Site Reliability Engineering (SRE) has been getting a lot of attention. With SRE came metrics such as Service-Level Objective (SLO), Service-Level Indicator (SLI), and error budget. The SRE discipline also details a lot about running software...

Software architecture
Infrastructure
Software development

1.7.2021 | 7 Minuten Lesezeit

Christian Zunker

How to use OAuth2 Proxy for central authentication

This blog post will show you how to use one central OAuth2 Proxy (see the official page ) as authentication proxy for multiple services inside your Kubernetes Cluster . The default example on how to secure a service with Nginx and OAuth2 Proxy shows...

Infrastructure
Microservices
Cloud
Kubernetes
IT-Security

7.6.2021 | 2 Minuten Lesezeit

Christian Zunker

The how of monitoring your services

Lately, there has been a lot of discussion about SLAs, SLOs and SLIs. As this article states, it is hard to define the correct SLOs and SLIs. This discussion is about what part of your services you want to monitor. But it is also difficult to measure...

Infrastructure
APM

17.11.2020 | 5 Minuten Lesezeit

Christian Zunker

Cynicism and burnout in Information Technology

Earlier this year, my colleague Nandor already wrote about passion and burnout . The following post will show my perspective on cynicism and burnout. Sadly, last year, @sadserver and @sadoperator retired their Twitter accounts. As stated in this blog...

24.8.2020 | 6 Minuten Lesezeit

Christian Zunker

Kubernetes deployment concepts

There is a wide variety of tools out there to deploy software to a Kubernetes cluster. In the context of these tools, even a new *Ops term emerged: GitOps . This article will not be another comparison of Kubernetes deployment tools but a comparison of...

CI/CD
DevOps
Kubernetes

5.8.2020 | 3 Minuten Lesezeit

Christian Zunker

Daniel Marks

Debugging Kubernetes Network Policies with ephemeral containers

As you are developing your new shiny containerized service on Kubernetes (k8s), you might also want to apply Network Policies . But during the process, you experience connection problems inside your containers. You followed best practices and kept your...

Software development
Kubernetes

22.7.2020 | 2 Minuten Lesezeit

Christian Zunker

Configuring Kubernetes login with Keycloak

Kubernetes does not have its own user management and relies on external providers like Keycloak. This blog post will describe how to configure Kubernetes to use Keycloak as an authentication provider. We are running Kubernetes clusters based on OpenStack...

16.5.2019 | 2 Minuten Lesezeit

Christian Zunker

Daniel Marks

Configure your Gitlab CI with docker-machine against keystone v3

We are running our Gitlab CI infrastructure on top of OpenStack . To not use a fixed number of VMs, we use Gitlab CI with docker-machine to create VMs as needed by the build jobs. This blog post will describe how to enable docker-machine to properly...

27.11.2018 | 2 Minuten Lesezeit

Christian Zunker

Measure your radosgw usage with OpenStack-Ansible

We use OpenStack-Ansible to set up our OpenStack cluster and Ceph’s Rados Gateway (radosgw) as object store backend. Unfortunately, the telemetry (and in consequence accounting) for radosgw will not work out of the box. You need to change different ...

Infrastructure
Cloud

25.7.2018 | 2 Minuten Lesezeit

Christian Zunker

Daniel Marks

Measuring your OpenStack Cloud with Gnocchi and Ceph storage backend

To solve our performance problems with Gnocchi and the whole OpenStack telemetry stack, we tried Gnocchi with Ceph as backend starting with OpenStack-Ansible Newton. The experience wasn’t good. Sooner or later, we experienced slow requests and stuck ...

Software architecture
Cloud
Open Source
Infrastructure

15.7.2018 | 4 Minuten Lesezeit

Christian Zunker

Daniel Marks

Monitoring für die Cloud

In diesem Artikel geht es um das Monitoring von Systemparametern wie CPU-Last, Speicherverbrauch etc. innerhalb einer Cloud. Das sind die klassischen Metriken, die man schon seit Jahrzehnten mit Monitoringsystemen abfragt. Warum sollte sich daran mit...

26.10.2015 | 6 Minuten Lesezeit

Christian Zunker

Docker Ambassador mit HAProxy und etcd

In einem vorherigen Artikel habe ich über den allgemeinen Aufbau des Ambassador in einem gemeinsamen Projekt der LeanIX GmbH mit der codecentric AG geschrieben. In diesem Artikel werde ich weiter auf die technischen Details des Ambassador Containers...

Pattern
Linux

13.8.2015 | 4 Minuten Lesezeit

Christian Zunker

Modifications to the CoreOS Ambassador Pattern

In this post I explain my changes to the ambassador pattern I implemented during a microservices project earlier this year. With Docker Links , Docker containers are able to communicate with each other over the network. When creating a Link, IP and exposed...

Pattern
Linux
Microservices

12.8.2015 | 2 Minuten Lesezeit

Christian Zunker

Case Study: Microservices bei LeanIX

Heute schreibe ich über ein gemeinsames Projekt der LeanIX GmbH und der codecentric AG , in dem die Architektur der leanIX Enterprise Architecture Management (EAM) Lösung verfeinert wurde. Die Architektur basierte bereits auf Microservices, die durch...

Microservices

11.8.2015 | 2 Minuten Lesezeit

Christian Zunker

Nicer Ansible output for Puppet tasks

In a previous post , I wrote about executing Puppet from within an Ansible playbook. But the output did not look very nice. In this post I take a closer look at how to change that. Just as a reminder, the output of Puppet looks like this, when called...

15.4.2015 | 4 Minuten Lesezeit

Christian Zunker

Migrate from Puppet to Ansible

In a previous post , I wrote about combining Ansible and Puppet, with Ansible as remote executor for arbitrary commands. In this post I take a look at how to migrate from Puppet to Ansible. Combine the Execution of Ansible and Puppet If you want to ...

17.12.2014 | 3 Minuten Lesezeit

Christian Zunker

Ansible as remote executor in a Puppet environment

When you are using Puppet you might know this problem: How can I execute arbitrary commands on all or some of my Puppet nodes? In this article, I explain how you can do so with Ansible . Ansible it another configuration management tool like Puppet and...

CI/CD
DevOps
Infrastructure
Open Source

21.9.2014 | 4 Minuten Lesezeit

Christian Zunker

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Tutorial: Full Stack Web App in Rust

In diesem Artikel bauen wir gemeinsam eine kleine „Two-Tier“-Web-Anwendung – komplett mit Browser-Frontend und HTTP-Backend. Um den Tech Stack klein zu halten, verwenden wir dafür nur eine Programmiersprache: Rust. Warum das Ganze und warum ausgerechnet...

Softwareentwicklung
Rust
Frontend
Backend

5.4.2024 | 12 Minuten Lesezeit

Goetz Markgraf

Test Fixtures mit JUnit 5

Wir Softwareentwickler leben in einem ständigen Dilemma. Jede Funktionalität der Software sollte durch Unit-Tests und Integrationstest abgesichert werden. Es sollten dabei so viel Tests wie nötig, aber nur so wenige wie möglich geschrieben werden. Schreiben...

Java
Testing
Framework
Softwareentwicklung

25.3.2024 | 7 Minuten Lesezeit

Jens Kaiser

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Seit einiger Zeit steht der Anypoint Code Builder (ACB) in der General-Availability-Version zur Verfügung. Ein Grund, sich einige Features der lang ersehnten Ablösung des Anypoint Studios einmal anzusehen. Schließlich warten ich und viele meiner Kollegen...

Integration
Softwareentwicklung
Programmiersprache

19.3.2024 | 8 Minuten Lesezeit

Pasquale Brunelli

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Wie als Software-Entwickler sichtbar werden?

Egal ob Junior, Medior oder Senior, introvertiert oder extrovertiert: Jeder Software-Entwickler kann seine Sichtbarkeit mit unterschiedlichen Werkzeugen erhöhen und sollte dem Thema eine gewisse Bedeutsamkeit beimessen. Die Frage dabei ist nur: wie und...

Weiterbildung
Softwareentwicklung
Community
Open Source

21.2.2024 | 6 Minuten Lesezeit

Edgar Klepek

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Datenbanken testen mit Testcontainers in Mule4

Hier erfährst du die Möglichkeiten Testcontainers in Mule4 zu nutzen, um deine Datenbankaufrufe zu testen. Vor einiger Zeit hat mein Kollege Christian Langmann eine Blogartikelserie veröffentlicht, in welcher er aufzeigt, wie man in Mule3 Munit-Tests...

Community
Softwareentwicklung
Testing
API
Open Source
Datenbank
Container
Integration

19.1.2024 | 3 Minuten Lesezeit

Benjamin Lüdicke

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Stellt man Projektbeteiligten die Frage, ob Qualität von Software wichtig ist, antwortet ein Großteil der Befragten vermutlich mit „Ja”. Jede andere Antwort würde sicherlich weitere, unangenehme Fragen aufkommen lassen. Aber was bedeutet Qualität im ...

Testing
Softwareentwicklung

18.10.2023 | 9 Minuten Lesezeit

Kevin Peters

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Erfahre, wie du mit dem Tool Mule Flow Landscape den Überblick über alle Mule Flows und deren Abhängigkeiten behältst. Die Integrationsplattform Mule ermöglicht es uns, Integrationen mittels einer Low-Code-Entwicklungsplattform umzusetzen. Die Bausteine...

Softwareentwicklung
API
Open Source
Dokumentation
Integration

13.8.2023 | 3 Minuten Lesezeit

Benjamin Lüdicke

Green Cloud: Nachhaltig skalieren

Wenn Softwareprojekte in die Cloud gebracht werden, versprechen wir uns davon hohe Verfügbarkeit, planbare Kosten und eine immer dem Bedarf entsprechende Skalierung. Aufgrund der grenzenlosen Angebote ist es aber auch leicht, die Komponenten eines Systems...

Cloud
Softwarearchitektur
Green IT

12.6.2023 | 5 Minuten Lesezeit

Dennis

Green Cloud: Ideen für eine nachhaltigere Architektur

Die ökologische Nachhaltigkeit eines Systems ist aktuell häufig noch kein Thema. Nachhaltigkeit bedeutet für mich in diesem Kontext die Reduktion der verursachten Emissionen durch gesenkten Ressourcenverbrauch – egal ob die Emissionen beim Cloudprovider...

Cloud
Softwarearchitektur
Green IT

5.5.2023 | 5 Minuten Lesezeit

Dennis

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Nachdem wir in Teil 1 unserer kleinen Reihe zum AG-Grid-Framework gezeigt haben, wie man damit schnell interaktive Tabellen erstellt, geht es in diesem Beitrag darum, wie man die gleichen Daten auch in Grafiken (wie Balkendiagramme, Pie Charts oder Zeitserien...

React
Frontend
JavaScript
Framework
Softwareentwicklung

2.5.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Automatische Dependency-Updates mit Renovate

Bei der Softwareentwicklung ist es sinnvoll, bereits bestehende Funktionen wiederzuverwenden. Das spart Zeit und es wird unwahrscheinlicher, auf Probleme zu stoßen, die andere bereits gelöst haben. Funktionen können aus diesem Grund in Libraries gebündelt...

Softwareentwicklung
CI/CD

17.4.2023 | 6 Minuten Lesezeit

Alexander Backes

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

Astro stellt sich als „All-in-one Web Framework“ vor, das „designed for speed“ ist. Große Versprechen wie „Pull your content from anywhere“, „Deploy everywhere“ und „Use whatever frontend library you want“ prangen offensiv auf der Startseite. Eine eierlegende...

Frontend
JavaScript
Webdevelopment
Framework
Softwareentwicklung

14.4.2023 | 4 Minuten Lesezeit

Stephan Köninger

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

Victor Volle und Marc Bialowons geben Einblicke aus dem Review eines Platform-Engineering-Projekts in einem großen Unternehmen, das sich in diesem Bereich klar als Vorreiter herausstellte. Marco Paga hat mit ihnen gesprochen.Marco Paga: Victor, Marc,...

Platform Engineering
Softwareentwicklung

17.3.2023 | 13 Minuten Lesezeit

Marco Paga

Victor Volle

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Platform Engineering mit BackstageIm folgenden Interview berichten Marc Schnitzius und Pascal Sochacki von ihren ersten Erfahrungen mit Backstage als Platform-Engineering-Lösung.Marco Paga: Marc, Pascal, ihr habt eine Sicht auf Platform Engineering, ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

2.3.2023 | 12 Minuten Lesezeit

Marco Paga

Maximilian Mayer

Schöner arbeiten mit dem Quake Terminal

Das Terminal ist ein wesentlicher Bestandteil meiner täglichen Arbeit. Unzählige Male am Tag tippe ich dort Kommandos für die verschiedensten Zwecke ein. Dabei nervt es mich aber grundsätzlich, dass das Standardterminal sich meistens hinter anderen Fenstern...

Softwareentwicklung

28.2.2023 | 7 Minuten Lesezeit

Pasquale Brunelli

Threat Modeling 101 – Wie fange ich eigentlich an?

In einem früheren Blogpost haben wir bereits erklärt, wie wichtig Awareness im Bereich IT-Security im agilen Projekt ist. Ein Kernthema war das Threat Modeling. Doch wie genau funktioniert das? Wie bewerte ich, welche Bereiche meiner Applikation unter...

Agilität
IT-Security
Softwareentwicklung

27.2.2023 | 14 Minuten Lesezeit

Kevin Peters

„Platform Engineering ist eine Art von Knowledge Sharing“

Warum „Platform Engineering“ eigentlich der falsche Begriff ist und wie man den Golden Path findet, erklärt Daniel Kocot, Senior Solution Architect, im folgenden Interview.Marco Paga: Warum ist Platform Engineering interessant?Daniel Kocot: Ich habe ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

20.2.2023 | 11 Minuten Lesezeit

Daniel Kocot

Marco Paga

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Die heutige Datenflut hat Software und Frameworks, wie Tableau, D3 und viele andere, hervorgebracht, deren Aufgabe es ist, die Visualisierung von Daten zu verbessern. Doch trotz der teilweise sehr ausgefallenen Darstellungsformen ist manchmal die simple...

Framework
Frontend
JavaScript
React
Softwareentwicklung

17.2.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Site Reliability Engineering: Software in Produktion betreiben

Protokollierung

Wiederholte Verbindungsversuche

Es gehört mehr dazu, Software in Produktion auszuführen

Sicherung/Wiederherstellung

Zertifikate

Aber – warum?

Die Irrtümer

Kurzer Umweg

Die Irrtümer und Public Clouds

Fazit

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Overview of hardened container base images

Site Reliability Engineering: Running software in production

How to use OAuth2 Proxy for central authentication

The how of monitoring your services

Cynicism and burnout in Information Technology

Kubernetes deployment concepts

Debugging Kubernetes Network Policies with ephemeral containers

Configuring Kubernetes login with Keycloak

Configure your Gitlab CI with docker-machine against keystone v3

Measure your radosgw usage with OpenStack-Ansible

Measuring your OpenStack Cloud with Gnocchi and Ceph storage backend

Monitoring für die Cloud

Docker Ambassador mit HAProxy und etcd

Modifications to the CoreOS Ambassador Pattern

Case Study: Microservices bei LeanIX

Nicer Ansible output for Puppet tasks

Migrate from Puppet to Ansible

Ansible as remote executor in a Puppet environment

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Tutorial: Full Stack Web App in Rust

Test Fixtures mit JUnit 5

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Green Cloud: Daten und Emissionen sparen

Wie als Software-Entwickler sichtbar werden?

Charge your APIs Volume 23: REST vs. gRPC

Datenbanken testen mit Testcontainers in Mule4

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Green Cloud: Nachhaltig skalieren

Green Cloud: Ideen für eine nachhaltigere Architektur

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Automatische Dependency-Updates mit Renovate

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Schöner arbeiten mit dem Quake Terminal

Threat Modeling 101 – Wie fange ich eigentlich an?

„Platform Engineering ist eine Art von Knowledge Sharing“

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten