Suchst Du noch Schuldige oder löst Du schon Probleme?

28.2.2011 | 5 Minuten Lesezeit

oder: Schwarzer Peter spielen ist keine Lösung

Es brennt. Die wichtigste Java-Applikation der Firma steht oder ist unerträglich langsam; das Management drängt auf eine schnelle Lösung. Da muss die Feuerwehr her, gerne in Gestalt externer Troubleshooter. Diese können unbelastet an das Problem herangehen und bringen oft auch noch andere wertvolle Expertise und Werkzeuge mit.

Als Beratungsdienstleister ist uns bei codecentric diese Situation wohl bekannt. Neben der Erfahrung bringen wir dazu die nötigen Tools mit, sofern sie nicht schon vorhanden sind: Produktionsmonitore wie z.B. AppDynamics , Profiler wie z.B. JProfiler und andere Helferlein wie z.B. Eclipse Memory Analyzer . Wichtiger ist aber, dass wir als Externe einen unverstellten Blick auf die Systeme werfen können und auch jede Menge Fragen stellen dürfen.

Fragen, die sich diejenigen, die die Applikation schon lange kennen, aus verschiedenen Gründen nicht mehr stellen oder nie gestellt haben. Gemeinsam mit dem Kunden finden wir dann die Problemursache in der Regel recht schnell und dann passiert manchmal etwas Überraschendes. Nämlich nichts.

Performance Troubleshooting – ein symptomatisches Beispiel

Ein Vorteil von Java Anwendungen ist das automatische Speichermanagement; allerdings gibt es eine Vielzahl von Problemen die damit einher gehen können. Nehmen wir z.B. eine Rich Client Applikation, welche mit einem Server stateless kommuniziert und sehr viele Daten verarbeitet. Diese werden natürlich aus der Datenbank geholt, der Einfachheit halber über Hibernate. Es werden dabei auf dem Server eine Unmenge von kleinen Objekten erzeugt, die auch gleich wieder verworfen werden (Memory Thrashing). Das läßt sich mit Hilfe eines Produktionsmonitors schön beobachten (siehe die 3 exemplarischen Grafiken). So ist die kritische Komponente auch gleich erkannt.

Hibernate in Action

Alle SQL Calls der Transaktion

Speicherauslastung und GC

Zusammen mit Verlaufsgraphen für den Speicherverbrauch aus dem Produktionssystem kann man also visuell nachweisen, dass Hibernate kurzfristig viel Speicher braucht für die einzelnen Objekte. Damit natürlich auch viel CPU für Garbage Collections und jede Menge SQL Statements.

Sehr gut: Wir haben das Performance Bottleneck gefunden. Und wissen auch, dass die Skalierbarkeit natürliche Grenzen hat. Man kann sich das so vorstellen wie einen Stall, der ursprünglich für Hühner konzipiert wurde, nun aber Vögel im Strauß-Format darin untergebracht werden sollen.

Sicherlich kann man jetzt die Käfige vergrößern und die Abfallentsorgung optimieren, aber es werden nicht dieselbe Anzahl Straußvögel wie ehemals Hühner hineinpassen. Um das zu erreichen, müssten die Strauße kleiner und leichter oder der Stall komplett umgebaut werden. Mit einer einfachen Konfigurationsänderung ist es hier nicht getan.
Klingt logisch? Ja! Nur ist nicht jeder ein Vulkanier .

Problem gefunden – Maßnahmen ergriffen

Was wir oft sehen sind folgende Maßnahmen (in dieser Reihenfolge):

Mehr Speicher geben (bei 32-Bit JVMs begrenzte Möglichkeiten)
Regelmäßig neu starten (cron job)
Noch mehr Speicher geben
Noch öfter neu starten (einmal stündlich scheint aber störend für die Anwender zu sein)
Ein APM Werkzeug zur Überwachung einsetzen und gezielt neu starten
Spezialisten zum Tuning holen – Gerne die beteiligten Softwarehersteller, die dann nachweisen, dass es nicht an ihrer Software liegt und man nichts mehr tunen kann
Schimpfen, Messen, Schimpfen
…

Was fällt auf? Genau: Das eigentlich zugrundeliegende Problem wurde nicht wirklich angegangen, der Root Cause nicht beseitigt.

Problem wird nur geschickt umschifft, aber warum ist das so?

Die Gründe dafür sind mannigfaltig, weshalb die Liste auch nur einen Auszug darstellt:

Die Anwendung wurde von externen Kräften entwickelt und wenig bis gar nicht dokumentiert, aber strikt nach Vorgabe entwickelt und abgenommen – kann also nicht das Problem sein
Die verschiedenen Abteilungen (Entwicklung, Test, Operating) sind streng voneinander getrennt und die Übergabepunkte genau definiert – es findet keine Kommunikation statt (siehe auch Agile Worst Practices – 4 )
Frameworks wurden nach Fachlichkeit benutzt und ohne Berücksichtigung der Performance-Aspekte verwendet. Das funktioniert prima am Entwicklerarbeitsplatz, aber oftmals nicht unter Produktionslast
Open Source Komponenten wurden erweitert, am besten von Externen, so dass keine der googlebaren Hilfestellungen wirklich weiterhilft – hier ist viel Aufwand und Sachverstand notwendig
Es handelt sich um eine komplette Eigenentwicklung und der verantwortliche Entwickler hat das Unternehmen verlassen – die Dokumentation besteht aus TODO Tags
Die Architektur wurde mit Fachleuten sehr lange entwickelt und optimiert und kann nicht falsch sein – da wurde ein Hühnerstall entwickelt, nach Erfolg als Blaupause gesetzt und jetzt wird aber ein Straußenstall gebraucht

Neben den vorangegangenen Gründen gibt es noch eine Menge weiterer und auch Kombinationen daraus.

Was tun? Alternative zum traditionellen Blame Game

Ein Monitoringtool hilft, beschafft aber nur die Rohdaten. Erst der Mensch kann die richtigen Schlüsse ziehen. Die Überwachungs- und Profilingtools mögen noch so gut sein, aber hier hilft meiner Ansicht nach nur Kommunikation und Offenheit. Der operative Betrieb und das Business (die Fachabteilung) haben das Problem, aber beseitigen können es nur die Techniker (Entwickler, Architekten, etc.) – hier muss also ein Dialog entstehen. Dieser wird oft durch Altlasten oder auch politische Entscheidungen verhindert.

Stattdessen wird in langwierigen Krisenmeetings versucht DEN Schuldigen zu finden, der die Verantwortung für das Problem übernehmen muss (Blame Game, Schwarzer Peter). Man konzentriert sich also auf die Personen oder die Abteilung, nicht auf die Ursache des Problems. Das ist absolut kontraproduktiv. Die Beteiligten (Entwickler, Architekten, Software Hersteller, SysAdmins, Fachbereich, etc.) werden hier meist gezwungen sich zu verteidigen und zu erklären, warum der Fehler NICHT in ihrem Bereich sein kann, bzw. dass die gefundenen Problemursachen aus Sachzwängen entstanden sind, an denen man nichts ändern kann. Das löst aber das Problem nicht.

Einen objektiven Dialog können die gefundenen Messwerte und Tatsachen als Katalysator ermöglichen. Das hängt auch sehr vom Fingerspitzengefühl des Moderators einer solchen Krisensitzung ab. Als externer Berater hat man die Möglichkeit unbelastet von der Vorgeschichte die kritischen Punkte als solche anzusprechen und die entscheidende Frage zu stellen: Wer kann das eine Problem am besten lösen, wer das andere? Was können die einzelnen Abteilungen dazu beitragen? Wenn sich dabei heraustellt, dass eine Lösung, die das Problem wirklich beseitigt viel Zeit und Geld kostet, kann eine andere Diskussion in Gang kommen. Aber als Ergebnis hat man dann einen Grund für die Probleme und die Gewissheit, dass man damit leben oder Geld in die Hand nehmen muss. Eine Entscheidung, die letztlich das Management für die Firma zu treffen hat.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Rainer Schuppe

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Rainer Schuppe

AppDynamics komplettiert APM Lösung mit End User Monitoring

Wie ja nicht unbekannt ist, verwenden einige unserer Kunden erfolgreich AppDynamics als APM (Application Performance Management) Lösung in teils sehr komplexen Java und .NET Umgebungen. Ein kleines Stück hat bisher aber noch zu einer kompletten End to...

19.3.2012 | 3 Minuten Lesezeit

Rainer Schuppe

Vortrag „Application Performance Management – Best Practices“ – WJAX 2...

Application Performance Management oder kurz APM ist aktuell wohl ein sehr interessantes Thema für viele Besucher der WJAX 2011 . Ich war echt überwältigt vom Interesse an meiner Session zum Thema „APM – Best Practices“ vom 9.11. Vielen Dank von meiner...

Java
APM

24.11.2011 | 2 Minuten Lesezeit

Rainer Schuppe

AppDynamics Lite 2 erschienen – Java Performance Analyse kostenlos – Gutes...

Java Performance Analyse in Produktion für lau? Ja, das gibt es seit Mai 2010 in Form von AppDynamics Lite . Schnell und unkompliziert zu installieren (weniger als 5 Minuten; siehe Vorstellung AppDynamics Lite ) und sofort bekommt man Informationen aus...

Java
APM
Softwareentwicklung

16.10.2011 | 2 Minuten Lesezeit

Rainer Schuppe

No time for monitoring?

Monitoring big, distributed Java landscapes helps tremendously to keep complex applications under control. But many administrators spare the effort to set up monitoring: No time. Now a timesaving solution is in sight. „We are maxed out anyway. We...

Java
APM

1.9.2010 | 6 Minuten Lesezeit

Rainer Schuppe

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Tutorial: Full Stack Web App in Rust

In diesem Artikel bauen wir gemeinsam eine kleine „Two-Tier“-Web-Anwendung – komplett mit Browser-Frontend und HTTP-Backend. Um den Tech Stack klein zu halten, verwenden wir dafür nur eine Programmiersprache: Rust. Warum das Ganze und warum ausgerechnet...

Softwareentwicklung
Rust
Frontend
Backend

5.4.2024 | 12 Minuten Lesezeit

Goetz Markgraf

Test Fixtures mit JUnit 5

Wir Softwareentwickler leben in einem ständigen Dilemma. Jede Funktionalität der Software sollte durch Unit-Tests und Integrationstest abgesichert werden. Es sollten dabei so viel Tests wie nötig, aber nur so wenige wie möglich geschrieben werden. Schreiben...

Java
Testing
Framework
Softwareentwicklung

25.3.2024 | 7 Minuten Lesezeit

Jens Kaiser

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Seit einiger Zeit steht der Anypoint Code Builder (ACB) in der General-Availability-Version zur Verfügung. Ein Grund, sich einige Features der lang ersehnten Ablösung des Anypoint Studios einmal anzusehen. Schließlich warten ich und viele meiner Kollegen...

Integration
Softwareentwicklung
Programmiersprache

19.3.2024 | 8 Minuten Lesezeit

Pasquale Brunelli

Wie als Software-Entwickler sichtbar werden?

Egal ob Junior, Medior oder Senior, introvertiert oder extrovertiert: Jeder Software-Entwickler kann seine Sichtbarkeit mit unterschiedlichen Werkzeugen erhöhen und sollte dem Thema eine gewisse Bedeutsamkeit beimessen. Die Frage dabei ist nur: wie und...

Weiterbildung
Softwareentwicklung
Community
Open Source

21.2.2024 | 6 Minuten Lesezeit

Edgar Klepek

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Datenbanken testen mit Testcontainers in Mule4

Hier erfährst du die Möglichkeiten Testcontainers in Mule4 zu nutzen, um deine Datenbankaufrufe zu testen. Vor einiger Zeit hat mein Kollege Christian Langmann eine Blogartikelserie veröffentlicht, in welcher er aufzeigt, wie man in Mule3 Munit-Tests...

Community
Softwareentwicklung
Testing
API
Open Source
Datenbank
Container
Integration

19.1.2024 | 3 Minuten Lesezeit

Benjamin Lüdicke

Angular 17 – Eine echte Renaissance?

Gefühlt war es lange still rund um das Frontend-Framework Angular. Echte Innovationen blieben aus und man konnte das Gefühl nicht loswerden, dass Vue.js und React mit all ihren Derivaten den Vorsprung zu Angular uneinholbar weit ausbauen. Doch mit Version...

Angular
Webdevelopment
Frontend
Framework

15.12.2023 | 8 Minuten Lesezeit

Stephan Köninger

Reactive Programming mit Spring Webflux

In diesem Artikel geben wir einen Überblick über Reactive Programming, erläutern, welche Prinzipien diesem zugrunde liegen und wann ein Einsatz sinnvoll sein kann. Anschließend zeigen wir, wie mithilfe des Spring-Webflux-Projekts eine reaktive Anwendung...

Spring
Java
Reactive Programming

11.12.2023 | 13 Minuten Lesezeit

Christian Franzen

Ferdinand Ade

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Stellt man Projektbeteiligten die Frage, ob Qualität von Software wichtig ist, antwortet ein Großteil der Befragten vermutlich mit „Ja”. Jede andere Antwort würde sicherlich weitere, unangenehme Fragen aufkommen lassen. Aber was bedeutet Qualität im ...

Testing
Softwareentwicklung

18.10.2023 | 9 Minuten Lesezeit

Kevin Peters

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Erfahre, wie du mit dem Tool Mule Flow Landscape den Überblick über alle Mule Flows und deren Abhängigkeiten behältst. Die Integrationsplattform Mule ermöglicht es uns, Integrationen mittels einer Low-Code-Entwicklungsplattform umzusetzen. Die Bausteine...

Softwareentwicklung
API
Open Source
Dokumentation
Integration

13.8.2023 | 3 Minuten Lesezeit

Benjamin Lüdicke

Test-Fixtures: Wozu denn überhaupt?

Für uns Softwareentwickler ist der ultimative Endgegner immer die Komplexität. Wir haben zahlreiche, teils ziemlich mächtige Waffen gesammelt, um in diesen Kämpfen bestehen zu können: Dinge wie Modularisierung, Abstraktion, Lean Development, iteratives...

Testing
Java
Test Driven Development

12.5.2023 | 19 Minuten Lesezeit

Rüdiger zu Dohna

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Nachdem wir in Teil 1 unserer kleinen Reihe zum AG-Grid-Framework gezeigt haben, wie man damit schnell interaktive Tabellen erstellt, geht es in diesem Beitrag darum, wie man die gleichen Daten auch in Grafiken (wie Balkendiagramme, Pie Charts oder Zeitserien...

React
Frontend
JavaScript
Framework
Softwareentwicklung

2.5.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Automatische Dependency-Updates mit Renovate

Bei der Softwareentwicklung ist es sinnvoll, bereits bestehende Funktionen wiederzuverwenden. Das spart Zeit und es wird unwahrscheinlicher, auf Probleme zu stoßen, die andere bereits gelöst haben. Funktionen können aus diesem Grund in Libraries gebündelt...

Softwareentwicklung
CI/CD

17.4.2023 | 6 Minuten Lesezeit

Alexander Backes

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

Astro stellt sich als „All-in-one Web Framework“ vor, das „designed for speed“ ist. Große Versprechen wie „Pull your content from anywhere“, „Deploy everywhere“ und „Use whatever frontend library you want“ prangen offensiv auf der Startseite. Eine eierlegende...

Frontend
JavaScript
Webdevelopment
Framework
Softwareentwicklung

14.4.2023 | 4 Minuten Lesezeit

Stephan Köninger

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

Victor Volle und Marc Bialowons geben Einblicke aus dem Review eines Platform-Engineering-Projekts in einem großen Unternehmen, das sich in diesem Bereich klar als Vorreiter herausstellte. Marco Paga hat mit ihnen gesprochen.Marco Paga: Victor, Marc,...

Platform Engineering
Softwareentwicklung

17.3.2023 | 13 Minuten Lesezeit

Marco Paga

Victor Volle

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Platform Engineering mit BackstageIm folgenden Interview berichten Marc Schnitzius und Pascal Sochacki von ihren ersten Erfahrungen mit Backstage als Platform-Engineering-Lösung.Marco Paga: Marc, Pascal, ihr habt eine Sicht auf Platform Engineering, ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

2.3.2023 | 12 Minuten Lesezeit

Marco Paga

Maximilian Mayer

Schöner arbeiten mit dem Quake Terminal

Das Terminal ist ein wesentlicher Bestandteil meiner täglichen Arbeit. Unzählige Male am Tag tippe ich dort Kommandos für die verschiedensten Zwecke ein. Dabei nervt es mich aber grundsätzlich, dass das Standardterminal sich meistens hinter anderen Fenstern...

Softwareentwicklung

28.2.2023 | 7 Minuten Lesezeit

Pasquale Brunelli

Threat Modeling 101 – Wie fange ich eigentlich an?

In einem früheren Blogpost haben wir bereits erklärt, wie wichtig Awareness im Bereich IT-Security im agilen Projekt ist. Ein Kernthema war das Threat Modeling. Doch wie genau funktioniert das? Wie bewerte ich, welche Bereiche meiner Applikation unter...

Agilität
IT-Security
Softwareentwicklung

27.2.2023 | 14 Minuten Lesezeit

Kevin Peters

„Platform Engineering ist eine Art von Knowledge Sharing“

Warum „Platform Engineering“ eigentlich der falsche Begriff ist und wie man den Golden Path findet, erklärt Daniel Kocot, Senior Solution Architect, im folgenden Interview.Marco Paga: Warum ist Platform Engineering interessant?Daniel Kocot: Ich habe ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

20.2.2023 | 11 Minuten Lesezeit

Daniel Kocot

Marco Paga

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Die heutige Datenflut hat Software und Frameworks, wie Tableau, D3 und viele andere, hervorgebracht, deren Aufgabe es ist, die Visualisierung von Daten zu verbessern. Doch trotz der teilweise sehr ausgefallenen Darstellungsformen ist manchmal die simple...

Framework
Frontend
JavaScript
React
Softwareentwicklung

17.2.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Suchst Du noch Schuldige oder löst Du schon Probleme?

Performance Troubleshooting – ein symptomatisches Beispiel

Problem gefunden – Maßnahmen ergriffen

Problem wird nur geschickt umschifft, aber warum ist das so?

Was tun? Alternative zum traditionellen Blame Game

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

AppDynamics komplettiert APM Lösung mit End User Monitoring

Vortrag „Application Performance Management – Best Practices“ – WJAX 2...

AppDynamics Lite 2 erschienen – Java Performance Analyse kostenlos – Gutes...

No time for monitoring?

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Tutorial: Full Stack Web App in Rust

Test Fixtures mit JUnit 5

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Wie als Software-Entwickler sichtbar werden?

Charge your APIs Volume 23: REST vs. gRPC

Datenbanken testen mit Testcontainers in Mule4

Angular 17 – Eine echte Renaissance?

Reactive Programming mit Spring Webflux

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Test-Fixtures: Wozu denn überhaupt?

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Automatische Dependency-Updates mit Renovate

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Schöner arbeiten mit dem Quake Terminal

Threat Modeling 101 – Wie fange ich eigentlich an?

„Platform Engineering ist eine Art von Knowledge Sharing“

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten