SPRACHE

Nützliche JVM Flags – Teil 8 (GC Logging)

3.1.2014 | 7 Minuten Lesezeit

Im letzten Teil dieser Serie beschäftigen wir uns mit dem Thema Garbage Collection Logging und den dazugehörigen Flags. Das GC Log ist eines der wichtigsten Mittel, das uns zur Verfügung steht, um mögliche Schwachstellen in der Heap- und GC-Konfiguration oder dem Speicherverhalten der Anwendung aufzudecken. Im GC Log stehen exakte Daten zu GC-Ergebnissen und -Dauer, die bei jedem GC-Vorgang geschrieben werden.

-XX:+PrintGC

Mit dem Flag -XX:+PrintGC (oder dem Alias -verbose:gc) lässt sich ein sehr einfaches GC Logging aktivieren, das für jede Young Generation GC und jede Full GC eine Zeile schreibt. Hier eine Beispielausgabe:
[GC 246656K->243120K(376320K), 0,0929090 secs] [Full GC 243120K->241951K(629760K), 1,5589690 secs]

Die Zeile beginnt (rot markiert) mit dem GC-Typ, entweder „GC“ oder „Full GC“. Danach folgt (blau markiert) die Angabe des belegten Heap-Speichers vor bzw. nach der GC (getrennt durch einen Pfeil) sowie die aktuell reservierte Heap-Größe (in Klammern). Abschließend wird noch die Dauer der GC (Echtzeit in Sekunden) angegeben.

In der ersten Zeile bedeutet also 246656K->243120K(376320K), dass vor der GC 246656K und nach der GC 243120K Heap-Speicher belegt waren. Die Gesamtgröße des Heap zum Zeitpunkt der GC betrug 376320K. Außerdem hat die GC 0,0929090 Sekunden gedauert.

Das einfache GC Logging hat ein Format, das unabhängig vom verwendeten GC-Algorithmus ist und uns daher keine weiteren Details liefern kann. So können wir in obigem Beispiel nicht einmal erkennen, ob Objekte von der Young in die Old Generation verschoben wurden. Für die Praxis nützlicher ist deshalb das detaillierte GC Logging.

-XX:+PrintGCDetails

Wenn wir anstelle von -XX:+PrintGC das Flag -XX:+PrintGCDetails verwenden, aktivieren wir das detaillierte GC Logging. Das Format unterscheidet sich je nach verwendetem GC-Algorithmus. Betrachten wir zum Auftakt ein Beispiel für eine Young Generation GC bei Verwendung des Throughput Collector. Zum besseren Verständnis habe ich die Ausgabe in mehrere Zeilen umgebrochen und eingerückt; im GC Log handelt es sich um eine einzige Zeile, die für Menschen weniger leicht zu lesen ist.
[GC [PSYoungGen: 142816K->10752K(142848K)] 246648K->243136K(375296K), 0,0935090 secs ] [Times: user=0,55 sys=0,10, real=0,09 secs]

Wir erkennen bereits bekannte Elemente aus dem einfachen GC Log wieder: Es handelt sich um eine Young Generation GC (rot), welche 0,0935090 Sekunden gedauert hat und den belegten Heap-Speicher von 246648K auf 243136K (blau) reduziert hat. Zusätzlich erhalten wir Informationen zur Young Generation, nämlich den verwendeten Kollektor (orange) sowie ihre Kapazität und Füllstand (grün). Im Beispiel konnte der „PSYoungGen“-Kollektor den belegten Heap-Speicher in der Young Generation von 142816K auf 10752K reduzieren.

An der Kapazitätsangabe der Young Generation kann man gut erkennen, dass die GC ausgelöst wurde weil die Young Generation eine anstehende Objektallokation ansonsten nicht hätte durchführen können (142816K der verfügbaren 142848K waren bereits belegt). Ebenfalls sehen wir, dass die meisten Objekte von Young nach Old verschoben wurden, denn ein Vergleich der grünen und blauen Angaben zeigt, dass die Young Generation fast komplett geleert wurde, die Belegung des Gesamtheap sich aber kaum verändert hat.

Im „Times“-Abschnitt liefert uns das Log noch Angaben zur verwendeten CPU-Zeit im User Space („user“) bzw. Kernel Space („sys“) des Betriebssystems sowie zur tatsächlich verstrichenen Zeit („real“), jeweils bezogen auf die gesamte GC. Der Wert bei „real“ ist mit 0,09 eine gerundete Version der bereits weiter oben angegebenen 0,0935090 Sekunden. Wenn die verbrauchte CPU-Zeit wesentlich höher ist als die tatsächlich verstrichene Zeit, ist das ein Indikator dafür, dass die GC mit mehreren Threads durchgeführt wurde. Die CPU-Zeit ergibt sich dann aus der Summe der CPU-Zeiten aller GC-Threads. Tatsächlich wurden im vorliegenden Beispiel acht GC-Threads verwendet.

Betrachten wir nun die Ausgaben zu einer Full GC.
[Full GC [PSYoungGen: 10752K->9707K(142848K)] [ParOldGen: 232384K->232244K(485888K)] 243136K->241951K(628736K) [PSPermGen: 3162K->3161K(21504K)], 1,5265450 secs ] [Times: user=10,96 sys=0,06, real=1,53 secs]

Im Vergleich zu den Young Generation GCs erhalten wir hier (im bekannten Format) weitere Details zur Old Generation und Permanent Generation. Wir sehen für alle drei Generationen, welcher Kollektor verwendet wurde, wie ihr Füllstand vor und nach der GC und wie ihre aktuelle Kapazität ist. Die Angaben zur Young und Old Generation ergeben jeweils in Summe die Werte, die für den Gesamtheap (blau) gelistet werden. Zum Beispiel sind aktuell 241951K des Heap belegt, wovon 9707K auf die Young Generation und 232244K auf die Old Generation entfallen. Die Full GC hat ca. 1,53 Sekunden gedauert, und die verbrauchte CPU-Zeit von 10,96 Sekunden im User Space zeigt, dass hier ebenfalls mehrere GC-Threads (es waren erneut acht) verwendet wurden.

Die Angaben zu den einzelnen Generationen erlauben uns, Rückschlüsse über den Auslöser der GC zu ziehen. Hat eine der drei Generationen ihre Kapazitätsgrenze erreicht, so hat dies mit Sicherheit die GC ausgelöst. Im obigen Beispiel ist jedoch keine der drei Generationen an ihre Kapazitätsgrenze gestoßen. Das kann beim Throughput Collector passieren, wenn die GC Ergonomics (siehe Teil 6 dieser Serie) anhand interner Messungen entscheiden, dass schon vorher eine GC durchgeführt werden sollte.

Ein weiterer möglicher Auslöser für eine Full GC ist, wenn sie explizit von der Anwendung (oder über eine der externen JVM-Schnittstellen) angefordert wurde. Solche sogenannten „System GCs“ kann man im GC Log ebenfalls eindeutig identifizieren. Bei System GCs beginnt die Zeile mit „Full GC (System)“ anstelle von „Full GC“.

Für den Serial Collector ist das detaillierte GC Log sehr ähnlich zu dem des Throughput Collector. Der einzige nennenswerte Unterschied ist, dass die einzelnen Bereiche andere Namen haben, da andere GC-Algorithmen verwendet werden (z.B. „Tenured“ anstelle von „ParOldGen“). Das ist hilfreich, denn anhand dieser eindeutigen Namen kann man allein aus dem GC Log erkennen, welcher Garbage Collector verwendet wurde.

Für den CMS Collector ist das GC Log für Young Generation GCs ebenfalls sehr ähnlich zu dem des Throughput Collector, erneut mit anderer Namensgebung. Für die nebenläufigen Old Generation GCs unterscheiden sich die Ausgaben jedoch sehr von denen der anderen Kollektoren, weil sie Einträge zu den verschiedenen Phasen des CMS Collector enthalten. Außerdem können die Ausgaben des CMS Collector aufgrund der nebenläufigen Ausführung mit den Ausgaben von Young Generation GCs verzahnt sein. Mit der Kenntnis der anderen Formate ist es aber nicht schwierig, die Ausgaben zu den einzelnen Phasen zu verstehen. Bei der Interpretation von Zeiten sollte man allerdings im Kopf haben, dass die meisten Phasen des Kollektors nebenläufig sind. Lange Zeitspannen für einzelne Phasen oder die gesamte GC deuten deshalb – im Gegensatz zu den Stop-the-World-Kollektoren – nicht unbedingt auf ein Problem hin.

Wie wir aus Teil 7 dieser Serie wissen, findet auch bei Verwendung des CMS Collector eine Full GC statt, wenn ein nebenläufiger GC-Zyklus nicht schnell genug beendet wird. In diesem Fall tauchen im GC Log also auch bei Verwendung des CMS Collector „Full GC“-Einträge auf. Zusätzlich erhalten wir in diesem Fall eine Angabe zur Ursache der Full GC, z.B. den berüchtigten „concurrent mode failure“.

Um den Rahmen dieses Blogs nicht zu sprengen, verzichte ich auf eine genau Beschreibung des detaillierten Logs für den CMS Collector. Auch weil einer der Autoren des Kollektors hier bereits eine sehr gute und ausführliche Erklärung dazu gibt, die ich nur empfehlen kann.

-XX:+PrintGCTimeStamps und -XX:+PrintGCDateStamps

Es gibt die Möglichkeit, Zeit- und Datumsinformationen zum (einfachen oder detaillierten) GC Log hinzuzufügen. Mit -XX:+PrintGCTimeStamps wird jeder Zeile ein Zeitstempel vorangestellt, der die seit JVM-Start verstrichene Zeit in Sekunden angibt. Ein Beispiel:
0,185: [GC 66048K->53077K(251392K), 0,0977580 secs] 0,323: [GC 119125K->114661K(317440K), 0,1448850 secs] 0,603: [GC 246757K->243133K(375296K), 0,2860800 secs]

Mit -XX:+PrintGCDateStamps hingegen wird jeder Zeile eine absolute Datums- und Zeitangabe vorangestellt:
2014-01-03T12:08:38.102-0100: [GC 66048K->53077K(251392K), 0,0959470 secs] 2014-01-03T12:08:38.239-0100: [GC 119125K->114661K(317440K), 0,1421720 secs] 2014-01-03T12:08:38.513-0100: [GC 246757K->243133K(375296K), 0,2761000 secs]

Die Flags lassen sich auch miteinander kombinieren, falls beide Angaben von Interesse sind. Meine Empfehlung ist, stets beide Flags zu setzen, da man die Informationen gut verwenden kann um Daten aus dem GC Log mit anderen Daten zeitlich zu korrelieren.

-Xloggc

Standardmäßig wird das GC Log auf die Standardausgabe geschrieben. Mit -Xloggc: kann alternativ eine Datei als Ziel für die Ausgabe spezifiziert werden. Dieses Flag schließt übrigens die Flags -XX:+PrintGC und -XX:+PrintGCTimeStamps ein, aber um sich gegenüber unerwarteten Änderungen bei neuen JVM-Versionen zu schützen würde ich diese Flags, falls gewünscht, trotzdem setzen.

„Manageable“ Flags

Eine viel diskutierte Frage ist, ob man GC Logging bei JVMs in Produktionssystemen standardmäßig aktivieren sollte. Der Overhead für GC Logging ist in der Regel gering, weshalb ich hier zu einem „Ja“ tendiere. Eigentlich möchte ich aber auf den folgenden Punkt hinaus, der die Bedeutung der obigen Frage etwas reduziert: Man muss sich beim Start einer JVM gar nicht für oder gegen GC Logging entscheiden.

Bei der Hotspot-JVM gibt es eine spezielle Kategorie von Flags, deren Werte man zur Laufzeit ändern kann. Diese Kategorie nennt sich „manageable“ und beinhaltet insgesamt nur sehr wenige Flags, nicht einmal 20. Die oben besprochenen mit „PrintGC“ beginnenden Flags zählen zu dieser Kategorie. Es ist also ohne Weiteres möglich, GC Logging bei einer laufenden JVM zu aktivieren und auch wieder zu deaktivieren. Hierfür kann man beispielsweise das beim JDK mitgelieferte Kommandozeilentool jinfo nutzen, oder aber mit einem JMX-Client die setVMOption-Operation der HotSpotDiagnostic-MXBean aufrufen.

War dieser Beitrag hilfreich?

SPRACHE

Beitrag teilen

Gefällt mir

Blog-Autor*in

Patrick Peschlow

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Patrick Peschlow

Elastic{ON}: Erste Elasticsearch-User-Konferenz in San Francisco

Elasticsearch in all seinen Facetten – das war das Thema der ersten Elastic{ON} , die Anfang März in San Francisco stattfand. Über 1.000 User waren vor Ort, und auch die codecentric als Elasticsearch-Partner war mit einem Stand vertreten! Das codecentric...

8.4.2015 | 5 Minuten Lesezeit

Patrick Peschlow

Scaling an Elasticsearch Index – Introduction

A well-known design decision of Elasticsearch is that a fixed number of shards has to be specified when creating an index. It is not possible to start out with just one or only a few shards and add more shards later as the data increases. Now what to...

30.3.2015 | 7 Minuten Lesezeit

Patrick Peschlow

Transactions in Elasticsearch

Earlier this year a customer mentioned a search requirement that I hadn’t really thought about before: How to achieve transactions in Elasticsearch? Recently, the same requirement popped up again in a conversation I had with other search aficionados....

6.10.2014 | 8 Minuten Lesezeit

Patrick Peschlow

Elasticsearch Indexing Performance Cheatsheet

You plan to index large amounts of data in Elasticsearch? Or you are already trying to do so but it turns out that throughput is too low? Here is a collection of tips and ideas to increase indexing throughput with Elasticsearch. Some of them I have successfully...

NoSQL

8.5.2014 | 8 Minuten Lesezeit

Patrick Peschlow

Elasticsearch Monitoring and Management Plugins

Elasticsearch offers a highly useful plugin mechanism as a standard way for extending its core. Plugins enable developers to add new functionality, e.g., a custom analyzer, or provide alternatives to existing functionality, like swapping in another transport...

30.3.2014 | 11 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 7 (CMS Collector)

The Concurrent Mark Sweep Collector (“CMS Collector”) of the HotSpot JVM has one primary goal: low application pause times. This goal is important for most interactive applications like web applications. Before we take a look at the relevant JVM flags...

4.3.2013 | 10 Minuten Lesezeit

Patrick Peschlow

ForkJoinPool vs. ThreadPoolExecutor

Recently, an article of mine appeared on the German site Heise Developer, and today the English translation was published on The H Developer. The article gives an introduction to the Java 7 ForkJoinPool and explains for which application scenarios ...

25.11.2012 | 1 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 6 (Throughput Collector)

For most application areas that we find in practice, a garbage collection (GC) algorithm is being evaluated according to two criteria: The higher the achieved throughput, the better the algorithm.The smaller the resulting pause times, the better the ...

4.1.2012 | 10 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 5 (Young Generation Garbage Collection)

In this part of our series we focus on one of the major areas of the heap, the “young generation”. First of all, we discuss why an adequate configuration of the young generation is so important for the performance of our applications. Then we move on...

18.8.2011 | 13 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 4 (Heap Tuning)

Ideally, a Java application runs just fine with the default JVM settings so that there is no need to set any flags at all. However, in case of performance problems (which unfortunately arise quite often) some knowledge about relevant JVM flags is a welcome...

2.7.2011 | 6 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 3 (Printing all XX Flags and their Values)

With a recent update of Java 6 (must have been update 20 oder 21), the HotSpot JVM offers two new command line flags which print a table of all XX flags and their values to the command line right after JVM startup. As many HotSpot users were longing ...

Java
APM

10.4.2011 | 4 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 2 (Flag Categories and JIT Compiler Diagnostics...

In the second part of this series, I give an introduction to the different categories of flags offered by the HotSpot JVM. Also, I am going to discuss some interesting flags regarding JIT compiler diagnostics. JVM flag categories The HotSpot JVM offers...

Java
APM

23.3.2011 | 9 Minuten Lesezeit

Patrick Peschlow

Useful JVM Flags – Part 1 (JVM Types and Compiler Modes)

Modern JVMs do an amazing job at running Java applications (and those of other compatible languages) in an efficient and stable manner. Adaptive memory management, garbage collection, just-in-time compilation, dynamic classloading, lock optimization ...

Java
APM

8.3.2011 | 6 Minuten Lesezeit

Patrick Peschlow

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Absenden

Nützliche JVM Flags – Teil 8 (GC Logging)

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Elastic{ON}: Erste Elasticsearch-User-Konferenz in San Francisco

Scaling an Elasticsearch Index – Introduction

Transactions in Elasticsearch

Elasticsearch Indexing Performance Cheatsheet

Elasticsearch Monitoring and Management Plugins

Useful JVM Flags – Part 7 (CMS Collector)

ForkJoinPool vs. ThreadPoolExecutor

Useful JVM Flags – Part 6 (Throughput Collector)

Useful JVM Flags – Part 5 (Young Generation Garbage Collection)

Useful JVM Flags – Part 4 (Heap Tuning)

Useful JVM Flags – Part 3 (Printing all XX Flags and their Values)

Useful JVM Flags – Part 2 (Flag Categories and JIT Compiler Diagnostics...

Useful JVM Flags – Part 1 (JVM Types and Compiler Modes)

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten