Transformieren von Nachrichten mit Mule DataWeave – Teil 3: Schleifen und Gruppierungen

8.1.2016 | 5 Minuten Lesezeit

In den ersten beiden Teilen dieser Serie habe ich bereits Collections – und damit implizit – Schleifen verwendet. In diesem Beitrag werde ich das Thema vertiefen und dabei genauer auf das Mapping mit Lambdas eingehen. Zum Abschluss werde ich Gruppierungsfunktionen erläutern.

Bevor ich tiefer in das Thema einsteige, noch eine Ergänzung zum ersten Teil. Dort hatte ich geschrieben , dass es bei DataWeave (im Gegensatz zum alten DataMapper) kein grafisches Mapping mit Drag and Drop gibt. Stimmt nicht (mehr): Mitte Dezember kam mit einem Update des AnypointStudio das grafische Mapping für DataWeave. Der Editor hat dazu eine weitere Spalte erhalten, in der die Zuordnung grafisch durch Linien dargestellt wird:

Was mir an der Lösung gefällt: Die textuelle DSL hat sich nicht geändert, sie bleibt weiterhin kurz und prägnant. Die grafische Darstellung mit Drag and Drop ist nur eine Ergänzung. Wem es nicht gefällt, der kann weiter mit der Tastatur arbeiten und sich die Mappings durch die Linien anzeigen lassen. Wem das immer noch zu viel ist: Die Spalte mit den Linien lässt sich auch ausblenden. Umschalten kann man die Darstellung mit den Icons oben rechts (neben dem Button „Preview“).

Dem Editor fehlt aktuell (Stand: Dezember 2015) noch die nötige Reife: Er kommt beim Umschalten zwischen Drag and Drop und textuellem Editieren schnell durcheinander. Es empfiehlt sich, ihn nach Drag-and-Drop-Operationen zu schließen, bevor man textuell Änderungen vornimmt.

Flaches Remapping

Nun zum angekündigten Thema. Starten wir mit einem einfachen Beispiel: Eine Datenbanktabelle soll als CSV-Datei exportiert werden. Der Datenbank-Connector von Mule produziert eine Liste von Zeilen. In jeder Zeile befindet sich eine Map von Spaltenname auf Spalteninhalt. Bei gängigen Datenbanken (MySQL, Oracle etc.) ist AnypointStudio in der Lage, die Metadaten aus der Datenbank zu lesen. Name und Typ der Spalten zeigt der Editor direkt an.

Wie exportiert man nun eine Tabelle als CSV-Datei? Die Lösung ist trivial, wenn die Tabelle 1:1 exportiert werden soll und DataWeave nur die Formatumwandlung nach CSV durchführen muss:

%dw 1.0
%output application/csv
—
payload

Hier wird ausgenutzt, dass die Payload eine Liste enthält, die auch für CSV benötigt wird. Die Maps in der Liste legen dabei auch direkt die Spaltennamen für die CSV-Datei fest.

Über das Schlüsselwort „map“ und einen Lambda-Ausdruck lassen sich die Spalten auswählen und bei Bedarf umbenennen:
%dw 1.0
%output application/csv header=true, separator=‚;‘
—
payload map ({
„gewicht“: $.gewicht_in_kg,
„groesse“: $.groesse_in_m * 100,
„bmi“: $.bmi
}
)
Das Beispiel arbeitet mit der Kurzform, in der kein Name für die Schleifenvariable vergeben wird. Auf sie kann stattdessen mit $ zugegriffen werden. Da es sich um eine Map handelt, greift man auf einzelnen Elemente per Punktnation zu.

In der nicht anonymen Variante sieht man klarer, was hinter den Kulissen passiert:
%dw 1.0
%output application/csv
—
payload map ((a) -> {
„gewicht“: a.gewicht_in_kg,
„groesse“: a.groesse_in_m
}
)
Hinter „map“ steht der Lambda-Ausdruck mit einem Parameter in runden Klammern: (a), gefolgt von einem Pfeil und dem gemappten Ausdruck.

Strukturelle Änderungen

Mit Lambdas lassen sich nicht nur Attribute umbenennen, sondern auch die Struktur eines Datensatzes ändern. Für das nächste Beispiel besteht die Eingabedatei aus einem JSON-Array von Objekten mit den Attributen gewicht und groesse, Beispiel:

[ { „groesse“: 1.88, „gewicht“: 90 }, { „groesse“: 2.00, „gewicht“: 88 } ]

Wie gehen wir vor, wenn wir stattdessen ein Objekt mit Arrays für Größe und Gewicht haben wollen? Wir schreiben einfach ein JSON-Objekt mit den beiden Attributen hin und iterieren darin jeweils über die Eingabedaten. Die Projektion (SQL lässt grüßen) erledigen wir jeweils mit einem Lambda:

%dw 1.0
%output application/json
—
{
„massen„: payload map ((p) -> p.gewicht),
„laengen„: payload map ((p) -> p.groesse)
}
Bei diesem Beispiel fehlen auf der rechten Seite die geschweiften Klammern: Es soll schließlich kein Objekt erzeugt werden, in den Arrays massen und laengen stehen nur die Zahlen.

Lasst uns mit den Zahlen etwas rechnen! Wie wäre es mit einer Summenbildung? Geht, einfach reduce verwenden:
%dw 1.0
%output application/json
—
{
„massen„: payload map ((p) -> p.gewicht) reduce ((val, acc = 0) -> acc + val),
„laengen„: payload map ((p) -> p.groesse) reduce ((val, acc = 0) -> acc + val)
}
Der reduce-Operator arbeitet mit zwei Argumenten: Das erste enthält das aktuelle Array-Element, das zweite das Zwischenergebnis (Akkumulator). Es lässt sich explizit initialisieren (im Beispiel mit 0) oder enthält standardmäßig das erste Arrayelement.

Group By

Nachdem wir im letzten Beispiel ein Array von Objekten in zwei Arrays zerlegt haben, versuchen wir uns jetzt an der umgekehrten Richtung: Die Daten sollen nach dem Gewicht gruppiert werden. Aber nicht für jedes Gewicht eine Gruppe, sondern alle > 100 in die Kategorie „schwer“, der Rest in die Kategorie „leicht“.

Für Gruppierung existiert – wie in SQL – der groupBy-Operator. Aber wie erhalten wir das Mapping in die beiden Kategorien „leicht“ und „schwer“? Bei wenigen Kategorien (die dazu vorab bekannt sind) kann man Filter benutzen (siehe Teil 2 der Serie ). Im anderen Fall muss eine Funktion her, mit der sich die Kategorie bestimmen lässt. Ich habe hier mittels lookup einen Flow aufgerufen, der die Funktion umsetzt:

%dw 1.0
%output application/json
—
{
„data“: payload groupBy lookup(„kategorie„, $.gewicht)
}

Der erste Parameter enthält den Namen des Flows, der zweite die Payload. Der Flow selbst ist im Beispiel recht simpel, abhängig vom Gewicht gibt er eine der beiden Kategorien zurück:

<flow name=„kategorie“>
<choice>
<when expression=„#[payload > 100]“>
<set-payload value=„schwer“ />
when>
<otherwise>
<set-payload value=„leicht“ />
otherwise>
choice>
flow>

Der Flow könnte auch noch komplexere Transformationen enthalten, Services aufrufen oder Datenbanklookups durchführen. Eben alles, was Mule sonst noch bietet.

Zusammenfassung

Nachdem ich mit DataWeave einige Zeit herumexperimentiert habe, bin ich immer noch begeistert. Viele Dinge sind damit deutlich einfacher, als wenn man zuerst mit JAXB/Jackson alles nach Java umwandelt, dort das Mapping umwandelt und dann wieder nach XML/Json zurückkonvertiert. Messungen habe ich noch nicht durchgeführt, aber es ist vermutlich auch schneller. Vom Speicherbedarf ganz zu schweigen: Da DataWeave, wo immer es möglich ist, mit Streaming arbeitet, kann man in vielen Fällen auch Datenstrukturen bearbeiten, die größer als der verfügbare Hauptspeicher sind.

Mal sehen, eventuell gibt es noch einen weiteren Teil mit Praxisberichten aus dem Projekteinsatz. Stay tuned.

Links

Transformieren von Nachrichten mit Mule DataWeave – Teil 1: Einführung https://blog.codecentric.de/2015/09/esb-serie-transformieren-von-nachrichten-mit-mule-dataweave-teil-1-einfuehrung/
Transformieren von Nachrichten mit Mule DataWeave – Teil 2: Bedingungen und reguläre Ausdrücke https://blog.codecentric.de/2015/11/transformieren-von-nachrichten-mit-mule-dataweave-bedingungen/
Alle Blog-Artikel zu Mule im codecentric-Blog: https://blog.codecentric.de/?s=mule
Was ist ein ESB und wofür kann man ihn nutzen? https://blog.codecentric.de/2012/11/was-und-wofur-esb/
Tutorial „Enterprise Service Bus mit Mule ESB“: Hello World/Bus! https://blog.codecentric.de/2012/12/enterprise-service-bus-mule-esb/

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Roger Butenuth

Senior Integration Architect

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Roger Butenuth

Datenbankoperationen in Mule 4 optimieren

Häufig geht es in Mule-Projekten darum, Daten aus irgendeiner Quelle effizient in einer Datenbank abzulegen. Heute zeige ich, mit welchen Strategien man dabei die Performance optimieren kann. Aufgabenstellung Da es hier primär um Datenbankoperationen...

APM
Integration

10.2.2021 | 8 Minuten Lesezeit

Roger Butenuth

Synchroner Batch mit Mule 4

Während in Mule 3 der Batch noch eine eigenständige Komponente war und Batches sich in der Konfiguration auf der gleichen Ebene wie Flows befanden, ist der Batch in Mule 4 zu einem sogenannten Scope geworden, der jetzt innerhalb eines Flows lebt. Auf...

Java
APM
JavaScript
Integration

28.1.2020 | 5 Minuten Lesezeit

Roger Butenuth

Mule: Streaming mit DataWeave

Mule legt den Datentyp für die Payload einer Nachricht nicht fest. Genauer als Object will es das Maultier nicht wissen. Häufig sind es PoJos, XML oder JSON. Da die letzten beiden nur strukturierter Text sind, müssen sie irgendwie abgelegt werden. Das...

Data
Integration
Streaming

9.9.2018 | 8 Minuten Lesezeit

Roger Butenuth

Transaktionen in Mule

Integrationsplattform und Transaktionen: Klingt nach einer gefährlichen, komplexen Kombination. Hat man dort nicht einen Zoo verschiedener Technologien, die von transaktionslos bis XA-Transaktionen alles bieten? Ich stelle heute einige Patterns vor, ...

6.2.2017 | 19 Minuten Lesezeit

Roger Butenuth

Von Mule nach Java und zurück

Da Mule weitgehend aus Java besteht, überraschen die vielfältigen Kombinationsmöglichkeiten mit Java nicht. Einige bekannte – und weniger bekannte – Varianten stelle ich in den folgenden Abschnitten vor. Eine Kleinigkeit aber vorweg: Einige werden ...

Integration

30.11.2016 | 7 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 4): Mocks und Spies

Nach einem langen zweiten Teil und einer noch längeren Pause kommt heute ein kurzer Text über Mocks und Spies in MUnit Tests. Mocks machen das, was man aus JUnit kennt; was Spies machen, werden wir gleich sehen. Um es nicht zu kompliziert zu machen,...

Agilität
Integration

20.9.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 3): Tabellenbasierte Tests

Am Ende des zweiten Teils hatte ich schon den Begriff „tabellenbasierte Tests“ erwähnt. Was heißt das? Es geht darum, mehrere gleichartige Tests auszuführen, die sich nur durch Eingabe- und erwartete Ausgabedaten unterscheiden. Das Schöne an dieser...

29.5.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 1): Start im Anypoint Studio

Traditionell testet man Mule-Anwendungen mit JUnit, also Java-Code. Seit einiger Zeit bietet Mule zusätzlich MUnit an, das auch Tests als Flows realisiert. Außerdem hat das Anypoint Studio einige Wizards spendiert bekommen, mit denen sich Testfälle einfach...

26.4.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 2): Testdaten und Asserts

Im ersten Teil dieser Artikelserie hatte ich versprochen, einen SOAP-Service mit MUnit zu testen, also muss ich das wohl heute einlösen. SOAP ist dabei der Vorwand, die Versorgung mit Testdaten und die Überprüfung der Ergebnisse (assert) vorzuführen...

26.4.2016 | 8 Minuten Lesezeit

Roger Butenuth

Transformieren von Nachrichten mit Mule DataWeave – Teil 2: Bedingungen...

Nach der Einführung sollten die Grundlagen von DataWeave schon halbwegs bekannt sein. Heute geht es darum, wie man dynamisch steuern kann, was in den Zieldaten steht – quasi um das „if“ von DataWeave. Die Steuerungsdaten für die Bedingungen können dabei...

23.11.2015 | 3 Minuten Lesezeit

Roger Butenuth

Transformieren von Nachrichten mit Mule DataWeave – Teil 1: Einführung

MuleSoft hat mit Version 3.7 den DataMapper in Rente geschickt und durch DataWeave ersetzt. Was verbirgt sich dahinter? Mein erster Eindruck: semantisch eine Mischung aus SQL und Xslt, syntaktisch JavaScript. Ist das gelungen? Das soll jeder selbst beurteilen...

Data
Integration
Agile Transformation

16.9.2015 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Exceptions und Email

Es wäre schön, wenn immer alles funktioniert. Aber wie wir alle wissen: Jeder mögliche Fehler wird irgendwann auftreten. Früher musste man dafür seinen Code mit vielen if-Abfragen verunstalten, heute nutzt man Exceptions, die man dann in catch-Blöcken...

Integration

18.9.2013 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Steuerung und Kontrolle...

Ist der ESB erst mal produktiv, möchte man vielleicht wissen, was darin so alles vorgeht. Wie bei jedem Server richtet sich der Blick zuerst auf das Log-File. In einen Mule-Server kann man jedoch auch durch andere „Fenster“ hineinschauen: Die Mule Management...

Java

3.9.2013 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Performance und Threads

Ein ESB sitzt meistens nicht in einer langweiligen Ecke der Unternehmens-IT, sondern mitten drin. Da wo es wichtig ist. Da wo auch mal etwas mehr Last zu bewältigen ist. Da wo ein Ausfall oder Performance-Problem richtig weh tut. In diesem Artikel geht...

Java
Integration
APM

18.7.2013 | 9 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Transport, Connector, ...

Von der allgemeinen „warum überhaupt ESB Einführung“ abgesehen, hatten die bisherigen Teile des Tutorials Beispiel-Charakter, die Grundlagen sind etwas auf der Strecke geblieben. Es gibt also etwas nachzuholen… Wie praktisch jede andere größere Software...

Integration
Java

11.7.2013 | 12 Minuten Lesezeit

Roger Butenuth

Tutorial „Enterprise Service Bus mit Mule ESB“: Nachrichten mit Java transformieren

Im letzten Teil habe ich eine Java-Komponente vorgestellt, die auf Basis des Nachrichteninhalts Properties gesetzt hat, so dass die Nachrichten anschließend über einen Choice Router sortiert werden konnten. Jetzt wird wieder eine Java-Komponente im ...

18.1.2013 | 13 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: MuleMessage und Java-Komponenten

Im letzten Teil habe gezeigt, wie man im Mule Studio ein kleines Projekt anlegt. Die umgesetzte Funktionalität war jedoch einfach: Im Eingabeverzeichnis liegende Dateien wurden in das Ausgabeverzeichnis kopiert. Zusätzlich wurde für jede Datei eine ...

11.1.2013 | 9 Minuten Lesezeit

Roger Butenuth

Tutorial „Enterprise Service Bus mit Mule ESB“: Hello World/Bus!

Im ersten Teil habe ich eine allgemeine Einführung in das Thema ESB gegeben. Nach der vielen Theorie wird es nun Zeit für die Praxis. An einem kleinen Beispiel werde ich zeigen, dass ESB – zumindest von der technischen Seite her – überhaupt nicht so...

Integration

10.12.2012 | 7 Minuten Lesezeit

Roger Butenuth

Was ist ein ESB und wofür kann man ihn nutzen?

Was ist ein ESB? Ein abflauender Hype? Besser als jede Middleware zur Kopplung von IT-Systemen? Die Bezeichnung für sündhaft teure Produkte namhafter Anbieter? Eine hier neu startende Serie von Blog-Artikeln wird hoffentlich etwas Licht in das große ...

Softwarearchitektur
Integration

30.11.2012 | 13 Minuten Lesezeit

Roger Butenuth

Schon gewusst? JDK enthält serienmäßig JavaScript Shell

Wer arbeitet auf einem Mac oder Windows-Rechner und installiert seine Software anschließend auf einem Unix/Server? Wer braucht ab und zu eine Kommandozeile mit Ad-Hoc-Programmierung? Wer möchte nicht auf jedem System eine neue Shell-Sprache lernen? Wer...

Java
JavaScript
Softwareentwicklung

14.11.2012 | 5 Minuten Lesezeit

Roger Butenuth

Fork/Join and other Techniques to Improve Performance

In the last few years there has been nearly no improvement in single thread performance of CPUs. On the other hand, the number of cores increases: Laptops with eight cores are common (okay, including hyperthreading, only four real cores). Even modern...

Software development
JavaScript

2.11.2012 | 13 Minuten Lesezeit

Roger Butenuth

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Transformieren von Nachrichten mit Mule DataWeave – Teil 3: Schleifen und Gruppierungen

Flaches Remapping

Strukturelle Änderungen

Group By

Zusammenfassung

Links

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Datenbankoperationen in Mule 4 optimieren

Synchroner Batch mit Mule 4

Mule: Streaming mit DataWeave

Transaktionen in Mule

Von Mule nach Java und zurück

Mule-Anwendungen mit MUnit testen (Teil 4): Mocks und Spies

Mule-Anwendungen mit MUnit testen (Teil 3): Tabellenbasierte Tests

Mule-Anwendungen mit MUnit testen (Teil 1): Start im Anypoint Studio

Mule-Anwendungen mit MUnit testen (Teil 2): Testdaten und Asserts

Transformieren von Nachrichten mit Mule DataWeave – Teil 2: Bedingungen...

Transformieren von Nachrichten mit Mule DataWeave – Teil 1: Einführung

Tutorial “Enterprise Service Bus mit Mule ESB”: Exceptions und Email

Tutorial “Enterprise Service Bus mit Mule ESB”: Steuerung und Kontrolle...

Tutorial “Enterprise Service Bus mit Mule ESB”: Performance und Threads

Tutorial “Enterprise Service Bus mit Mule ESB”: Transport, Connector, ...

Tutorial „Enterprise Service Bus mit Mule ESB“: Nachrichten mit Java transformieren

Tutorial “Enterprise Service Bus mit Mule ESB”: MuleMessage und Java-Komponenten

Tutorial „Enterprise Service Bus mit Mule ESB“: Hello World/Bus!

Was ist ein ESB und wofür kann man ihn nutzen?

Schon gewusst? JDK enthält serienmäßig JavaScript Shell

Fork/Join and other Techniques to Improve Performance

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten