Mule: Streaming mit DataWeave

9.9.2018 | 8 Minuten Lesezeit

Mule legt den Datentyp für die Payload einer Nachricht nicht fest. Genauer als Object will es das Maultier nicht wissen. Häufig sind es PoJos, XML oder JSON. Da die letzten beiden nur strukturierter Text sind, müssen sie irgendwie abgelegt werden. Das geschieht entweder am Stück (String) oder über Streaming (InputStream). Die meisten Mule-Komponenten schlucken beide Varianten klaglos. Auch die in der Enterprise-Version vorhandene Transformationssprache DataWeave arbeitet serienmäßig mit beiden Varianten.

Für erfahrene Mule-Entwickler dürfte das alles nicht neu sein. Was jedoch weniger bekannt ist: Streaming funktioniert auch mit PoJos: Richtig konfiguriert kann DataWeave nicht nur eine List von Objekten erzeugen, sondern auch einen Iterator.

Vorher aber noch etwas einge Details zum Streaming von Texten. Für alte Hasen ist das quasi eine Wiederholung, für viele sind aber sicher noch einige Neuigkeiten dabei.

DataWeave Streaming mit XML, JSON und anderen Textformaten

Zieht man eine DataWeave-Transformation in den Flow und konfiguriert ein Textformat als Ausgabe (CSV, XML, JSON), so sieht man anschließend in der Payload einen java.io.InputStream (bzw. eine davon abgeleitete Klasse). Es sieht also so aus, als würde DataWeave seine Eingabe liegenlassen und erst mit der Arbeit anfangen, sobald der nächste Message Processor den Stream liest. Das stimmt jedoch nicht: Schaut man genauer hin, sieht man einen ByteArraySeekableStream. DataWeave verarbeitet seine Eingabe komplett und liefert anschließend eine Stream-Sicht auf das Ergebnis.

Aber halt: Heißt es nicht, dass durch Streaming Payloads größer als der Hauptspeicher möglich sind? Was passiert bei einer großen Eingabe – gibt es dann irgendwann eine OutOfMemoryException, weil das Byte-Array zu groß wird? Nein, Mule verwendet nur dann ein Byte-Array, wenn es nicht zu viele Daten sind. Ab der Größe von 1,5 MByte (genau: 1572864 Bytes) schaltet Mule auf einen RandomAccessFileSeekableStream um, also auf einen Stream, der über den Umweg eines Delegate auf eine Datei zeigt.

Mule kombiniert hier also die schnelle Lösung „Hauptspeicher“ mit der langsameren, aber sicheren Lösung „Dateisystem“. Wem die Grenze von 1,5 MByte nicht gefällt: Sie lässt sich ändern – über die System Property com.mulesoft.dw.buffersize. Damit gilt sie allerdings für den gesamten Server, nicht für einen einzelnen DataWeave. Alles gut? Nicht ganz: Die abstrakte Klasse InputStream enthält eine close()-Methode. Im Fall der Hauptspeicherlösung spielt sie keine große Rolle, hinter dem Byte-Array steckt nur ein Stück Speicher, um den sich auch ohne Aufruf von close() irgendwann der Garbage Collector kümmert.

Im Fall des RandomAccessFileSeekableStream ist es jedoch doppelt gefährlich: Wird hier kein close() aufgerufen, bleibt nicht nur das Datei-Handle auf Betriebssystem-Ebene geöffnet, sondern es bleibt auch die Datei auf der Platte liegen. Der Delegate-Mechanismus sorgt nämlich dafür, dass beim Aufruf von close() die Datei nicht nur geschlossen, sondern auch aus dem Dateisystem gelöscht wird.

Geschlossen?

Es stellt sich die Frage, wie es dazu kommen kann – schließlich ruft doch der nächste Message-Prozessor automatisch close() auf. Schneller als man denkt: Eventuell wird der Stream einige Schritte weitergereicht, bevor er verarbeitet wird. Tritt dann eine Exception auf, haben wir ein Problem. Oder es wird nach dem DataWeave noch eine Entscheidung per Choice-Router getroffen, und in einem der Zweige ist die Payload nicht interessant.

Es gibt mehrere Varianten, wie man sich hier ins Knie schießen kann. Dummerweise handelt es sich um ein Problem, das meistens erst in der Produktion auffällt: Wer testet schon mit großen Dateien? Und dann noch mit so vielen, dass die Platte vollläuft? Wer schaut nach Tests schon im Temp-Verzeichnis nach? Was hilft also? Nur Wissen um das Problem und Vorsicht: Im Zweifelsfall im Exception-Handler noch den Stream schließen. Generell ist es guter Stil, offene Streams nicht über viele Schritte weiterzureichen.

On Demand Streaming

Die bisher beschriebene Streaming-Variante funktioniert zwar mit beliebiger Nachrichtengröße bei begrenztem Hauptspeicher, dafür benötigt sie jedoch externen Speicher. Der ist zwar meistens größer, aber auch endlich und kann daher zum Engpass werden. Weiterhin ist sie nicht wirklich parallel: DataWeave verarbeitet die Eingangsdaten komplett, bevor der nächste Message Processor starten kann.

Wer echte Parallelität möchte, muss im XML mode="deferred" einstellen. DataWeave gibt in diesem Fall eine Instanz zurück, die das Interface OutputHandler implementiert. Es enthält nur eine Methode: void write(MuleEvent event, OutputStream out) throws IOException.

Was passiert hier? Wenn der DataWeave-Knoten durchlaufen wird, nicht viel: DataWeave liest sein Skript ein, macht ansonsten aber nichts. Erst beim Aufruf von write(...) aus dem OutputHandler läuft der Transformationscode los und schreibt sein Ergebnis in den Ausgabestrom, der ihm sozusagen nachträglich und von hinten zur Verfügung gestellt wird.

Aber Vorsicht: Nicht alle Komponenten setzen den OutputHandler so ein, wie man es sich wünscht. Wenn man Pech hat, wird die Payload doch noch im Speicher materialisiert. Im Zweifelsfall sollte man sich nicht darauf verlassen, sondern testen. Wichtig ist es dabei, nicht nur mit kleinen Nachrichten zu testen, sondern auch mit großen, die den Hauptspeicher sprengen. Besser im Test als nach dem Livegang…

Weitere Details zu dem Thema findet man in der MuleSoft-Dokumentation unter DataWeave memory management .

DataWeave mit Java

Der Schnipsel %output application/java im Header eines DataWeave-Skripts reicht aus, um Java-Objekte zu erzeugen. Ohne Angabe konkreter Java-Klassen (PoJos) erzeugt DataWeave eine generische Struktur aus Listen und Maps. So eine Struktur ist bei kleinen Datenmengen sehr effizient. Bei größeren hat sie jedoch das Potential, den Hauptspeicher zu sprengen. Abhilfe besteht darin, auch Java-Objekte zu streamen. Wie das funktioniert, werde ich in den folgenden Abschnitten zeigen.

Beispiel: Geodaten synchronisieren

Zuerst benötigen wir aber ein (mehr oder weniger konstruiertes) Beispiel: In JSON vorliegende Geodaten (eine Menge von Punkten) sollen an einen REST-Service gesendet werden. Quelle kann eine Datei oder der HTTP-Listener von einem Post-Request sein. Wichtig ist nur, dass die Quelle einen Stream in der Payload liefert.

Als Quellformat nutze ich GeoJSON , das man sich auch leicht auf einer Karte darstellen lassen kann (siehe geojson.io ). Eine Beispieldatei mit zwei Punkten auf der Weltkugel sieht folgendermaßen aus:

1{
2  "type": "FeatureCollection",
3  "features": [
4    {
5      "type": "Feature",
6      "properties": {
7        "marker-color": "#7e7e7e",
8        "marker-size": "medium",
9        "marker-symbol": "",
10        "name": "CC Headquarter"
11      },
12      "geometry": {
13        "type": "Point",
14        "coordinates": [
15          7.00702428817749,
16          51.16197720229481
17        ]
18      }
19    },
20    {
21      "type": "Feature",
22      "properties": {
23        "marker-color": "#7e7e7e",
24        "marker-size": "medium",
25        "marker-symbol": "",
26        "name": "MuleSoft Germany"
27      },
28      "geometry": {
29        "type": "Point",
30        "coordinates": [
31          6.9658,
32          50.9274
33        ]
34      }
35    }
36  ]
37}

Längen- und Breitengrad stehen in einem Array (ein optionales drittes Arrayelement steht für die Höhe), weitere Daten können die Darstellung auf der Karte steuern (Art des Markers, Farbe etc.).

Das Zielformat ist etwas einfacher gestrickt:

1{
2  "points": [
3    {
4      "latitude": 51.16197720229481,
5      "longitude": 7.00702428817749, 
6      "name": "CC Headquarter"
7    },
8    {
9      "latitude": 50.9274,
10      "longitude": 6.9658, 
11      "name": "MuleSoft Germany"
12    }    
13  ]
14}

Neben Längen- und Breitengrad wird hier zu jedem Punkt nur der Name gespeichert. Das Skript zur Umwandlung der beiden Formate ist recht einfach:


%dw 1.0
%output application/json
---
{ 
  points: payload.features map ((feature , indexOfFeature) -> {
    name: feature.properties.name,
    latitude:  feature.geometry.coordinates[1],
    longitude: feature.geometry.coordinates[0]
  })
}

Eigentlich eine typische Situation: Für ein fachliches Problem – Liste von Punkten auf unserer Weltkugel – existieren technisch leicht inkompatible Formate. Wenn wir die Daten aus einer Datei lesen (Streaming möglich) und über HTTP-Post beim Zielservice abliefern können (Streaming möglich), dann haben wir unser Problem auch schon gelöst.

Na und? Wo ist das Problem?

Wo liegt also das Problem? Wie gesagt, wir konstruieren ein Beispiel: Nehmen wir an, dass die Post-Requests nicht beliebig groß werden dürfen. Oder wir ein Stück Java-Code eine Berechnung auf den Koordinaten ausführen lassen wollen. In beiden Fällen können wir nicht ein großes JSON (mit Streaming) erzeugen. Schalten wir das Ausgabeformat auf Java (durch %output application/java im Header), entsteht ein anderes Problem: DataWeave erzeugt eine Liste (genauer: java.util.ArrayList) von Objekten, die vollständig im Hauptspeicher landet.

DataWeave mit Iterator

Dabei existiert eine Streaming-Lösung in Java: der gute alte Iterator. Kann Mule das auch? Einfache Antwort: Ja, das geht. Auch wenn es in der Dokumentation anscheinend vergessen wurde. Einfach im DataWeave ein as :iterator anhängen, Beispiel:


%dw 1.0
%output application/java
---
(payload.features map ((feature , indexOfFeature) -> {
  name: feature.properties.name,
  latitude:  feature.geometry.coordinates[1],
  longitude: feature.geometry.coordinates[0]
})) as :iterator

Meist – wie hier – ist es dabei noch notwendig, den Ausdruck vor as :iterator in runde Klammern einzurahmen.

Mit diesem Code erhalten wir nicht mehr eine Liste, sondern einen java.util.Iterator, der sich als Eingabe in einen „For Each“ oder „Batch“ von Mule eignet.

Wenn wir die so erhaltenen Datensätze einzeln an einen Webservice übergeben, haben wir den Teufel „Speicherverschwendung“ jedoch mit dem Beelzebub „viele kleine Aufrufe“ ausgetrieben: Es ist einfach nicht effizient, jeden Datensatz einzeln per HTTP-Post an einen Service zu übergeben.

Gruppierung

Zwischen „alle Punkte auf einmal“ und „jeden Punkt einzeln“ existiert noch die goldene Mitte: „Gruppe von Punkten“. Auch das funktioniert einfach: In „For Each“ das Attribut batchSize setzen. Innerhalb der Schleife verarbeitet der Flow dann nicht mehr einzelne Datensätze, sondern jeweils eine Liste der Größe batchSize (oder kleiner, wenn das Ende der Quelle erreicht ist).

Ein Flow könnte damit folgende Elemente enthalten:

Eine Datenquelle (HTTP-listener, File-listener, etc.)
Ein DataWeave mit einem Iterator als Ergebnis
Ein „For Each“ mit batchSize größer 1
In der Schleife:

Ein DataWeave, der aus der Liste von Punkten ein JSON-Dokument erzeugt
Ein Post an den externen REST-Service

Oder als Bild:

Zusammenfassung und Ausblick

Streaming ist ein mächtiges Werkzeug. Nur damit ist es möglich, Datenmengen jenseits der Hauptspeichergröße verarbeiten zu können. Mule arbeitet an vielen Stellen automatisch mit Streams, so dass man sich als Entwickler nicht darum kümmern muss. Leider nicht an allen Stellen und auch nicht ohne Tücken: Ein vergessenes close() hat unter Umständen fatale Folgen in der Produktion.

In diesem Blogpost haben wir drei Arten von Streaming mit DataWeave kennengelernt:

DataWeave Default mit Textformat (z. B. JSON) als Ausgabe. Hier haben wir zwar einen Stream, aber trotzdem eine rein sequentielle Verarbeitung: erst DataWeave komplett, dann der nächste Message Processor. Mule kümmert sich nur darum, dass größere Datenmengen auf der Platte gepuffert werden.
DataWeave im Modus „deferred“: Hier läuft die Transformation erst in dem Moment los, in dem eine Senke zur Verfügung steht. Damit ist auch Parallelität zwischen mehreren Message Processors möglich.
DataWeave mit einem Iterator als Ausgabe. Auch hier brauchen wir nicht die Platte, und es ist echte Parallelität möglich. Außerdem kann man mit einem for-each hinter dem DataWeave bequem gruppieren.

Mit Mule 4 hat sich das Streaming übrigens grundsätzlich geändert: Dort kann man zum Beispiel einen Stream auch mehrfach lesen. Aber das ist einen eigenen Blogpost wert.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Roger Butenuth

Senior Integration Architect

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Roger Butenuth

Datenbankoperationen in Mule 4 optimieren

Häufig geht es in Mule-Projekten darum, Daten aus irgendeiner Quelle effizient in einer Datenbank abzulegen. Heute zeige ich, mit welchen Strategien man dabei die Performance optimieren kann. Aufgabenstellung Da es hier primär um Datenbankoperationen...

APM
Integration

10.2.2021 | 8 Minuten Lesezeit

Roger Butenuth

Synchroner Batch mit Mule 4

Während in Mule 3 der Batch noch eine eigenständige Komponente war und Batches sich in der Konfiguration auf der gleichen Ebene wie Flows befanden, ist der Batch in Mule 4 zu einem sogenannten Scope geworden, der jetzt innerhalb eines Flows lebt. Auf...

Java
APM
JavaScript
Integration

28.1.2020 | 5 Minuten Lesezeit

Roger Butenuth

Transaktionen in Mule

Integrationsplattform und Transaktionen: Klingt nach einer gefährlichen, komplexen Kombination. Hat man dort nicht einen Zoo verschiedener Technologien, die von transaktionslos bis XA-Transaktionen alles bieten? Ich stelle heute einige Patterns vor, ...

6.2.2017 | 19 Minuten Lesezeit

Roger Butenuth

Von Mule nach Java und zurück

Da Mule weitgehend aus Java besteht, überraschen die vielfältigen Kombinationsmöglichkeiten mit Java nicht. Einige bekannte – und weniger bekannte – Varianten stelle ich in den folgenden Abschnitten vor. Eine Kleinigkeit aber vorweg: Einige werden ...

Integration

30.11.2016 | 7 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 4): Mocks und Spies

Nach einem langen zweiten Teil und einer noch längeren Pause kommt heute ein kurzer Text über Mocks und Spies in MUnit Tests. Mocks machen das, was man aus JUnit kennt; was Spies machen, werden wir gleich sehen. Um es nicht zu kompliziert zu machen,...

Agilität
Integration

20.9.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 3): Tabellenbasierte Tests

Am Ende des zweiten Teils hatte ich schon den Begriff „tabellenbasierte Tests“ erwähnt. Was heißt das? Es geht darum, mehrere gleichartige Tests auszuführen, die sich nur durch Eingabe- und erwartete Ausgabedaten unterscheiden. Das Schöne an dieser...

29.5.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 1): Start im Anypoint Studio

Traditionell testet man Mule-Anwendungen mit JUnit, also Java-Code. Seit einiger Zeit bietet Mule zusätzlich MUnit an, das auch Tests als Flows realisiert. Außerdem hat das Anypoint Studio einige Wizards spendiert bekommen, mit denen sich Testfälle einfach...

26.4.2016 | 6 Minuten Lesezeit

Roger Butenuth

Mule-Anwendungen mit MUnit testen (Teil 2): Testdaten und Asserts

Im ersten Teil dieser Artikelserie hatte ich versprochen, einen SOAP-Service mit MUnit zu testen, also muss ich das wohl heute einlösen. SOAP ist dabei der Vorwand, die Versorgung mit Testdaten und die Überprüfung der Ergebnisse (assert) vorzuführen...

26.4.2016 | 8 Minuten Lesezeit

Roger Butenuth

Transformieren von Nachrichten mit Mule DataWeave – Teil 3: Schleifen ...

In den ersten beiden Teilen dieser Serie habe ich bereits Collections – und damit implizit – Schleifen verwendet. In diesem Beitrag werde ich das Thema vertiefen und dabei genauer auf das Mapping mit Lambdas eingehen. Zum Abschluss werde ich Gruppierungsfunktionen...

8.1.2016 | 5 Minuten Lesezeit

Roger Butenuth

Transformieren von Nachrichten mit Mule DataWeave – Teil 2: Bedingungen...

Nach der Einführung sollten die Grundlagen von DataWeave schon halbwegs bekannt sein. Heute geht es darum, wie man dynamisch steuern kann, was in den Zieldaten steht – quasi um das „if“ von DataWeave. Die Steuerungsdaten für die Bedingungen können dabei...

23.11.2015 | 3 Minuten Lesezeit

Roger Butenuth

Transformieren von Nachrichten mit Mule DataWeave – Teil 1: Einführung

MuleSoft hat mit Version 3.7 den DataMapper in Rente geschickt und durch DataWeave ersetzt. Was verbirgt sich dahinter? Mein erster Eindruck: semantisch eine Mischung aus SQL und Xslt, syntaktisch JavaScript. Ist das gelungen? Das soll jeder selbst beurteilen...

Data
Integration
Agile Transformation

16.9.2015 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Exceptions und Email

Es wäre schön, wenn immer alles funktioniert. Aber wie wir alle wissen: Jeder mögliche Fehler wird irgendwann auftreten. Früher musste man dafür seinen Code mit vielen if-Abfragen verunstalten, heute nutzt man Exceptions, die man dann in catch-Blöcken...

Integration

18.9.2013 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Steuerung und Kontrolle...

Ist der ESB erst mal produktiv, möchte man vielleicht wissen, was darin so alles vorgeht. Wie bei jedem Server richtet sich der Blick zuerst auf das Log-File. In einen Mule-Server kann man jedoch auch durch andere „Fenster“ hineinschauen: Die Mule Management...

Java

3.9.2013 | 7 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Performance und Threads

Ein ESB sitzt meistens nicht in einer langweiligen Ecke der Unternehmens-IT, sondern mitten drin. Da wo es wichtig ist. Da wo auch mal etwas mehr Last zu bewältigen ist. Da wo ein Ausfall oder Performance-Problem richtig weh tut. In diesem Artikel geht...

Java
Integration
APM

18.7.2013 | 9 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: Transport, Connector, ...

Von der allgemeinen „warum überhaupt ESB Einführung“ abgesehen, hatten die bisherigen Teile des Tutorials Beispiel-Charakter, die Grundlagen sind etwas auf der Strecke geblieben. Es gibt also etwas nachzuholen… Wie praktisch jede andere größere Software...

Integration
Java

11.7.2013 | 12 Minuten Lesezeit

Roger Butenuth

Tutorial „Enterprise Service Bus mit Mule ESB“: Nachrichten mit Java transformieren

Im letzten Teil habe ich eine Java-Komponente vorgestellt, die auf Basis des Nachrichteninhalts Properties gesetzt hat, so dass die Nachrichten anschließend über einen Choice Router sortiert werden konnten. Jetzt wird wieder eine Java-Komponente im ...

18.1.2013 | 13 Minuten Lesezeit

Roger Butenuth

Tutorial “Enterprise Service Bus mit Mule ESB”: MuleMessage und Java-Komponenten

Im letzten Teil habe gezeigt, wie man im Mule Studio ein kleines Projekt anlegt. Die umgesetzte Funktionalität war jedoch einfach: Im Eingabeverzeichnis liegende Dateien wurden in das Ausgabeverzeichnis kopiert. Zusätzlich wurde für jede Datei eine ...

11.1.2013 | 9 Minuten Lesezeit

Roger Butenuth

Tutorial „Enterprise Service Bus mit Mule ESB“: Hello World/Bus!

Im ersten Teil habe ich eine allgemeine Einführung in das Thema ESB gegeben. Nach der vielen Theorie wird es nun Zeit für die Praxis. An einem kleinen Beispiel werde ich zeigen, dass ESB – zumindest von der technischen Seite her – überhaupt nicht so...

Integration

10.12.2012 | 7 Minuten Lesezeit

Roger Butenuth

Was ist ein ESB und wofür kann man ihn nutzen?

Was ist ein ESB? Ein abflauender Hype? Besser als jede Middleware zur Kopplung von IT-Systemen? Die Bezeichnung für sündhaft teure Produkte namhafter Anbieter? Eine hier neu startende Serie von Blog-Artikeln wird hoffentlich etwas Licht in das große ...

Softwarearchitektur
Integration

30.11.2012 | 13 Minuten Lesezeit

Roger Butenuth

Schon gewusst? JDK enthält serienmäßig JavaScript Shell

Wer arbeitet auf einem Mac oder Windows-Rechner und installiert seine Software anschließend auf einem Unix/Server? Wer braucht ab und zu eine Kommandozeile mit Ad-Hoc-Programmierung? Wer möchte nicht auf jedem System eine neue Shell-Sprache lernen? Wer...

Java
JavaScript
Softwareentwicklung

14.11.2012 | 5 Minuten Lesezeit

Roger Butenuth

Fork/Join and other Techniques to Improve Performance

In the last few years there has been nearly no improvement in single thread performance of CPUs. On the other hand, the number of cores increases: Laptops with eight cores are common (okay, including hyperthreading, only four real cores). Even modern...

Software development
JavaScript

2.11.2012 | 13 Minuten Lesezeit

Roger Butenuth

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Seit einiger Zeit steht der Anypoint Code Builder (ACB) in der General-Availability-Version zur Verfügung. Ein Grund, sich einige Features der lang ersehnten Ablösung des Anypoint Studios einmal anzusehen. Schließlich warten ich und viele meiner Kollegen...

Integration
Softwareentwicklung
Programmiersprache

19.3.2024 | 8 Minuten Lesezeit

Pasquale Brunelli

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Datenbanken testen mit Testcontainers in Mule4

Hier erfährst du die Möglichkeiten Testcontainers in Mule4 zu nutzen, um deine Datenbankaufrufe zu testen. Vor einiger Zeit hat mein Kollege Christian Langmann eine Blogartikelserie veröffentlicht, in welcher er aufzeigt, wie man in Mule3 Munit-Tests...

Community
Softwareentwicklung
Testing
API
Open Source
Datenbank
Container
Integration

19.1.2024 | 3 Minuten Lesezeit

Benjamin Lüdicke

Mulesoft Meetup v8 – Loops, Container und Pizza

Bereits zum achten Mal fand sich am 28. November unsere Mulesoft Meetup Community zu einem gemeinsamen Abend in Solingen zusammen. Neben alteingesessenen Mule-Meetup-Enthusiasten konnten wir uns auch dieses Mal wieder über neue Gesichter in unserer Runde...

Community
API
Integration

14.12.2023 | 3 Minuten Lesezeit

Pasquale Brunelli

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Erfahre, wie du mit dem Tool Mule Flow Landscape den Überblick über alle Mule Flows und deren Abhängigkeiten behältst. Die Integrationsplattform Mule ermöglicht es uns, Integrationen mittels einer Low-Code-Entwicklungsplattform umzusetzen. Die Bausteine...

Softwareentwicklung
API
Open Source
Dokumentation
Integration

13.8.2023 | 3 Minuten Lesezeit

Benjamin Lüdicke

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

Mule 4: Test-Parametrisierung – ein Flow für viele Fälle

Immer wieder entdecke ich bei Code-Reviews, dass für verschiedene Testfälle, die sich prinzipiell nur durch die Ein- und Ausgabedaten unterscheiden, eine Vielzahl von MUnit-Tests angelegt werden. Diese Flows werden dann mühselig kopiert, um jeden Testfall...

Integration
API
Testing

16.2.2023 | 5 Minuten Lesezeit

Pasquale Brunelli

MuleSoft DataWeave Libraries – Teilen leicht gemacht

Mit Anypoint Exchange bietet Mulesoft bereits seit langer Zeit die Möglichkeit, verschiedene Assets wie zum Beispiel Konnektoren oder APIs mit anderen zu teilen.Was bisher gefehlt hat, war jedoch die Möglichkeit, DataWeave-Code bereitstellen zu können...

Softwareentwicklung
API
Integration

3.10.2022 | 7 Minuten Lesezeit

Pasquale Brunelli

Streaming Wikipedia mit Apache Kafka

Apache Kafka ist in aller Munde und entwickelt sich im Kontext von verteilten Systemen zum De-facto-Standard als Plattform für Event Streaming. Im Rahmen unserer OffProject Time (Weiterbildungszeit) haben wir uns die Plattform auch näher angeschaut und...

Kotlin
Data
Java
Messaging
Spring

15.8.2022 | 10 Minuten Lesezeit

Christoph Metzger

Felix Rieß

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

In diesem Artikel möchte ich euch mit einem Python Jupyter Notebook zeigen, wie ihr Anwendungsfälle der Tourenoptimierung inklusive Nebenbedingungen lösen und visualisieren könnt. Außerdem zeige ich euch, wie ihr mit OpenStreetMaps die Route zwischen...

Data

21.6.2022 | 7 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

In diesem Artikel möchte ich euch zeigen, wie ihr Probleme der Tourenoptimierung in einem Python Jupyter Notebook lösen und visualisieren könnt. Am Beispiel eines Fahrradkurierdienst zeige ich außerdem, wie das Grundproblem um gängige Nebenbedingungen...

Data

16.6.2022 | 9 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung (1/3)

In vielen Unternehmen fallen täglich verschiedene Transportprozesse an. Klassische Beispiele sind die Optimierung von Warenein- und ausgängen, die Einsatzplanung von Servicetechnikern oder die optimale Reihenfolge der Auslieferung bei Lieferdiensten....

Data

12.6.2022 | 8 Minuten Lesezeit

Lukas Heidemann

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Die Qualität bzw. Nützlichkeit von Machine-Learning-Modellen lässt sich mit Hilfe von Testdaten und Metriken bewerten. Allerdings in welchem Umfang? Manuell, automatisiert, einmalig, regelmäßig? Manuell lassen sich die ersten Modelle als Ergebnis eines...

Data
Machine Learning
Softwareentwicklung
CI/CD

7.12.2021 | 7 Minuten Lesezeit

Berthold Schulte

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Machine Learning (ML) kann nur durch Modelle in der Produktion Business Value erzeugen. Allerdings kann die Zeitspanne zwischen der Entwicklung der nächsten Iteration eines Modells und dessen Einsatz in einer Produktionsumgebung massiv sein. Dies gilt...

Accelerate
Cloud
Data
Google Cloud
Machine Learning

26.7.2021 | 11 Minuten Lesezeit

Niklas Haas

Timo Böhm

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Heutzutage steht fast alles, was mit den Labels „künstliche Intelligenz (KI)“ oder „Machine Learning (ML)“ versehen ist, für Fortschritt. Seltsamerweise schließt diese Assoziation jedoch häufig die Themen Daten und Dateninfrastruktur nicht ausreichend...

Kultur
Data
Machine Learning

21.6.2021 | 12 Minuten Lesezeit

Marcel Mikl

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Datenbankoperationen in Mule 4 optimieren

Häufig geht es in Mule-Projekten darum, Daten aus irgendeiner Quelle effizient in einer Datenbank abzulegen. Heute zeige ich, mit welchen Strategien man dabei die Performance optimieren kann.AufgabenstellungDa es hier primär um Datenbankoperationen geht...

APM
Integration

10.2.2021 | 8 Minuten Lesezeit

Roger Butenuth

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Mule: Streaming mit DataWeave

DataWeave Streaming mit XML, JSON und anderen Textformaten

Geschlossen?

On Demand Streaming

DataWeave mit Java

Beispiel: Geodaten synchronisieren

Na und? Wo ist das Problem?

DataWeave mit Iterator

Gruppierung

Zusammenfassung und Ausblick

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Datenbankoperationen in Mule 4 optimieren

Synchroner Batch mit Mule 4

Transaktionen in Mule

Von Mule nach Java und zurück

Mule-Anwendungen mit MUnit testen (Teil 4): Mocks und Spies

Mule-Anwendungen mit MUnit testen (Teil 3): Tabellenbasierte Tests

Mule-Anwendungen mit MUnit testen (Teil 1): Start im Anypoint Studio

Mule-Anwendungen mit MUnit testen (Teil 2): Testdaten und Asserts

Transformieren von Nachrichten mit Mule DataWeave – Teil 3: Schleifen ...

Transformieren von Nachrichten mit Mule DataWeave – Teil 2: Bedingungen...

Transformieren von Nachrichten mit Mule DataWeave – Teil 1: Einführung

Tutorial “Enterprise Service Bus mit Mule ESB”: Exceptions und Email

Tutorial “Enterprise Service Bus mit Mule ESB”: Steuerung und Kontrolle...

Tutorial “Enterprise Service Bus mit Mule ESB”: Performance und Threads

Tutorial “Enterprise Service Bus mit Mule ESB”: Transport, Connector, ...

Tutorial „Enterprise Service Bus mit Mule ESB“: Nachrichten mit Java transformieren

Tutorial “Enterprise Service Bus mit Mule ESB”: MuleMessage und Java-Komponenten

Tutorial „Enterprise Service Bus mit Mule ESB“: Hello World/Bus!

Was ist ein ESB und wofür kann man ihn nutzen?

Schon gewusst? JDK enthält serienmäßig JavaScript Shell

Fork/Join and other Techniques to Improve Performance

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Green Cloud: Daten und Emissionen sparen

Charge your APIs Volume 23: REST vs. gRPC

Datenbanken testen mit Testcontainers in Mule4

Mulesoft Meetup v8 – Loops, Container und Pizza

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Bessere SQL-Datenpipelines mit dbt

Mule 4: Test-Parametrisierung – ein Flow für viele Fälle

MuleSoft DataWeave Libraries – Teilen leicht gemacht

Streaming Wikipedia mit Apache Kafka

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

Einführung in die Welt der Tourenoptimierung (1/3)

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Schnelles Training eines Recommendation-Modells durch BigQuery ML

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Datenbankoperationen in Mule 4 optimieren

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten