Implementieren einer Sprache in JavaScript – Teil 1: Grundlagen

19.2.2019 | 4 Minuten Lesezeit

Möchte man Sprachen wie bspw. YAML, SQL oder XML in JavaScript interpretieren, existiert eine Vielzahl an Bibliotheken, die hierfür herangezogen werden können. Doch was, wenn dies für eine Sprache noch nicht der Fall ist? Wie wird eine Sprache definiert und wie kann man diese von einer Maschine ausführen lassen?

Im Rahmen dieses zweiteiligen Blog-Beitrages werden diese Fragen anhand der Object Constraint Language (OCL) beispielhaft geklärt. Da die OCL ein sehr breites Funktionsspektrum aufweist, wird nur ein kleiner Teil aufgegriffen. Anhand dieses Ausschnittes werden die grundlegenden Werkzeuge und Begriffe zur Definition einer Sprache vorgestellt und erklärt. Im zweiten Teil des Blog-Beitrages wird dann eine konkrete Implementierung eines Parsers mit Hilfe des Parser-Generators Jison beschrieben.

Die Object Constraint Language (OCL)

Die OCL ist eine Sprache, die maßgeblich im Rahmen der UML Anwendung findet. Sie erlaubt es, textuell definierte Regeln (Constraints) festzulegen, welche die Semantik eines UML-Modells präzisiert. So ist es bspw. mit Hilfe eines UML-Klassendiagramms recht einfach möglich, eine Eltern-Kind-Beziehung zu definieren: eine Klasse Person hat eine zyklische Assoziation auf sich selbst mit dem Namen childOf. Soll nun der Umstand berücksichtigt werden, dass eine Person nicht sein/ihr eigenes Elternteil sein kann, ist es nahezu unmöglich dies nur über Konzepte der UML allein darzustellen. Mit Hilfe der OCL hingegen ist dies ein Kinderspiel und kann über folgende Invariante erreicht werden:

context Person inv:
    self.children->forAll(c | c <> self)

Diese Invariante zeigt an, dass für jedes Element (forAll) der Liste children gelten muss, dass dies nicht auf das Objekt zeigen darf, welches die Liste selbst hält, da sonst eine zyklische Referenz entsteht.

Festlegen der Sprachfeatures

Die OCL erlaubt es also Abfragen auf Objekten auszuführen. Hierzu ist es notwendig, dass über die Felder eines Objekts navigiert werden kann, was durch eine Punktnotation realisiert wird. Es kann also via a.b auf den Wert des Feldes b des Objekts a (in beliebiger Tiefe) zugegriffen werden. Stellt a eine Liste von Objekten dar, wird durch den Aufruf von a.b eine neue Liste mit allen Werten des Feldes b (sofern vorhanden) der Objekte der Liste aus a zurückgegeben. Auch existieren Funktionen, die auf dem Ergebnis einer Abfrage ausgeführt werden können. Hierfür wird der Pfeil-Operator -> eingesetzt, gefolgt vom Namen der Funktion (bspw. forAll, min, max, select, u.v.m).

Folgendes Objekt dient als Beispiel zur Veranschaulichung der oben beschriebenen Abfrageregeln:

{
  field: “value”,
  listField: [
    { value: “a” },
    { value: “b” },
    { value: “c” }
  ],
  objectField: {
    value: “d”
  }
}

Werden die nun folgenden Abfragen (linke Spalte) auf dem obigen Objekt ausgeführt, ergeben sich die in der rechten Spalte angegebenen Ergebnisse:

Abfrage	Ergebnis
`self.field self.listField self.objectField.value self.listField.value`	`"value" [ { value: "a" }, { value: "b" }, { value: "c" } ] "d" ["a","b","c"]`

Formale Definition der Sprache

Kern dieses Blogartikels ist es, die oben skizzierten Features zur Abfrage von Objekten als Sprache zu implementieren. Hierfür ist eine formale Definition der Sprache unerlässlich. Die Definition untergliedert sich in die Bereiche Lexer und Parser, welche folgend näher beschrieben werden.

Lexer

Aufgabe eines Lexers (auch Tokenizer) ist es, den textuell vorliegenden Programmcode in einzelne Teile (sog. Token) zu zerlegen. Hierfür müssen dem Lexer Regeln mitgegeben werden, welche die jeweiligen Token definieren und als solche für den Lexer greifbar gemacht werden. Für die beiden Operatoren . und -> ist dies simpel, da diese statische Konstrukte darstellen und analog unter den Token “.” bzw. “->” abgelegt werden. Auch die runden Klammern des Operationsaufrufs sind feste Konstrukte, die als solche jeweils ein Token darstellen.

Interessanter sind die Zugriffe auf Feld- oder Operationsnamen, da diese variabel sind. Die Namen unterliegen jedoch einem festen Muster und können daher mit Hilfe eines Regulären Ausdrucks erkannt und behandelt werden: [a-zA-Z_][a-zA-Z0-9_]*. Stößt der Lexer auf eine Zeichenkette die diesem Regulären Ausdruck entspricht, wird sie als Token “VARIABLE_NAME” erfasst.
Zudem wird der Lexer so konfiguriert, dass mehrfach auftretende Leer- oder ähnliche Zeichen (Tab, Zeilenumbruch) ignoriert werden. Ein besonderes Token ist das EOF-Token (End-of-File). Dieses wird später dazu verwendet, dem Parser anzuzeigen, dass mit keinem weiteren Ausdruck zu rechnen ist. Für die in diesem Blog-Beitrag vorgestellte Abfragesprache sehen die Lexer-Regeln daher wie folgt aus:


\s+                             { /* skip blanks, new line, etc. */ }
'.'                             { return '.'; }
'->'                            { return '->'; }
'('                             { return '('; }
')'                             { return ')'; }
[a-zA-Z_][a-zA-Z0-9_]*          { return 'VARIABLE_NAME'; }
<<EOF>>                         { return 'EOF'; }

Parser

Konnte der Lexer eine Abfrage in Token zerteilen, wird das Ergebnis an den Parser übergeben, der anhand einer gegebenen Grammatik die Token transformiert. Eine Grammatik lässt sich mathematisch definieren als G = (N,T,P,S), wobei N die Menge nichtterminaler Symbole (hier: e), T die Menge terminaler Symbole (die Token aus den Lexer-Regeln), P die Regeln der Grammatik und S das Startsymbol definiert (hier: e).

Gemäß dieser Vorgabe ergibt sich für die OCL folgende Grammatik:


N = {e}
T = {'.', '->', '(', ')', 'VARIABLE_NAME', 'EOF'}
P = e -> e 'EOF',
    e -> 'VARIABLE_NAME',
    e -> e '.' 'VARIABLE_NAME',
    e -> 'VARIABLE_NAME' '(' ')'
S = e

An dieser Stelle sind sowohl die Lexerregeln als auch die Grammatik definiert, sodass die Sprachdefinition vollständig ist. Der letzte, fehlende Schritt die Sprache ausführbar zu gestalten, ist das Erstellen eines Parsers. Natürlich kann ein Parser grundsätzlich manuell implementiert werden, jedoch zeigt die Erfahrung, dass mit wachsender Komplexität der Sprache auch die Komplexität des Parsers steigt und es sich daher anbietet, einen Parsergenerator zu verwenden. Hierfür wird im zweiten Teil des Blog-Beitrages die konkrete Umsetzung eines Parsers in JavaScript mit Hilfe der Bibliothek Jison vorgenommen.

War dieser Beitrag hilfreich?

Beitrag teilen

Gefällt mir

Blog-Autor*in

Stephan Köninger

IT Consultant & Developer

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Stephan Köninger

Angular 17 – Eine echte Renaissance?

Gefühlt war es lange still rund um das Frontend-Framework Angular. Echte Innovationen blieben aus und man konnte das Gefühl nicht loswerden, dass Vue.js und React mit all ihren Derivaten den Vorsprung zu Angular uneinholbar weit ausbauen. Doch mit Version...

Angular
Webdevelopment
Frontend
Framework

15.12.2023 | 8 Minuten Lesezeit

Stephan Köninger

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

Astro stellt sich als „All-in-one Web Framework“ vor, das „designed for speed“ ist. Große Versprechen wie „Pull your content from anywhere“, „Deploy everywhere“ und „Use whatever frontend library you want“ prangen offensiv auf der Startseite. Eine eierlegende...

Frontend
JavaScript
Webdevelopment
Framework
Softwareentwicklung

14.4.2023 | 4 Minuten Lesezeit

Stephan Köninger

Fotoverwaltung und Galerien – Teil 3: Automatisch erzeugte Fotogalerien

In diesem letzten Teil meiner Blogserie zum Thema Fotoverwaltung und Galerien wird es endlich etwas technischer. Nachdem ich beschrieben habe, wie ich meine Fotos verwalte und meine Fotogalerien manuell erzeuge , fehlt noch der letzte logische Schritt...

JavaScript
Ruby
Cloud

30.6.2020 | 7 Minuten Lesezeit

Stephan Köninger

Fotoverwaltung und Galerien – Teil 2: Statische Fotogalerien

Herzlich Willkommen zum zweiten Teil der Blogserie “Fotoverwaltung und Galerien”! Nachdem ich im ersten Teil meinen Weg hin zur Verwaltung meiner Fotos in einer NextCloud geschildert habe, möchte ich in diesem Teil darüber schreiben, wieso ich mich ...

JavaScript
Node.js
Webdevelopment

1.6.2020 | 4 Minuten Lesezeit

Stephan Köninger

Fotoverwaltung und Galerien – Teil 1: Fotoverwaltung

In dieser Blogserie, bestehend aus drei Teilen, soll es um meine digitalen Fotoverwaltung gehen und wie ich Fotogalerien erzeuge, die ich als statische Webseite veröffentlichen kann. Warum dieser Beitrag im Tech Blog der codecentric landet, liegt auf...

Cloud

3.5.2020 | 6 Minuten Lesezeit

Stephan Köninger

BPMN im Smart Home: Camunda und openHAB

Geschäftsprozessmodellierung und einhergehende Sprachen wie BPMN und DMN sind Begriffe, denen man normalerweise im beruflichen Umfeld begegnet und die im privaten Raum keine Rolle spielen. Natürlich kann man die Prozesse eines Haushalts (aka kleines,...

Java
BPM
Smart Home
IoT

6.4.2020 | 8 Minuten Lesezeit

Stephan Köninger

GitHub Actions – CI/CD auf kurzem Wege

Mit „Actions“ versucht GitHub in den Markt der CI/CD-Provider einzusteigen und will sich hier ein Stück des Kuchens abgreifen. GitHub Actions sind der nächste logische und vielleicht auch überfällige Schritt des Unternehmens, nicht nur Versionsverwaltung...

CI/CD
Softwareentwicklung
GitHub

26.9.2019 | 4 Minuten Lesezeit

Stephan Köninger

Camunda Business Process Management: DMN extended!

Camunda bietet mit seiner Business Process Management Suite eine leichtgewichtige Open-Source-Plattform zur Modellierung und Automatisierung von Geschäftsprozessen. Hierfür bieten die Macher nicht nur ein rudimentäres, leicht und intuitiv zu bedienendes...

Kotlin
Spring
BPM

15.8.2019 | 7 Minuten Lesezeit

Stephan Köninger

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Tutorial: Full Stack Web App in Rust

In diesem Artikel bauen wir gemeinsam eine kleine „Two-Tier“-Web-Anwendung – komplett mit Browser-Frontend und HTTP-Backend. Um den Tech Stack klein zu halten, verwenden wir dafür nur eine Programmiersprache: Rust. Warum das Ganze und warum ausgerechnet...

Softwareentwicklung
Rust
Frontend
Backend

5.4.2024 | 12 Minuten Lesezeit

Goetz Markgraf

Test Fixtures mit JUnit 5

Wir Softwareentwickler leben in einem ständigen Dilemma. Jede Funktionalität der Software sollte durch Unit-Tests und Integrationstest abgesichert werden. Es sollten dabei so viel Tests wie nötig, aber nur so wenige wie möglich geschrieben werden. Schreiben...

Java
Testing
Framework
Softwareentwicklung

25.3.2024 | 7 Minuten Lesezeit

Jens Kaiser

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Seit einiger Zeit steht der Anypoint Code Builder (ACB) in der General-Availability-Version zur Verfügung. Ein Grund, sich einige Features der lang ersehnten Ablösung des Anypoint Studios einmal anzusehen. Schließlich warten ich und viele meiner Kollegen...

Integration
Softwareentwicklung
Programmiersprache

19.3.2024 | 8 Minuten Lesezeit

Pasquale Brunelli

Wie als Software-Entwickler sichtbar werden?

Egal ob Junior, Medior oder Senior, introvertiert oder extrovertiert: Jeder Software-Entwickler kann seine Sichtbarkeit mit unterschiedlichen Werkzeugen erhöhen und sollte dem Thema eine gewisse Bedeutsamkeit beimessen. Die Frage dabei ist nur: wie und...

Weiterbildung
Softwareentwicklung
Community
Open Source

21.2.2024 | 6 Minuten Lesezeit

Edgar Klepek

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Datenbanken testen mit Testcontainers in Mule4

Hier erfährst du die Möglichkeiten Testcontainers in Mule4 zu nutzen, um deine Datenbankaufrufe zu testen. Vor einiger Zeit hat mein Kollege Christian Langmann eine Blogartikelserie veröffentlicht, in welcher er aufzeigt, wie man in Mule3 Munit-Tests...

Community
Softwareentwicklung
Testing
API
Open Source
Datenbank
Container
Integration

19.1.2024 | 3 Minuten Lesezeit

Benjamin Lüdicke

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Stellt man Projektbeteiligten die Frage, ob Qualität von Software wichtig ist, antwortet ein Großteil der Befragten vermutlich mit „Ja”. Jede andere Antwort würde sicherlich weitere, unangenehme Fragen aufkommen lassen. Aber was bedeutet Qualität im ...

Testing
Softwareentwicklung

18.10.2023 | 9 Minuten Lesezeit

Kevin Peters

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Erfahre, wie du mit dem Tool Mule Flow Landscape den Überblick über alle Mule Flows und deren Abhängigkeiten behältst. Die Integrationsplattform Mule ermöglicht es uns, Integrationen mittels einer Low-Code-Entwicklungsplattform umzusetzen. Die Bausteine...

Softwareentwicklung
API
Open Source
Dokumentation
Integration

13.8.2023 | 3 Minuten Lesezeit

Benjamin Lüdicke

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Nachdem wir in Teil 1 unserer kleinen Reihe zum AG-Grid-Framework gezeigt haben, wie man damit schnell interaktive Tabellen erstellt, geht es in diesem Beitrag darum, wie man die gleichen Daten auch in Grafiken (wie Balkendiagramme, Pie Charts oder Zeitserien...

React
Frontend
JavaScript
Framework
Softwareentwicklung

2.5.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Automatische Dependency-Updates mit Renovate

Bei der Softwareentwicklung ist es sinnvoll, bereits bestehende Funktionen wiederzuverwenden. Das spart Zeit und es wird unwahrscheinlicher, auf Probleme zu stoßen, die andere bereits gelöst haben. Funktionen können aus diesem Grund in Libraries gebündelt...

Softwareentwicklung
CI/CD

17.4.2023 | 6 Minuten Lesezeit

Alexander Backes

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

Frontend
JavaScript
Webdevelopment
Framework
Softwareentwicklung

14.4.2023 | 4 Minuten Lesezeit

Stephan Köninger

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

Victor Volle und Marc Bialowons geben Einblicke aus dem Review eines Platform-Engineering-Projekts in einem großen Unternehmen, das sich in diesem Bereich klar als Vorreiter herausstellte. Marco Paga hat mit ihnen gesprochen.Marco Paga: Victor, Marc,...

Platform Engineering
Softwareentwicklung

17.3.2023 | 13 Minuten Lesezeit

Marco Paga

Victor Volle

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Platform Engineering mit BackstageIm folgenden Interview berichten Marc Schnitzius und Pascal Sochacki von ihren ersten Erfahrungen mit Backstage als Platform-Engineering-Lösung.Marco Paga: Marc, Pascal, ihr habt eine Sicht auf Platform Engineering, ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

2.3.2023 | 12 Minuten Lesezeit

Marco Paga

Maximilian Mayer

Schöner arbeiten mit dem Quake Terminal

Das Terminal ist ein wesentlicher Bestandteil meiner täglichen Arbeit. Unzählige Male am Tag tippe ich dort Kommandos für die verschiedensten Zwecke ein. Dabei nervt es mich aber grundsätzlich, dass das Standardterminal sich meistens hinter anderen Fenstern...

Softwareentwicklung

28.2.2023 | 7 Minuten Lesezeit

Pasquale Brunelli

Modernes Data Fetching mit Redux Toolkit Query

Das vor sieben Jahren erstmals veröffentlichte Redux wurde bereits vor vier Jahren mit Redux Toolkit (RTK) modernisiert. Im Juni 2021 erreichte Redux dann die nächste Evolutionsstufe, indem mit Redux Toolkit Query eine dedizierte Data-Fetching-Lösung...

React
JavaScript
Frontend

28.2.2023 | 10 Minuten Lesezeit

Christoph Butschkau

Björn Böing

Threat Modeling 101 – Wie fange ich eigentlich an?

In einem früheren Blogpost haben wir bereits erklärt, wie wichtig Awareness im Bereich IT-Security im agilen Projekt ist. Ein Kernthema war das Threat Modeling. Doch wie genau funktioniert das? Wie bewerte ich, welche Bereiche meiner Applikation unter...

Agilität
IT-Security
Softwareentwicklung

27.2.2023 | 14 Minuten Lesezeit

Kevin Peters

„Platform Engineering ist eine Art von Knowledge Sharing“

Warum „Platform Engineering“ eigentlich der falsche Begriff ist und wie man den Golden Path findet, erklärt Daniel Kocot, Senior Solution Architect, im folgenden Interview.Marco Paga: Warum ist Platform Engineering interessant?Daniel Kocot: Ich habe ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

20.2.2023 | 11 Minuten Lesezeit

Daniel Kocot

Marco Paga

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Die heutige Datenflut hat Software und Frameworks, wie Tableau, D3 und viele andere, hervorgebracht, deren Aufgabe es ist, die Visualisierung von Daten zu verbessern. Doch trotz der teilweise sehr ausgefallenen Darstellungsformen ist manchmal die simple...

Framework
Frontend
JavaScript
React
Softwareentwicklung

17.2.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

„Kommunikation“ ist das Passwort für gute Projekte

Immer mehr Projekte, vor allem die in der Softwareindustrie, werden seit Corona in reiner Remote-Arbeit aufgesetzt. Während Corona hat man erkannt, dass dieses Setup viele Vorteile für Mitarbeiter, Unternehmen und deren Kunden bereithält, nicht zuletzt...

Collaboration
Softwareentwicklung
Agile

20.1.2023 | 23 Minuten Lesezeit

Jörg Riegel

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

Wir alle kennen es. Wir bekommen neuen Code und irgendwie macht der merkwürdige Sachen. Teilweise müssen wir Reverse Engineering betreiben. Wir wundern uns, warum eine Umgebungsvariable nicht korrekt gesetzt wird oder der Login schief geht. Bis wir merken...

Python
Softwareentwicklung
Softwarearchitektur

30.11.2022 | 7 Minuten Lesezeit

Robert Meißner

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Implementieren einer Sprache in JavaScript – Teil 1: Grundlagen

Die Object Constraint Language (OCL)

Festlegen der Sprachfeatures

Formale Definition der Sprache

Lexer

Parser

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

Angular 17 – Eine echte Renaissance?

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

Fotoverwaltung und Galerien – Teil 3: Automatisch erzeugte Fotogalerien

Fotoverwaltung und Galerien – Teil 2: Statische Fotogalerien

Fotoverwaltung und Galerien – Teil 1: Fotoverwaltung

BPMN im Smart Home: Camunda und openHAB

GitHub Actions – CI/CD auf kurzem Wege

Camunda Business Process Management: DMN extended!

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Tutorial: Full Stack Web App in Rust

Test Fixtures mit JUnit 5

Anypoint Code Builder – Ein erster Einblick (Desktop IDE)

Wie als Software-Entwickler sichtbar werden?

Charge your APIs Volume 23: REST vs. gRPC

Datenbanken testen mit Testcontainers in Mule4

Goldene Wasserhähne – Wie wichtig ist Qualität in der Softwareentwicklung...

Mule Flow Landscape: Abhängigkeiten zwischen Mule Flows sichtbar machen

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Automatische Dependency-Updates mit Renovate

Astro – Mit der Insellösung zur Lichtgeschwindigkeit

„Der enge Kontakt mit den Nutzern ist das beste Mittel gegen den Elfenbeinturm...

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Schöner arbeiten mit dem Quake Terminal

Modernes Data Fetching mit Redux Toolkit Query

Threat Modeling 101 – Wie fange ich eigentlich an?

„Platform Engineering ist eine Art von Knowledge Sharing“

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

„Kommunikation“ ist das Passwort für gute Projekte

Manches gehört zusammen, manches besser nicht - Konnaszenz in Python

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten