SPRACHE

Joins und Schema-Validierung mit MongoDB 3.2

7.12.2015 | 3 Minuten Lesezeit

Mit Version 3.2 der dokumentenorientierten NoSQL-Datenbank MongoDB werden u.a. zwei lange vermisste(?) Features eingeführt, auf die ich im Folgenden näher eingehen möchte.

Joins

Die logischen Namensräume, in denen man seine Dokumente ablegt, werden in MongoDB Collections genannt. Diese waren bislang völlig isoliert voneinander. Jeder Art von Query, Aggregation und auch MapReduce-Job operierte auf den Daten genau einer Collection.

Ab Version 3.2 kann nun im Aggregation Frameworks ein Art Fetch Join verwendet werden, um Dokumente aus anderen Collections mitzuladen. Nehmen wir an, wir haben folgendes Schema …

customers	orders
`{ _id: ObjectId(...), vorname: "...", nachname: "...", ... }`	`{ _id: ObjectId(...), customer_id: ObjectId(...), // Foreign Key zu customers total: ..., items: [ ... ], ... }`

… und wollen bei der Suche nach Kunden (customers) direkt seine Bestellungen (orders) abfragen. Dazu legen wir zunächst folgende Testdaten ein:

1db.customers.insert( {_id: "c1", vorname: "Tobias", nachname: "Trelle"} );
2db.orders.insert( {_id:"o1", customer_id:"c1", total: 11.50, items:[{desc: "Item 1"}, {desc: "Item 2"}]} );
3db.orders.insert( {_id:"o2", customer_id:"c1", total: 42.95, items:[{desc: "Item 2"}, {desc: "Item 3"}]} );

Den Join können wir nun mit einer neuen Pipeline-Operation $lookup des Aggregation Frameworks ausführen:

1db.customers.aggregate( [
2   {$match: {_id:"c1"}}, 
3   {$lookup: {
4       from: "orders", 
5       localField: "_id", 
6       foreignField: "customer_id", 
7       as: "orders"}
8   }
9] )

Als Ergebnis erhält man den Kunden samt seiner Bestellungen im ge-join-ten Feld
orders:

1{ 
2"_id" : "c1", 
3"vorname" : "Tobias", 
4"nachname" : "Trelle", 
5"orders" : [ 
6   { 
7   "_id" : "o1", 
8   "customer_id" : "c1", 
9   "total": 11.5, 
10   "items" : [ { "desc" : "Item 1" }, { "desc" : "Item 2" } ] 
11   }, 
12   { 
13   "_id" : "o2", 
14   "customer_id" : "c1", 
15   "total" : 42.95, 
16   "items" : [ { "desc" : "Item 2" }, { "desc" : "Item 3" } ] 
17   } 
18] 
19}

Zurzeit scheinen nur Joins über ein Feld pro Collection möglich zu sein, vielleicht ändert sich das auch noch in kommenden Versionen.

Schema-Validierung

Eine grundlegende Eigenschaft der Dokumentenorientierung war in MongoDB bislang die Schema-Freiheit, d.h. die Abwesenheit einer prüfenden Instanz beim Schreiben von Dokumenten, die bestimmte Schemata erzwingt. Konkret hieß dies, dass es weder Pflichtfeld- noch Typprüfungen auf Dokumenten gab.

Nun kann auf Ebene einer Collection ein sogenannter Validator definiert werden, der bei schreibenden Operationen Typ- und sogar inhaltliche Prüfungen ausführt:

1db.createCollection("customers", {
2   validator: { 
3      nachname: {$type: "string"}, 
4      alter: {$type: "int", $gte: 18 }
5   }
6})

Wir definieren bestimmte erwartete Typen für die Felder nachname und alter. Das macht diese auch direkt zu Pflichtfelder. Für das Feld alter definieren wir darüber hinaus noch die Einschränkung, dass der Wert >= 18 sein muss. Hier können nahezu alle Einschränkungen definiert werden, die auch bei der Formulierung von find-Queries verwendet werden dürfen. Ein invalides Dokument wird mit folgender Meldung abgewiesen:

1db.customers.insert({_id:"c2", nachname: "Trelle", alter: NumberInt(8)})
2WriteResult({
3        "nInserted" : 0,
4        "writeError" : {
5                "code" : 121,
6                "errmsg" : "Document failed validation"
7        }
8})

Erst ein Alter >= 18 führt in unserem Shop-System zum gewünschten Erfolg:

1db.customers.insert({_id:"c1", nachname: "Trelle", alter: NumberInt(25)})
2WriteResult({ "nInserted" : 1 })

Fazit

Mit den Fetch-Joins erhält man deutlich mehr Freiheit beim Schema-Design als bisher. Man ist nicht mehr so stark gezwungen, primär Query-orientiert zu planen und Daten redundant vorzuhalten. Natürlich sollte man auch jetzt im Einzelfall die Performance im Auge behalten. Joins werden auch in MongoDB nicht ohne Impact sein.

Die Schema-Validierung ist ein Feature, das die Verantwortung der Daten aus der Ebene der Applikation zurück in die Datenbank holt und somit zur (inhaltichen) Konsistenz des Datenbestandes beiträgt. Aber auch Validierung wird ein wenig Performance kosten, allerdings eher auf CPU-Ebene.

Mit diesen beiden Neuerungen macht MongoDB einen weiteren Schritt in Richtung Enterprise-Readiness. Ziel dürfte sein, weiter in Konkurrenz zu relationalen Systemen zu treten, die solche Features bereits seit Urzeiten anbieten. Man will endlich auch eine Allzweck-Datenbank werden. Ob das der Grundidee von NoSQL (nimm das passende Tool für Dein Problem) noch genügt, sein mal dahingestellt.

Alle Details und weitere neue Features können Sie den Release Notes für Version 3.2 entnehmen.

War dieser Beitrag hilfreich?

SPRACHE

Beitrag teilen

Gefällt mir

Blog-Autor*in

Tobias Trelle

Software Architect

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Tobias Trelle

ctop – manage and monitor your Docker containers

In this post, I’d like to introduce you to a nice command line tool called ctop. I discovered it when I was looking for a tool to monitor some Docker containers for a MongoDB replica set on my local machine while running some load tests. ctop is basically...

Container

17.12.2018 | 1 Minuten Lesezeit

Tobias Trelle

Leaflet und GeoJSON-Daten

Heute zeige ich euch, wie man mittels der JavaScript-Bibliothek Leaflet GeoJSON -Daten auf einer Karte in eigenen Anwendungen darstellen kann. Wie man dies mittels des Google Maps JavaScript API macht, habe ich in diesem Beitrag erklärt . Wir werden ...

Softwareentwicklung
JavaScript

11.6.2018 | 3 Minuten Lesezeit

Tobias Trelle

Google Cloud Function for Machine Learning

In this post I’ll show you how to use a Google Cloud Function to access the machine learning API for natural language processing . Cloud functions are one of the serverless features of the GCP. Please keep in mind that serverless does not mean that your...

Cloud
Google Cloud
Machine Learning

21.5.2018 | 5 Minuten Lesezeit

Tobias Trelle

Google Cloud Natural Language API

In this article I’d like to give you a short introduction to a subset of Google’s machine learning capabilities: the natural language API. This API processes text snippets and can apply several analysis algorithms: analyze-entities: detects entities ...

Cloud
Google Cloud
Machine Learning

6.5.2018 | 4 Minuten Lesezeit

Tobias Trelle

Google Maps API und GeoJSON-Daten

Heute zeige ich euch, wie man GeoJSON-Daten in eigenen Anwendungen in Zusammenhang mit Google Maps anzeigen kann. In meinem GeoJSON-Tutorial hatte ich kurz angesprochen, wie man GeoJSON-Daten mit Drittanbieter-Diensten darstellen kann. Zur Einbettung...

Softwareentwicklung
JavaScript
Google

15.4.2018 | 3 Minuten Lesezeit

Tobias Trelle

RESTful Microservices on the Google Cloud Platform

This tutorial shows you how to develop a RESTful microservice running on the Google Cloud Platform. I already explained how to deploy Spring Boot applications to the AppEngine and how to set up a MongoDB replica set in the Compute Engine . Today you...

Cloud
Google Cloud
Microservices
API
Spring

8.4.2018 | 3 Minuten Lesezeit

Tobias Trelle

GeoJSON Tutorial

In meinem Artikel über die Identifizierung potentieller EX-Raid Arenen in Pokémon GO habe ich das Thema GeoJSON nur kurz als Exkurs erwähnt. Heute möchte ich etwas detaillierter in dieses Thema einsteigen. GeoJSON Spezifikation Was genau sind denn überhaupt...

Data
Softwareentwicklung
JavaScript

19.3.2018 | 4 Minuten Lesezeit

Tobias Trelle

Cloud Launcher for MongoDB in the Google Compute Engine

In this post you will learn how to use Google’s Cloud Launcher to set up instances for a MongoDB replica set in the Google Compute Engine. Replication in MongoDB A minimal MongoDB replica set consists of two data bearing nodes and one so-called arbiter...

Cloud
Infrastructure as Code
Google
NoSQL

5.3.2018 | 3 Minuten Lesezeit

Tobias Trelle

Deploying Spring Boot Applications in the Google AppEngine Flex Environment

In this tutorial I will show how to set up a deployment of Spring Boot applications for the AppEngine Flex environment in the Google Cloud infrastructure. Prerequisites You should be familiar with the Spring Boot ecosystem and should be able to use Maven...

Software development
Cloud
Google
Google Cloud
Spring

13.2.2018 | 2 Minuten Lesezeit

Tobias Trelle

EX-Raid-Arenen in Pokémon GO identifizieren

Heute betreiben wir ein wenig Data Mining mit Geo-Daten, um herauszufinden, wie man potentielle EX-Raid Arenen im Augmented Reality -Spiel Pokémon GO identifizieren kann. Pokémon GO Basics In Pokémon GO geht es darum, möglichst viele der kleinen Pokémon...

Data
JavaScript
AR/VR

5.2.2018 | 5 Minuten Lesezeit

Tobias Trelle

Change Streams in MongoDB 3.6

MongoDB 3.6 introduces an interesting API enhancement called change streams. With change streams you can watch for changes to certain collections by means of the driver API. This feature replaces all the custom oplog watcher implementations out there...

Change Management
NoSQL

15.1.2018 | 2 Minuten Lesezeit

Tobias Trelle

Spring Cloud Service Discovery with Dynamic Metadata

Spring Cloud Service Discovery If you are running applications consisting of a lot of microservices depending on each other, you are probably using some kind of service registry. Spring Cloud offers a set of starters for interacting with the most common...

Cloud
Software architecture
Spring

8.1.2018 | 2 Minuten Lesezeit

Tobias Trelle

Lego WeDo 2.0 Programmierung

Den Lego WeDo 2.0 Bausatz habe ich in bereits in einem ersten Post vorgestellt . Im heutigen Beitrag möchte ich genauer auf dessen Programmierung eingehen. Meet Milo Zunächst muss aber erst mal Hardware her. Der Baukasten enthält (zum Glück, wie ich ...

Softwareentwicklung
Testing

18.10.2017 | 5 Minuten Lesezeit

Tobias Trelle

JUnit 5 – Des Kaisers neue Kleider

JUnit 5 ist im September 2017 in der ersten stabilen Version erschienen. In diesem Post möchte ich Euch die wichtigsten neuen Features vorstellen. Dabei gehe ich davon aus, dass der geneigte Leser mit JUnit 4 halbwegs vertraut ist und Vergleiche dann...

Java
Testing

1.10.2017 | 7 Minuten Lesezeit

Tobias Trelle

Unboxing Lego WeDo 2.0 Roboter Bausatz

In diesem und weiteren Posts möchte ich Euch das Lego WeDo 2.0 Set (45300) vorstellen. Es gehört zur Lego Education Linie und hat Kinder im Grundschulalter als Zielgruppe (und natürlich auch die zugehörigen AFOL s). Das Set wird in einem robusten stabelbaren...

Softwareentwicklung
Testing
Künstliche Intelligenz

27.9.2017 | 2 Minuten Lesezeit

Tobias Trelle

Graphen-Visualisierung mit Neo4j

In diesem Artikel möchte ich nach einer kurzen Einführung in die Graphen-Theorie einen Überblick über die NoSQL-Datenbank Neo4j geben. Insbesondere werde ich auf die Möglichkeiten eingehen, die Neo4j bei der Visualisierung von Graphen anbietet. Was ist...

Datenbank
NoSQL

18.6.2017 | 9 Minuten Lesezeit

Tobias Trelle

In love with Ada

Anyone out there remembering the Ada programming language? In this blog post, I’m going to give you a short introduction to Ada, the history of its name and some of the current occurrences in pop culture. Hello World in Ada To compile our first Ada program...

Software development
Raspberry Pi

10.4.2016 | 3 Minuten Lesezeit

Tobias Trelle

MongoDB-Einführung bei der Java-Usergruppe ruhrjug

Die Java-Enthusiasten im Ruhrgebiet treffen sich regelmäßig bei der ruhrjug , um sich über aktuelle Themen rund um die Programmiersprache Java auszutauschen. Beim letzten Treffen vor der Sommerpause am 25.06.2015 war ich eingeladen, um dort einen Vortrag...

Java
NoSQL
Community
Spring

1.7.2015 | 1 Minuten Lesezeit

Tobias Trelle

MongoDB 2.8 – Neue Storage-Engine WiredTiger

Mit Version 2.8 kommen wesentliche Neuerungen auf die Benutzer der NoSQL-Datenbank MongoDB zu. Eine davon ist die Einführung einer weiteren Storage Engine. Was es damit auf sich hat, werde ich in diesem Artikel erläutern. Bis zur Version 2.6 hat MongoDB...

Big Data
NoSQL

10.12.2014 | 4 Minuten Lesezeit

Tobias Trelle

MongoDB – Riesige Datenmengen schemafrei verwalten

MongoDB ist eine dokumentenorientierte NoSQL-Datenbank, die sich steigender Beliebtheit erfreut. In meinem Artikel MongoDB – Riesige Datenmengen schemafrei verwalten aus dem Java Magazin 5.14 gebe ich eine allgemeine kurze Einführung und erläutere die...

Datenbank
NoSQL

10.7.2014 | 1 Minuten Lesezeit

Tobias Trelle

MongoDB World 2014

For the very first time, the MongoDB community from all over the world gathered in one place. The MongoDB World conference 2014 took place in New York City from June 23rd to 25th. Talks The talks were separated into three topics: dev, ops & buisness...

Big Data
NoSQL
Community

6.7.2014 | 2 Minuten Lesezeit

Tobias Trelle

Test Automation for NoSQL Databases with NoSQL Unit and Travis-CI

Today I want to give you a short summary of my NoSQL matters talk on test automation for NoSQL databases . I basically introduce two tools that may help you with writing unit and integration tests for NoSQL databases: NoSQLUNit is a JUnit extension...

NoSQL
Testing
CI/CD

7.5.2014 | 1 Minuten Lesezeit

Tobias Trelle

Near-Realtime Analytics with MongoDB, Node.js & SmoothieCharts

In this blog post we’ll have a look at how easy it is to do some (near-)realtime analytics with your (big) data. I will use some well-known technologies like MongoDB and node.js and a lesser known JavaScript library called Smoothies Charts for realtime...

Big Data
Node.js

21.1.2014 | 4 Minuten Lesezeit

Tobias Trelle

MongoDB and Ruby

#MongoDB #Ruby I gave a lightning talk on the Ruby driver for MongoDB at the Cloud Developer Camp in Düsseldorf on last Saturday. Here are the slides: Click on the button to load the content from www.slideshare.net. Load content

NoSQL
Ruby

18.7.2013 | 1 Minuten Lesezeit

Tobias Trelle

MongoDB 2.4 Introduces Geospatial Indexing and Search for GeoJSON Geometries...

In case you are unfamiliar with the geospatial stuff, have a look at this introduction to geospatial indexing and searching with MongoDB . In version 2.4 MongoDB introduces support for a subset of GeoJSON geometries. These geometries can be used both...

JavaScript
Big Data
NoSQL

6.3.2013 | 3 Minuten Lesezeit

Tobias Trelle

OOP 2013: Praktische Einführung in MongoDB

Auf der OOP 2013 gab es von mir einen Vortrag zum Thema „Praktische Einführung in MongoDB“ Klicken Sie auf den unteren Button, um den Inhalt von de.slideshare.net zu laden. Inhalt laden Wer wollte, konnte sich MongoDB herunterladen und die Beispiele...

NoSQL
Community

1.2.2013 | 1 Minuten Lesezeit

Tobias Trelle

MongoDB Text Search Tutorial

In my introduction to text search in MongoDB , we had a look at the basic features. Today we’ll have a closer look at the details. API You may have noticed that a text search is not executed with a find() command. Instead you call db.foo.runCommand( ...

NoSQL
Search

10.1.2013 | 7 Minuten Lesezeit

Tobias Trelle

MongoDB Text Search Explained

The upcoming release 2.4 of MongoDB will include a first, experimental support for full text search (FTS). This feature was requested early in the history of MongoDB as you can see from this JIRA ticket: SERVER-380 . FTS is first available with the ...

NoSQL
Search
NLP

7.1.2013 | 5 Minuten Lesezeit

Tobias Trelle

Spring Batch and MongoDB

#springbatch #mongodb #nosql Spring Batch Spring Batch is a Spring-based framework for enterprise Java batch processing. An important aspect of Spring Batch is the separation between reading from and writing to resources and the processing of a single...

30.11.2012 | 5 Minuten Lesezeit

Tobias Trelle

Oliver Gierke on Spring Data and all the REST …

Today something completely different: I’ll interview Oliver Gierke from SpringSource . He we go … Tobias Trelle: Hi Oliver. Would you mind introducing yourself to listeners that might not already know you. Oliver Gierke: My name is Oliver Gierke. I ...

Data
Java
Community
Database
NoSQL
Spring

20.11.2012 | 10 Minuten Lesezeit

Tobias Trelle

Pessimistic Locking with MongoDB

In this article, I’m going to sketch a pattern for implementing pessimistic locking with MongoDB . MongoDB is a document-orientated NoSQL datastore that does not support locking itself. In some business processes it may be required that you have an ...

23.10.2012 | 3 Minuten Lesezeit

Tobias Trelle

GridFS Support in Spring Data MongoDB

MongoDB MongoDB is a highly scalable, document oriented NoSQL datastore from 10gen. For more information have a look at the MongoDB homepage: http://www.mongodb.org . A short introduction to MongoDB can be found at this blog post . GridFS In MongoDB ...

Cloud
Java
Infrastructure
NoSQL
Spring

26.7.2012 | 2 Minuten Lesezeit

Tobias Trelle

MonjaDB – A MongoDB GUI Client Tool

5.6.2012 | 1 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 6: Redis

Redis Redis [1] is a NoSQL [2] key/value datastore. Think of it as a big, very fast persistent hashmap. Redis offers a master/slave data replication [3] and also a built-in publish/subscribe messaging system [4]. It is implemented in C and can be built...

Java
Cloud
NoSQL
Spring

26.4.2012 | 4 Minuten Lesezeit

Tobias Trelle

MongoDB User-Gruppe Düsseldorf

MongoDB MongoDB ist eine hochskalierbare, Dokumenten-orientierte NoSQL -Datenbank des Herstellers 10gen. Mehr Details finden Sie auf der MongoDB-Homepage: http://www.mongodb.org . Eine kurze Einleitung, die die ersten Schritte mit MongoDB erklärt, findet...

Cloud
NoSQL

22.4.2012 | 1 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 4: Geospatial Queries with MongoDB

Introduction Every location-based service [1 ] has to solve the following problem: find all venues within a given distance from the current location of the user. Long before the advent of mobile devices, geographic information systems (GIS) [2 ] had ...

Cloud
NoSQL
Spring

15.3.2012 | 6 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 5: Neo4j

Introduction Neo4j [1 ] is a high-performance NoSQL [2 ] datastore specialized in persisting graphs. A graph [3 ] is data structure consisting of finite sets of vertices and edges, where an edge is a connection between two vertices. Graphs are used to...

Software architecture
Java
Cloud
NoSQL
Spring

27.2.2012 | 4 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 3: MongoDB

In this part of my blog series I’m going to show how easy it is to access a MongoDB datastore with Spring Data MongoDB. MongoDB MongoDB is a so called NoSQL datastore for document-oriented storage. A good place to start with MongoDB is the Developer...

Cloud
NoSQL
Spring

1.2.2012 | 5 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 2: JPA

What happened before? Part 1: Spring Data Commons Part 2: Spring Data JPA After looking at the Spring Data Commons project in the first part of this blog series, today I’m going to introduce you to the sub project Spring Data JPA . JPA Being a part ...

Java
Software development
Spring

21.1.2012 | 3 Minuten Lesezeit

Tobias Trelle

Spring Data – Part 1: Commons

One goal of the Spring Data project is to provide a common API for accessing both NoSQL datastores and relational databases. Spring Data serves as an umbrella project which offers general solutions – like pagination in large result sets – and consists...

Spring

21.12.2011 | 2 Minuten Lesezeit

Tobias Trelle

Testing and Mocking of Static Methods in Java

Again and again I stumble upon the myth that static code is evil because it is hard to test and you can’t mock it. Architects and lead developers are telling that tale and the juniors are picking it up and repeating it: “Static code is evil. It is hard...

BDD
Java
Testing
Software development
Test Driven Development

10.11.2011 | 4 Minuten Lesezeit

Tobias Trelle

Cloud Computing Basics: the CAP Theorem

Almost unlimited scalability is an essential facet of cloud computing as it is offered by the Google App Engine or CloudFoundry. Insuring this feature leads to a trade-off with other nonfunctional aspects from enterprise computing like consistency. But...

Database
Cloud

28.8.2011 | 4 Minuten Lesezeit

Tobias Trelle

Documenting Custom Robot Framework Keyword Libraries

Right now, I’m introducing the robot framework for automated web tests for one of our customers. Beside the basic robot framework, we are using the SeleniumLibrary and RIDE . This tool stack is going to be rolled out to all software development teams...

Testing

14.8.2011 | 2 Minuten Lesezeit

Tobias Trelle

Quo vadis VMware? vFabric vs. Cloud Foundry

Introduction We will start with an introdcution of VMware’s cloud solutions vFabric and Cloud Foundry. After that, the further evolution of these PaaS platforms will be discussed. vFabric VMware offers his PaaS cloud solution vFabric Cloud Application...

Spring
Cloud

6.6.2011 | 3 Minuten Lesezeit

Tobias Trelle

AMQP Messaging mit RabbitMQ und Spring

RabbitMQ ist als Messaging-System Teil der vFabric Cloud Application Platform. Die Unterstützung des performanten Messaging Protokolls AMQP prädestiniert RabbitMQ für den Einsatz in Hochverfügbarkeitsszenarien. RabbitMQ ist ein Open-Source-Produkt ...

Cloud
Java
Softwareentwicklung
Messaging
Spring

20.4.2011 | 4 Minuten Lesezeit

Tobias Trelle

WebSphereMQ Integration using Mule ESB Community Edition

Mule ESB is an open source implementation of an enterprise service bus. In contrast to the free Community Edition, Mule’s commercial Enterprise Edition provides integration of WebSphereMQ servers out of the box. This article explains how to integrate...

Software architecture
Integration

11.3.2011 | 1 Minuten Lesezeit

Tobias Trelle

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Wenn wir Erkenntnisse aus großen Datenmengen gewinnen wollen, bieten uns Cloud Service Provider inzwischen Lösungen an, dank derer wir uns kein Data Warehouse oder Hadoop-Cluster mehr in den Keller stellen müssen. AWS hat mit Athena, RedShift und EMR...

Cloud
Big Data
AWS
Serverless
GitLab

21.3.2023 | 16 Minuten Lesezeit

Maik Fleuter

Simple Deep Learning mit Amazon SageMaker

In unserem neuesten codecentric.AI-Video geben wir eine kurze Einführung in Amazon SageMaker und zeigen, wie man damit schnell und einfach ein Bildklassifikationsmodell trainieren kann, das Brillenträger von Nicht-Brillenträgern unterscheidet. Mit ...

Big Data
AWS
Cloud
Data
Machine Learning
Künstliche Intelligenz
Python

11.7.2018 | 5 Minuten Lesezeit

Shirin Elsinghorst

Oliver Moser

Schema First Design – Produktentwicklung mit GraphQL

Zu den schwierigsten Aufgaben bei der Entwicklung neuer Produkte gehören die Koordinierung der Teams, der Featureumfang und unbekannte Faktoren in Form der „moving parts“. Laut Definition müssen wir bestimmte laufende Prozesse berücksichtigen. Ein gutes...

API
Big Data

25.6.2018 | 7 Minuten Lesezeit

Toni Haupt

Deep Learning Workshop bei der codecentric AG in Solingen

Big Data – ein Schlagwort, das zur Zeit in aller Munde ist, egal ob in nerdigen Blogs, wissenschaftlichen Artikeln oder der Tageszeitung. Doch wie funktionieren Analysen von Big Data eigentlich? Um das heraus zu finden, habe ich an dem Workshop über ...

Big Data
Data
Künstliche Intelligenz
Machine Learning

6.2.2018 | 6 Minuten Lesezeit

Shirin Elsinghorst

BigchainDB – Das leichtgewichtige Blockchain-Framework [blockcentric #...

Mit BigchainDB sehen wir eines der ersten vollumfänglichen, aber einfachen Blockchain-Frameworks. Das Projekt macht es sich zur Aufgabe, Blockchain für eine große Anzahl von Entwicklern und Use Cases nutzbar zu machen, ohne besonderes Wissen in Kryptographie...

Big Data
Blockchain

3.1.2018 | 5 Minuten Lesezeit

Jonas Verhoelen

Dynamische Validierung mit Spring Boot Validation

Serverseitige Validierung ist nicht nur ein Mittel, um eventuelle Angriffe auf ein System abzufangen, sie hilft auch, die Datenqualität sicherzustellen. Im Java-Umfeld wurde uns Entwicklern mit JSR 303 Bean Validation und den javax.validation Packages...

Java
Spring
Validierung

22.11.2017 | 4 Minuten Lesezeit

Ronny Bräunlich

kibconfig – Wartungstool für Kibana Dashboards

Als wir vor 2 Jahren zu Beginn unseres Projekts damit begannen, unser ELK Logging über Kibana Dashboards zu optimieren, standen wir vor einem Problem: Wie konnten wir unsere für die PP-Umgebung vorbereiteten Dashboards, Visualisierungen und gespeicherten...

NoSQL
APM

12.10.2017 | 3 Minuten Lesezeit

Carsten Rohrbach

Data Science und Big Data: Eine Mate mit… Michael Plümacher #EineMateMit

„Aufgrund der gestiegenen Rechen- und Speicherkapazitäten sind in den letzten Jahren ganz neue Möglichkeiten entstanden“, sagt Michael Plümacher, Data Scientist bei der codecentric. Einige seiner aktuellen Data-Science- und Big Data-Projekte stellt er...

Big Data
Data
Community

21.9.2017 | 1 Minuten Lesezeit

Felix Braun

Fraud-Analyse mit Data-Science-Techniken

Was ist Fraud und was macht es für Data Science interessant?Im Zusammenhang mit Data Science beschreibt das englische Wort „Fraud“ in der Regel Betrug im Online-, Kreditkarten- oder Versicherungsgeschäft. Betrugsversuche bei Geschäftsabschlüssen gibt...

Big Data
Data
Machine Learning

5.9.2017 | 9 Minuten Lesezeit

Shirin Elsinghorst

Graphen-Visualisierung mit Neo4j

Datenbank
NoSQL

18.6.2017 | 10 Minuten Lesezeit

Tobias Trelle

Datenlookup in Spark Streaming

Bei der Verarbeitung von Streaming-Daten reichen die Rohdaten aus den Events häufig nicht aus. Meist müssen noch zusätzliche Daten hinzugezogen werden, beispielsweise Metadaten zu einem Sensor, von dem im Event nur die ID mitgeschickt wird.In diesem ...

Softwarearchitektur
Scala
Big Data
Data
Streaming

1.6.2017 | 7 Minuten Lesezeit

Matthias Niehoff

Event-Zeit-Verarbeitung in Apache Spark und Apache Flink

Mit dem neuen Release von Spark 2.1 wurden die Eventzeit-Fähigkeiten von Spark Structured Streaming ausgebaut. Höchste Zeit also den Stand der Unterstützung genauer unter die Lupe zu nehmen und mit Apache Flink – ausgestattet mit einem breiten Support...

Big Data
Data
Machine Learning
Streaming

19.4.2017 | 9 Minuten Lesezeit

Matthias Niehoff

Verteilte Stream Processing Frameworks für Fast Data & Big Data – Ein ...

Spark Streaming, Flink, Storm, Kafka Streams – das sind nur die populärsten Vertreter einer stetig wachsenden Auswahl zur Verarbeitung von Streaming-Daten in großen Mengen. In diesem Artikel soll es um die wesentlichen Konzepte hinter diesen Frameworks...

Big Data
Data
Open Source
Messaging
Machine Learning
Streaming

26.3.2017 | 10 Minuten Lesezeit

Matthias Niehoff

Elasticsearch: _type-Mapping zur Dateninspektion

ProblemsituationEine typische Situation: Daten aus einer Domän mit verschiedenen Sub-Domänen liegen in stark unterschiedlicher und unbekannter Form, mit ebenso unterschiedlichen und unbekannten Werten, vor. Sich mit diesen Daten auseinanderzusetzen ist...

NoSQL

5.12.2016 | 3 Minuten Lesezeit

Christian Börner-Schulte

Spring Boot & Apache CXF – Logging & Monitoring mit Logback, Elasticsearch...

SOAP-Endpoints auf Basis von Microservice-Technologien mit Spring Boot? Cool! Aber wie findet man bei den ganzen „Micro-Servern“ Fehler? Wie sehen die SOAP-Nachrichten aus und wie logge ich eigentlich generell? Und: wie viele Produkte haben wir eigentlich...

Frontend
NoSQL
Java
APM
Logging
Spring

26.7.2016 | 24 Minuten Lesezeit

Jonas Hecht

IoT-Analyse-Plattform

Internet of Things (IoT) oder auch Industrie 4.0 ist heute in aller Munde. Aber welche Herausforderungen stellen sich eigentlich bei der Verarbeitung großer Datenmengen? Eine Variante kann sein, Daten zu sammeln und später im Batch-Betrieb zu verarbeiten...

Cloud
IoT
NoSQL
Scala
Big Data

13.7.2016 | 14 Minuten Lesezeit

Achim Nierbeck

Aufbau eines Mesosphere DC/OS-Clusters mit Terraform

Der Ein oder Andere kennt höchstwahrscheinlich die Herausforderung, ein verteiltes System zu betreiben. Selbst der Betrieb von einem einfachen Online-Shop kann eine nicht triviale Aufgabe sein, wenn der Shop in einer Microservice-Architektur über mehrere...

Cloud
CI/CD
DevOps
Softwarearchitektur
Reactive Programming
Messaging
Big Data

24.4.2016 | 5 Minuten Lesezeit

Bernd Zuther

Elixir, Phoenix und CouchDB – Eine Einführung

Das Elixir MVC Framework PhoenixVon Markus Krogemann und Marcel WolfWorum geht es?Zunächst wird gezeigt, wie sich eine Webanwendung mit Phoenix in einfachen Schritten erstellen lässt, ohne dass ein tieferes Verständnis für eine funktionale Programmiersprache...

Softwareentwicklung
Functional programming
Frontend
NoSQL

13.1.2016 | 4 Minuten Lesezeit

Marcel Wolf

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Joins und Schema-Validierung mit MongoDB 3.2

Joins

Schema-Validierung

Fazit

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

ctop – manage and monitor your Docker containers

Leaflet und GeoJSON-Daten

Google Cloud Function for Machine Learning

Google Cloud Natural Language API

Google Maps API und GeoJSON-Daten

RESTful Microservices on the Google Cloud Platform

GeoJSON Tutorial

Cloud Launcher for MongoDB in the Google Compute Engine

Deploying Spring Boot Applications in the Google AppEngine Flex Environment

EX-Raid-Arenen in Pokémon GO identifizieren

Change Streams in MongoDB 3.6

Spring Cloud Service Discovery with Dynamic Metadata

Lego WeDo 2.0 Programmierung

JUnit 5 – Des Kaisers neue Kleider

Unboxing Lego WeDo 2.0 Roboter Bausatz

Graphen-Visualisierung mit Neo4j

In love with Ada

MongoDB-Einführung bei der Java-Usergruppe ruhrjug

MongoDB 2.8 – Neue Storage-Engine WiredTiger

MongoDB – Riesige Datenmengen schemafrei verwalten

MongoDB World 2014

Test Automation for NoSQL Databases with NoSQL Unit and Travis-CI

Near-Realtime Analytics with MongoDB, Node.js & SmoothieCharts

MongoDB and Ruby

MongoDB 2.4 Introduces Geospatial Indexing and Search for GeoJSON Geometries...

OOP 2013: Praktische Einführung in MongoDB

MongoDB Text Search Tutorial

MongoDB Text Search Explained

Spring Batch and MongoDB

Oliver Gierke on Spring Data and all the REST …

Pessimistic Locking with MongoDB

GridFS Support in Spring Data MongoDB

MonjaDB – A MongoDB GUI Client Tool

Spring Data – Part 6: Redis

MongoDB User-Gruppe Düsseldorf

Spring Data – Part 4: Geospatial Queries with MongoDB

Spring Data – Part 5: Neo4j

Spring Data – Part 3: MongoDB

Spring Data – Part 2: JPA

Spring Data – Part 1: Commons

Testing and Mocking of Static Methods in Java

Cloud Computing Basics: the CAP Theorem

Documenting Custom Robot Framework Keyword Libraries

Quo vadis VMware? vFabric vs. Cloud Foundry

AMQP Messaging mit RabbitMQ und Spring

WebSphereMQ Integration using Mule ESB Community Edition

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Simple Deep Learning mit Amazon SageMaker

Schema First Design – Produktentwicklung mit GraphQL

Deep Learning Workshop bei der codecentric AG in Solingen

BigchainDB – Das leichtgewichtige Blockchain-Framework [blockcentric #...

Dynamische Validierung mit Spring Boot Validation

kibconfig – Wartungstool für Kibana Dashboards

Data Science und Big Data: Eine Mate mit… Michael Plümacher #EineMateMit

Fraud-Analyse mit Data-Science-Techniken

Graphen-Visualisierung mit Neo4j

Datenlookup in Spark Streaming

Event-Zeit-Verarbeitung in Apache Spark und Apache Flink

Verteilte Stream Processing Frameworks für Fast Data & Big Data – Ein ...

Elasticsearch: _type-Mapping zur Dateninspektion

Spring Boot & Apache CXF – Logging & Monitoring mit Logback, Elasticsearch...

IoT-Analyse-Plattform