Getting started with Titan using Cassandra and Solr

25.2.2016 | 3 minutes of reading time

Titan comes with several possibilities to configure the storage (BerkleyDb, Cassandra, Hbase) and the underlying search engine (Lucene, Solr, Elastic). Since DataStax aquired Aurelius and DataStax Enterprise Search uses Solr, I wanted to setup an environment I can easily modify to use DSE later, instead of the Apache Cassandra version.

Pre Requirements

My Environment

I am running this setup on Ubuntu 14.04 in a Virtual Machine. I am using the latest Java version “1.8.0_73”.

Download cassandra 2.1.12 (titan currently supports version 2.x)
Download titan 1.0.0
Download solr-5.3.1

Please note: This article will only cover basic information on how to setup Cassandra or Solr. For more details I recommend starting reading Apache Cassandra Getting Started and solr Quickstart .

Cassandra

For this easy setup I will only use a one node cluster, so I leave the settings in cassandra.yaml as default.

To start Cassandra, unzip the downloaded Cassandra package and run the Cassandra binary inside of cassandra/bin

tar xvfz apache-cassandra-2.1.12-bin.tar.gz
cd apache-cassandra-2.1.12
bin/cassandra

Solr

Preparation

To start Solr, first unzip the downloaded Solr package.

tar xvfz solr-5.3.1.tgz

To be able to use geospacial search, we need to copy the file jts-1.13.jar – which is coming with Titan DB – into the Solr lib folder.

cp titan-1.0.0-hadoop1/lib/jts-1.13.jar solr-5.3.1/server/lib

This step is necessary, because the schema.xml – provided by Titan – uses geo definitions to be able to use spatial queries. If we don’t copy this jar into our classpath, we will run into the following error, when trying to create the Solr core.

https://gist.github.com/HashtagMarkus/32075e726e4990059c84

The second possibility, to get rid of this error, is to delete the lines in schema.xml where a “geo” jts property is used. Of course that way we are not able to use geospacial search like shown in the official examples .

Now we can start Solr

./solr-5.3.1/bin/solr start

To validate that Solr is running, point your browser to http://localhost:8983/solr/#/

Create Core

In general, we need to create a Solr core for each index we create in Titan. In the GraphOfTheGods examples, we want to run when this setup is done, two indexes are created: “vertices” and “edges”. The “vertices” index will be used to be able to do some range search on the “age” properties of our vertices. The “edges” index will be used to search for a property named “reason” on some of the edges as well as to be able to do a geo search.

Before we can create these Solr cores, we need to copy the predefined Solr configuration files into Solr’s configsets folder. These configuration files are included in our Titan package.

https://gist.github.com/HashtagMarkus/8ae4221f02a895984bca

Now we can create our cores:

To verify, that the cores were successfully created, open the Solr pannel inside your browser and see if both cores are present in the drop down list.

Starting Gremlin Shell and creating Titan sampledata

There are several ways to use Titan. For the purpose of this tutorial I run Groovy commands inside of the Gremlin shell, which is provided within the Titan package. The Gremlin shell comes with the necessary plugins to run all example commands.

In this example I run everything on a single machine. If you want to install Cassandra and Solr on separate machines, you need to make sure your servers are accessible from the outside. You’ll also need to edit the titan-cassandra-solr.properties file to point to the correct IP addresses for both – Cassandra and Solr.

vi titan-1.0.0-hadoop1/conf/titan-cassandra-solr.properties

Also make sure that the other listed properties are set accordingly. You could also use Solr cloud, but this setup would be quite different – I will not cover this setup in this post.

https://gist.github.com/HashtagMarkus/88cd82dcc48bffba8e73

Now that we finished setting up each of our components, its time to start the Gremlin console:

cd titan-1.0.0-hadoop1
bin/gremlin.sh

Was this post helpful?

Likes

Blog author

Markus Höfer

Do you still have questions? Just send me a message.

fromMarkus Höfer

Aber ich habe doch ein Antivirusprogramm …

Antivirus- und EDR-Funktionsweise In der Vergangenheit haben sich Antivirusprogramme auf das Entdecken und Beseitigen von schädlichen Dateien spezialisiert. Dabei überprüften sie das Dateisystem und Dateien während der Ausführung. EDR-Software (Endpoint...

IT-Security

3.8.2022 | 7 Minuten Lesezeit

Markus Höfer

Hololens mit Unity3D: Ein Beispielprojekt

Im vorherigen Teil der Blogserie zum Thema Augmented Reality mit der Hololens (Hololens mit Unity3D: Projektsetup ) haben wir die Integration der Hololens in die Engine Unity3D erläutert. Hier wollen wir nun anhand eines Beispiels auf die elementaren...

AR/VR

19.12.2018 | 5 Minuten Lesezeit

Dominik Averesch

Markus Höfer

Hololens mit Unity3D: Projektsetup

Dieser Teil der Blogserie zum Thema Augmented Reality mit der Hololens behandelt, wie ein grundlegendes Unity3D-Projekt aufgebaut wird. Im letzten Blogpost (Augmented Reality mit der Hololens ) wurde beschrieben, was die Hololens ist und wie sie funktioniert...

AR/VR

16.10.2018 | 4 Minuten Lesezeit

Markus Höfer

Dominik Averesch

Augmented Reality mit der Hololens – Wie funktioniert das überhaupt?

Die Hololens ist bereits seit 2015 für Entwickler verfügbar. Mir war sie bisher nur aus den Medien oder von Konferenzen bekannt. Ich habe aktuell das Vergnügen, die Hololens genauer kennenzulernen und die reale Welt um mich herum virtuell zu erweitern...

UX/UI
Microsoft
AR/VR
Infrastructure

14.8.2018 | 3 Minuten Lesezeit

Markus Höfer

Build:Stockholm’18 – Zu Besuch bei Epic Games

Wenn man „Epic Games“ oder „Unreal Engine“ hört, denkt man für gewöhnlich an Videospiele. Dass Epic mittlerweile deutlich mehr bietet als „nur“ Videospiele, ist dagegen nicht so bekannt. Am 23.5.2018 fand in Stockholm im Fotomuseum „Fotografiska“ die...

AR/VR
Game programming
Community

4.6.2018 | 4 Minuten Lesezeit

Markus Höfer

Springfox Swagger mit externem Markdown erweitern

Dokumentationen von REST APIs sind für deren Anwender essentiell. Ohne eine ansprechende und verständliche Dokumentation lässt sich eine solche API bestenfalls nach dem „trial and error“-Prinzip anwenden. Mit Swagger wurde eine Spezifikation geschaffen...

Dokumentation
Java
Spring
API

19.9.2017 | 4 Minuten Lesezeit

Markus Höfer

Your job at codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit ...

Machine Learning
Data Science
Data
Big Data

25.8.2023 | 7 Minuten Lesezeit

Ihsan Kisi

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Wenn wir Erkenntnisse aus großen Datenmengen gewinnen wollen, bieten uns Cloud Service Provider inzwischen Lösungen an, dank derer wir uns kein Data Warehouse oder Hadoop-Cluster mehr in den Keller stellen müssen. AWS hat mit Athena, RedShift und EMR...

Cloud
Big Data
AWS
Serverless
GitLab

21.3.2023 | 16 Minuten Lesezeit

Maik Fleuter

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

Platform Engineering mit BackstageIm folgenden Interview berichten Marc Schnitzius und Pascal Sochacki von ihren ersten Erfahrungen mit Backstage als Platform-Engineering-Lösung.Marco Paga: Marc, Pascal, ihr habt eine Sicht auf Platform Engineering, ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

2.3.2023 | 12 Minuten Lesezeit

Marco Paga

Maximilian Mayer

„Platform Engineering ist eine Art von Knowledge Sharing“

Warum „Platform Engineering“ eigentlich der falsche Begriff ist und wie man den Golden Path findet, erklärt Daniel Kocot, Senior Solution Architect, im folgenden Interview.Marco Paga: Warum ist Platform Engineering interessant?Daniel Kocot: Ich habe ...

Softwareentwicklung
Accelerate
CI/CD
DevOps
Platform Engineering

20.2.2023 | 11 Minuten Lesezeit

Daniel Kocot

Marco Paga

Platform Engineering – Machen das nicht alle schon?

Plattformen sind aktuell ein sehr populäres Konzept, insbesondere in der Softwareentwicklung von Unternehmen. Viele sagen aber auch: So neu ist das doch gar nicht. Wir bieten unseren Entwicklern seit Jahren alle relevanten Tools und Werkzeuge, damit ...

DevOps
Accelerate

7.12.2022 | 2 Minuten Lesezeit

Matthias Niehoff

Platform Engineering – Eine Einordnung

Aktuell kocht mit Platform Engineering gerade ein Thema hoch, das in den Weiten des World Wide Web für viele Reaktionen sorgt. Gerade auch Kunden aus dem Enterprise-Umfeld führt es zu interessanten Nebeneffekten, wenn aus DevOps-Teams plötzlich Platform...

Accelerate
CI/CD
DevOps

12.9.2022 | 4 Minuten Lesezeit

Daniel Kocot

Passwörter sicher per GitOps deployen mit SealedSecrets

In einem GitOps-Workflow beschreibt das Entwicklungsteam alle Ressourcen eines Kubernetes-Projekts in einem Git-Repository. Dadurch können sowohl das Entwicklungsteam als auch das Infrastrukturteam alle Bestandteile eines Projektes überblicken. Was jedoch...

DevOps
Kubernetes

13.6.2022 | 10 Minuten Lesezeit

Raffael Stein

Terraform Remote State richtig nutzen

Was ist Terraform und was ist State?Terraform ist ein Tool für die Verwaltung von Infrastruktur in Form von Code, gehört also in den sogenannten Infrastructure-as-Code-Bereich (IaC). Eine kurze Einführung und ein Vergleich zu anderen Tools findet sich...

Infrastructure
Softwarearchitektur
Cloud
DevOps

21.4.2022 | 7 Minuten Lesezeit

Alexander Kasper

Deployment konfigurierbarer Single Page Applications

In den letzten Jahren ist die Implementierung von Frontends in Form von Single Page Applications (kurz SPA) immer beliebter geworden. Bei Single Page Applications handelt es sich um Webseiten, die auf den Web-Technologien HTML, CSS und vor allem JavaScript...

DevOps
Frontend
CI/CD
Container
JavaScript

8.6.2021 | 6 Minuten Lesezeit

Philip Sanetra

Wie reif ist euer DevOps? – Einige Gedanken zur Messung des Fortschritts

Spoiler: Es ist ehrlich gesagt nicht von Bedeutung.In letzter Zeit haben wir des Öfteren von Kunden eine Frage gestellt bekommen:Wie misst man Fortschritt in Bezug auf Dev(Sec)Ops? Gibt es hierfür ein Maturity Model oder eine Menge an Skills, welche ...

Agilität
Cloud
DevOps
IT-Security

6.6.2021 | 4 Minuten Lesezeit

Nicolas Byl

Keycloak-Konfiguration mit Terraform

Infrastructure as Code (IaC) ist heutzutage aus der modernen IT-Landschaft nicht mehr wegzudenken. Red Hat beschreibt den Begriff wie folgt:Infrastructure as Code (IaC) is the managing and provisioning of infrastructure through code instead of through...

DevOps
Infrastructure
IT-Security
CI/CD
Keycloak
Open Source

2.3.2021 | 6 Minuten Lesezeit

Johanna Nolte

Play-with-Docker: Container-Workshops auf AWS

Kubernetes- und Docker-Workshops sind sehr schwer vorzubereiten, Play-with-Docker und Play-with-Kubernetes können dabei aber eine große Hilfe sein. Die Dokumentation dazu ist leider nicht sehr umfangreich, wie man es schnell und einfach installieren ...

Infrastructure
Cloud
DevOps
Container
Kubernetes
Open Source

22.11.2019 | 9 Minuten Lesezeit

Sebastian Kornehl

Kubernetes Operator: Operations-Wissen als Code

In diesem Artikel erkläre ich, was ein Kubernetes Operator ist und wie er aufgebaut ist. Anschließend zeige ich euch, wie man seinen ersten eigenen Kubernetes Operator in Go schreibt.Was ist ein Kubernetes OperatorEin Kubernetes Operator hilft, eine ...

Infrastructure
Open Source
DevOps
Go
Kubernetes

29.10.2019 | 10 Minuten Lesezeit

Manuel

Concourse-CI-Authentifizierung mit Keycloak

Concourse CI ist ein flexibler Scheduler für CI-Pipelines, der in zahlreichen Open-Source-Projekten eingesetzt wird, darunter sind unter anderem Projekte aus dem Spring-Ökosystem sowie dem Cloud-Foundry -Universum, die mit teils stattlichen CI-Pipelines...

DevOps
IT-Security
CI/CD
Keycloak

25.1.2019 | 4 Minuten Lesezeit

Thomas Darimont

Application Lifecycle Intelligence: Analyse von Wertschöpfung in Entwicklungsprozessen

Wenn wir uns mit agiler Softwareentwicklung beschäftigen, sprechen wir grundsätzlich auch über Application Lifecycle Management (ALM). Ebenso treibt das Business, das hinter allen Anforderungen für die Entwicklung von Software steht, immer die Frage ...

DevOps
Business Intelligence

25.9.2018 | 6 Minuten Lesezeit

Daniel Kocot

Simple Deep Learning mit Amazon SageMaker

In unserem neuesten codecentric.AI-Video geben wir eine kurze Einführung in Amazon SageMaker und zeigen, wie man damit schnell und einfach ein Bildklassifikationsmodell trainieren kann, das Brillenträger von Nicht-Brillenträgern unterscheidet. Mit ...

Big Data
AWS
Cloud
Data
Machine Learning
Künstliche Intelligenz
Python

11.7.2018 | 5 Minuten Lesezeit

Shirin Elsinghorst

Oliver Moser

Schema First Design – Produktentwicklung mit GraphQL

Zu den schwierigsten Aufgaben bei der Entwicklung neuer Produkte gehören die Koordinierung der Teams, der Featureumfang und unbekannte Faktoren in Form der „moving parts“. Laut Definition müssen wir bestimmte laufende Prozesse berücksichtigen. Ein gutes...

API
Big Data

25.6.2018 | 7 Minuten Lesezeit

Toni Haupt

DevOps: Es geht um Feedback

Es ist kein Geheimnis: Immer mehr Firmen steigen auf eine Softwareentwicklung mit agilen Methoden und DevOps um. Auf Rückfrage hören wir oft, dass die klassischen Entwicklungsprozesse zu langsam sind. Was genau heisst das? Klassischer Entwicklungsprozess...

DevOps
Collaboration

20.2.2018 | 7 Minuten Lesezeit

Oliver Hoogvliet

Deep Learning Workshop bei der codecentric AG in Solingen

Big Data – ein Schlagwort, das zur Zeit in aller Munde ist, egal ob in nerdigen Blogs, wissenschaftlichen Artikeln oder der Tageszeitung. Doch wie funktionieren Analysen von Big Data eigentlich? Um das heraus zu finden, habe ich an dem Workshop über ...

Big Data
Data
Künstliche Intelligenz
Machine Learning

6.2.2018 | 6 Minuten Lesezeit

Shirin Elsinghorst

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Contact

Send

Getting started with Titan using Cassandra and Solr

Pre Requirements

My Environment

Cassandra

Solr

Preparation

Create Core

Starting Gremlin Shell and creating Titan sampledata

Was this post helpful?

Ja

Blog author

Get in contact

Get in contact

More articles

Aber ich habe doch ein Antivirusprogramm …

Hololens mit Unity3D: Ein Beispielprojekt

Hololens mit Unity3D: Projektsetup

Augmented Reality mit der Hololens – Wie funktioniert das überhaupt?

Build:Stockholm’18 – Zu Besuch bei Epic Games

Springfox Swagger mit externem Markdown erweitern

Your job at codecentric?

Agile Developer und Consultant (w/d/m)

View Job

More articles in this subject area

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

„Eine Plattform ist ein Produkt, die Entwickler-Teams sind die Kunden“

„Platform Engineering ist eine Art von Knowledge Sharing“

Platform Engineering – Machen das nicht alle schon?

Platform Engineering – Eine Einordnung

Passwörter sicher per GitOps deployen mit SealedSecrets

Terraform Remote State richtig nutzen

Deployment konfigurierbarer Single Page Applications

Wie reif ist euer DevOps? – Einige Gedanken zur Messung des Fortschritts

Keycloak-Konfiguration mit Terraform

Play-with-Docker: Container-Workshops auf AWS

Kubernetes Operator: Operations-Wissen als Code

Concourse-CI-Authentifizierung mit Keycloak

Application Lifecycle Intelligence: Analyse von Wertschöpfung in Entwicklungsprozessen

Simple Deep Learning mit Amazon SageMaker

Schema First Design – Produktentwicklung mit GraphQL

DevOps: Es geht um Feedback

Deep Learning Workshop bei der codecentric AG in Solingen

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten