From Big Data to Smart Data

Bei vielen Unternehmen fallen jeden Tag große Mengen Daten an, die in zueinander heterogenen System erzeugt werden. Dadurch werden verschiedene Formate genutzt und die Speicherung findet häufig in unstrukturierter Form statt. Diese Umstände machen es schwer, die richtigen Informationen zu finden und so zu instrumentalisieren, dass auf ihrer Grundlage Strategien formuliert und effektiv Entscheidungen getroffen werden können.

Wir bieten Ihnen flexible und einfach bedienbare Lösungen für die Gewinnung von Erkenntnissen operativer und strategischer Unternehmensführung und ermöglichen somit eine effiziente Gestaltung von Geschäftsprozessen. Unsere Kompetenzen liegen hierbei in der Analyse, Design und Implementierung von Big-Data Anwendungen.

Im Gegensatz zu natürlichen Rohstoffen wie Erdöl, Kohle oder Erdgas wächst der Rohstoff des 21. Jahrhunderts  „Daten“ kontinuierlich weiter an. Dieses Wachstum wird mit der Einführung von IoT Lösungen exponentiell steigen.  Ziel ist es daher, den Rohstoff Big Data aufzubereiten, damit er zu Smart Data veredelt werden kann, um sein gesamtes wirtschaftliches Potenzial entfalten zu können.

Big Data Analytics vs. Business Intelligence

KPI-Monitoring und Reporting mit dem ELK Stack

Elascticsearch, Logstash and Kibana StackUnsere Lösungen zeichnen sich durch hohe Sicherheit und Performance aus. Wir arbeiten innerhalb unserer Lösungen mit dem ELK Stack von Elastic (www.elastic.co). Wir loggen die zu untersuchenden Daten der Apps über unseren Webservice und verarbeiten diese zunächst mittels Logstash – einer Open Source Software zur Verarbeitung von Datenströmen. Eine Besonderheit stellt hierbei die zeitgleiche Verarbeitung von Daten aus unterschiedlichen Quellen dar. Sie werden kodiert, gefiltert und anschließend in der Data Storage & Analytics Engine Elasticsearch gelagert. In dieser schnellen und flexiblen Engine können Suchanfragen in Echtzeit gestartet werden, sodass wir schnell mit den gewonnenen Erkenntnissen arbeiten können. Diese werden anschließend mittels Kibana interaktiv visualisiert. So sind Ereignisse und Strukturen des Datensatzes leicht verständlich.

Auch eine Kombination von Elasticsearch und dem Big Data Framework Apache Hadoop® ist möglich. Apache Hadoop® wird in dem Themenfeld Big Data zur Verarbeitung von großen Datenmengen genutzt und hat die besondere Eigenschaft der stetigen Erweiterbarkeit. Durch diese Flexibilität können unsere Lösungen an Ihre Bedürfnisse und Wünsche angepasst werden.

Natural Language Processing (NLP)

Enthalten die aggregierten Daten bspw. Text, so können Informationen mit Natural Language Processing (NLP) gewonnen werden.
Hierbei wird menschliche Sprache von Computern analysiert. NLP Algorithmen basieren oft auf einer Kombination unterschiedlicher Methoden der Linguistik, der Informatik und der Künstlichen Intelligenz. So stellt NLP einen großen Teilbereich des Maschinellen Lernens dar. Aus kognitiver Sicht beschreibt ein Lernprozess die Verarbeitung von Informationen, welche gespeichert und bei Bedarf abgerufen werden. Im Kontrast zu klassischen Algorithmen stellt das Maschinelle Lernen (Machine Learning) einen kontinuierlichen Prozess dar. Ein Algorithmus wird so durch immer mehr Informationen angereichert. Dies führt wiederum zu einer automatisierten Optimierung der Ergebnisse.

Zu den charakteristischen Aufgaben, die mit NLP gelöst werden, zählen u.a. das Erkennen von morphologischen und syntaktischen Zusammenhängen. So können weitere Rückschlüsse gezogen werden, welche bspw. zu Sentimentanalysen, Part-of-speech Tagging und Named-entity recognition führen. Diese Analysen werden u.a. durch Tokenisierung, Lemmatisierung, Word2Vec und Neuronale Netze ermöglicht. Der flexible Einsatz dieser Open Source Werkzeuge ermöglicht die Erschließung diverser Anwendungsbereiche, welche auf Ihre Bedürfnisse angepasst werden können.

Kontakt