Dienstag , September 22 2020

NoSQL-Datenbanken: Die vielseitige Lösung für Continuous Intelligence

Die meisten Unternehmen verlassen sich in der Regel auf relationale Datenbankverwaltungssysteme (RDBMS), um geschäftliche Erkenntnisse einschließlich kontinuierlicher Informationen bereitzustellen. Relationale Cloud-Datenbanken haben die Rechenleistung verbessert, um größere Datenmengen zu verarbeiten. Relationale Datenbanken, auch solche in der Cloud, haben jedoch zwei Probleme. Sie haben es mit den unstrukturierten Big Data und dem enormen Speicherbedarf schwerer. Ihre feste Schemaarchitektur macht es schwierig, einen hohen Anteil an kontinuierlicher Intelligenz bereitzustellen.

Gartner prognostiziert, dass bis 2022 mehr als "die Hälfte oder die wichtigsten neuen Geschäftssysteme kontinuierliche Intelligenz enthalten werden". Kontinuierliche Intelligenz erfordert die Umwandlung von Big Data in Echtzeitanalysen, mit denen Geschäftsabläufe Aktionen vorschreiben können. Viele Unternehmen haben jedoch Schwierigkeiten, eine universelle Datenbanklösung zu finden, die schnell reagiert, große Datenmengen aller Art verarbeitet, über mehrere Computerinstanzen skaliert, eine gute Leistung erbringt und konsistent und kontrollierbar bleibt.

Der Wunsch nach einer schnelleren, leistungsfähigeren und flexibleren Architektur führte zur Entwicklung der nicht relationalen oder NoSQL-Datenbanken. NoSQL-Datenbanken haben weniger Speicherbedarf, verarbeiten Big Data besser und verarbeiten aufgenommene Daten schnell. Wie in einem Bericht von DATAVERSITY® Trends in Data Management 2019 r erwähnt, fühlen sich viele Unternehmen überfordert, zu verstehen, wie sie geschäftliche Erkenntnisse aus der NoSQL-Datenbank und ihrer Architektur gewinnen können.

Kürzlich sprach DATAVERSITY mit Jai Karve, einem Lösungsarchitekten bei MongoDB, um die nicht relationale Datenbanktechnologie besser zu verstehen, wie sie auf kontinuierliche Intelligenz vorbereitet ist und gleichzeitig Lücken mit RBDMS-Vorteilen schließt, um allgemeiner zu werden.

Verschieben von Daten schneller und
Über mehrere Maschinen hinweg

Die NoSQL-Technologie basiert auf dem Bestreben, „Daten schnell zu verschieben“ und „horizontal gut zu skalieren“, sagte Karve. Gehen Sie zurück auf das Jahr 2008 und finden Sie heraus, dass Streaming Media-Anwendungen wie Twitter und YouTube immer beliebter werden. Diese Anwendungen sammelten immer schneller kontinuierliche Daten, und das RDBMS hatte Leistungsprobleme, als es versuchte, alles zu handhaben.

„Einige NoSQL-Entwickler untersuchten daher, wie riesige Datensätze auf mehrere Computer verteilt werden können. Sie wollten JSON-Datenstrukturen (Rich JavaScript Object Notation) berücksichtigen, um Anforderungen und Antworten zwischen Computern zu beschleunigen und gleichzeitig auf viele vernetzte Computerinstanzen zu skalieren. Das Ergebnis war, dass die NoSQL-Technologie als vorgefertigte Big-Data-Plattform als Service fungiert und es Entwicklern ermöglicht, Datenanwendungen zu erstellen. “

Der nicht relationale Datenbankcode wurde zu Open Source, um Feedback zu dieser neuen Art von Architektur zu erhalten Hier können Entwickler es ausprobieren, ändern, Probleme einreichen und Verbesserungen vorschlagen. Wie er bemerkte, sahen die Unternehmen die nicht relationale Datenbank weiterhin als Anomalie an.

„Unternehmen verwendeten ihr RDBMS weiterhin für ein Aufzeichnungssystem und suchten in einer NoSQL-Datenbank wie MongoDB nach APIs (Application Programming Interfaces) und verwendeten JSON-Funktionen für Leistung und Geschwindigkeit. Auf dem Markt sah die NoSQL-Datenbank eine Lösung für einen Nischen-Anwendungsfall, eine Caching-Schicht, um gespeicherte Daten schneller bereitzustellen. “

Während die NoSQL-Datenbanken eine stärkere Nutzung anstrebten, fehlten ihnen wichtige Merkmale, einschließlich der Datenvalidierung und ACID-a-konforme Transaktionen. ACID beschreibt atomare, konsistente, isolierte und dauerhafte Datenbankeigenschaften, die sich ideal für Zahlungen eignen. Jedes Datenbanksystem, das so konzipiert ist, dass es die ACID-Attribute erfüllt, behält die Integrität jeder Transaktion, eines Satzes von Vorgängen und Werten bei. Im Gegensatz dazu könnte die NoSQL-Datenbank Daten ab dem Zeitpunkt der Eingabe ändern und schließlich konsistent sein, bietet jedoch nicht unbedingt starke Konsistenzgarantien.

Einige NoSQL-Technologien haben es versucht
Erreichen Sie diese Konsistenz, indem Sie Daten auf Datenbankebene sperren. "Aber dann
Das Aktualisieren oder Schreiben in die Datenbank wird umständlich “, sagte Karve.
"Entmutigung zur Verwendung von NoSQL-Datenbanken." Die NoSQL-Herausforderung lautete: „… das Hoch liefern
Verfügbarkeit und horizontale Skalierbarkeit Stärken in NoSQL, aber die Lücke schließen mit
wünschenswerte RDBMS-Funktionen wie ACID-Transaktionen. “

Eine Allzweck-NoSQL-Datenbank
mit ACID-Eigenschaften

Im Jahr 2017 wurden die NoSQL-Datenbanktechnologien weiterentwickelt, wobei Flexibilität, Geschwindigkeit und Leistung beim Einbetten von ACID-Datenbankeigenschaften erhalten blieben. Karve zitierte eine Lösung, die Dokumentendatenbank. Jedes Dokument enthält Schlüssel und Werte, die an die Benutzerspezifikationen angepasst sind. Der Inhalt, die Anzahl und das Array von Dokumenten in einer Dokumentendatenbank haben nur wenige Einschränkungen, was sie ideal für Big Data macht.

Karve erklärte, dass MongoDB hinzugefügt hat
ACID-Eigenschaften für dieses Dokument Datenarchitektur. Zunächst werden Algorithmen validiert
Inhalte, die in JSON-Dokumente geschrieben wurden. Stellen Sie sich diesen Code als eine Möglichkeit zur Pflege vor
Datenqualität durch Überprüfung, ob der Dokumentinhalt den Geschäftsregeln entspricht und
Anforderungen und diejenigen, die dies tun, behalten, sperren. Diese Programmierung macht
Transaktionen atomar und konsistent.

Die Haltbarkeit der NoSQL-Datenbank ist gegeben
aus einem Replikatset. Jeder Datencluster enthält einen Primärknoten, der akzeptiert
Datenbankschreibvorgänge und sekundäre Knoten, die die Schreibvorgänge replizieren. Wenn der primäre
Knoten fällt aus, einer der Sicherungsknoten wird primär. Daten können sicher bleiben
Server- oder Netzwerkausfälle als neuer Knoten werden primär.

MongoDB erstellt eine ACID
Datenbank, ein Datencluster mit einer Reihe von JSON-Dokumenten, konfiguriert und überprüft
per Code. In der Zwischenzeit kann das Unternehmen so viele Datencluster skalieren
nach Bedarf an mehreren Standorten oder flexibel entscheiden, wie dies geschehen soll.

Eine Continuous Intelligence-Datenbank
Architektur

Das Verständnis, wie kontinuierliche Intelligenz aus der NoSQL-Architektur der Dokumentendatenbank abgerufen werden kann, ist eine Herausforderung. Karve bemerkte:

„Menschen bleiben mit relationalem Datenbankgepäck stecken, während sie versuchen, ihr Datenbankmodell einer Dokumentendatenbank zuzuordnen. Sie versuchen, eine Normalisierung zu erreichen, indem sie Daten organisieren, um ein auf Beziehungen basierendes Schema zu erfüllen. Kunden haben dann eine schreckliche Erfahrung. Unternehmen profitieren von einem Paradigmenwechsel. Sie müssen bei der Modellierung von Daten über Datenspeicherung und Zugriff nachdenken. Behalten Sie ähnliche Daten bei, auf die gemeinsam zugegriffen werden soll. Denken Sie weniger an Boxen als an Details der einzelnen Datencluster. “

MongoDB erkannte, dass Unternehmen in einer RDBMS-Perspektive stecken bleiben können, und erstellte mit einigen Partnern das Modernization Toolkit. „Diese grafische Oberfläche hilft Geschäftsanalysten dabei, Daten von RBDMS auf Datencluster abzubilden, um die kontinuierliche Modellierung von NoSQL-Daten besser zu verstehen.“

Für diejenigen, die ihre Daten behalten möchten
Relationales Schema, Anbieter wie Confluence, integrieren NoSQL und SQL
Technologien, die Unternehmenstools verbinden. Das Ergebnis ist eine „leistungsstarke Plattform
Ermöglichen Sie Geschäftsanalysten den einfachen Zugriff auf Echtzeit-Ereignisüberprüfungen während der Transformation
diese kontinuierliche Intelligenz bei SQL-Abfragen. “ Beispiele umfassen auch Tableau
und PowerBI, das interaktive Dashboards und Berichte in Echtzeit bereitstellt
mit SQL abgefragt.

Steuern von Datenclustern

Interaktive Echtzeit-Dashboards liefern nur so gute Informationen wie die Datenqualität innerhalb der Datenbanksysteme. Was passiert jedoch, wenn sich die Geschäftsanforderungen ändern? Karve kommentierte:

„Einige Mitarbeiter verwenden eine Open-Source-Dokumentendatenbank, um Dinge schnell zu erledigen. Aber dann eine Vielzahl verschiedener Praktiken, die im Laufe der Zeit vererbt werden. Das Unternehmen weiß nicht, wie diese Datenbank nach dem Ausscheiden der Mitarbeiter verwaltet oder verwaltet werden soll. “

Er erklärte, wie MongoDB mit dieser Art von Data Governance-Problem umgeht, dem Cloud-Datenbankdienst namens Atlas. Stellen Sie sich Atlas als Kontrollzentrum für Datencluster vor, die in der Cloud eingerichtet werden. Mongo übernimmt das "schwere Heben der NoSQL-Datenbankstruktur", während das Unternehmen "die Hebel, Knöpfe und Wählscheiben zum Einstellen der Parameter des Datenclusters" hat. Von dort aus kann ein Unternehmen die Datenleistung und den Standort optimieren.

Wie trifft dies auf Daten zu?
Führung? Wenn Sie den Speicherort der Daten kennen, müssen Sie wissen, für welche Vorschriften sie gelten
die dort gespeicherten Daten. Da Regierungen unterschiedliche Datenschutzstandards erlassen, gilt dies
wird einfacher, die Datenkonfigurationen zu aktualisieren, um neuen Gesetzen zu entsprechen oder
Verschieben Sie die Daten an einen anderen Ort ohne die Vorschrift.

Kombinieren Sie diese Funktion unter einem
Unternehmensweites Data Governance-Dach und eine leistungsstarke Methode zur Feinabstimmung
und flexible Verwaltung von Datenrichtlinien und -verfahren.

Streaming-Daten mit erweiterter Skalierbarkeit benutzerfreundlicher gestalten

Die Zukunft der NoSQL-Technologie sieht rosig aus
für kontinuierliche Intelligenz. Erstens versprechen NoSQL-Datenbanken, mehr Benutzer zu sein
freundlich durch autonome Datenbankfunktionen. Karve erklärte: „MongoDB wird
Erkennen Sie das Benutzerverhalten und geben Sie Vorschläge zur Datenbankmodellierung

und zur Indexerstellung. “ Indizierung
Ruft Suchergebnisse schneller ab.

Zweitens das Dokument von MongoDB
Datenbank wird ihre Fähigkeit erweitern, mehr mobile Geräte und die zu handhaben
Internet der Dinge (IoT). Karve sagte: „Es werden die Datencluster am
Rand des Netzwerks besser in der Lage, mit dem Server zu synchronisieren. " Die NoSQL-Technologie
wird 5G eine Technologie mit besserer Verbindungsgeschwindigkeit nutzen und mehr ermöglichen
Streaming-Dateneingaben.

Unternehmen benötigen NoSQL-Technologie, um
Nutzen Sie kontinuierliche Intelligenz aufgrund ihrer Flexibilität, Leistung und Leistung
Verlässlichkeit. Basierend auf dem jüngsten COVID-19-Pandemiegeschäft siehe
Multi-Cloud-Möglichkeiten als widerstandsfähigeren und elastischeren Weg zu nutzen
Daten speichern und Ausfallzeiten vermeiden. NoSQL-Datenbanken skalieren mit der Leistung
über viele Clouds hinweg, wodurch erweitert wird, wie viele kontinuierliche Daten Sie erfassen können und
wo es hingelegt werden soll. RDBMS allein verfügt nicht über die Architektur für Multi-Clouds
Daten und kontinuierliche Intelligenz.

Bild verwendet unter Lizenz von Shutterstock.com

About BusinessIntelligence

Check Also

Predictive Analytics: 4 Hauptaspekte von Predictive Analytics

Predictive Analytics, manchmal auch als Big Data Analytics bezeichnet, stützt sich auf Aspekte des Data …

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.