Big Data
10.02.16 13:07 Gespeichert in:Trends
Seit dem Jahrhundertwechsel sind 80% der Informationen in dieser Welt unstrukturiert. Unstrukturierte Datenmengen wachsen in etwa 15 mal schneller wie strukturierte Daten. Der Zugriff auf Informationen ausserhalb privater Unternehmen wurde demokratisiert und steht weitgehend jedem offen. (Zikopoulos et al., 2012, S. XV)
Die weltweit produzierten Daten erreichte im 2010 erstmals ein Zettabyte. Prognosen zufolge verdoppelt sich das Volumen jeweils alle zwei Jahre. (UNECE, 2014)
Neben den offenen Daten im Internet produzieren Unternehmen selbst während ihren normalen operativen Tätigkeiten eine grosse Menge von Daten die sie für Auswertungen nutzen können. So etwas passiert zum Beispiel, wenn ein Energieerzeuger auf die jährliche Stromablesung verzichtet und dafür im Viertelstundentakt die Messdaten der Stromzähler elektronisch abliest. Oder wenn ein Turbinenhersteller bereits nach der Landung des Flugzeugs analysieren möchte, welche Turbinen in die Inspektion müssen. (Schäfer, Knapp, May & Voss, 2012, S. 6)
Charakteristisch ist dabei, dass die Daten eine hohe Varietät (en. variety) aufweisen da diese strukturiert und unstrukturiert vorzufinden sind. Die Datenmenge (en. volume) geht dabei von Terabyte in Richtung Zettabyte und passt nicht auf eine Maschine. Ausserdem sind die Daten nicht statisch sondern sie bewegen sich mit einer zunehmenden Geschwindigkeit (en. velocity) von der traditionellen Stapelverarbeitung (en. batch processing) in Richtung einer Verarbeitung sich bewegender Datenströme (en. streaming data, complex event processing). Big Data ist auch ein kulturelles Phänomen und beschreibt wie viele Daten Teil unseres normalen Lebens sind. Zu den drei V wird oft als viertes V auch Value genannt um den Wert der Daten zu betonen. (ONeil & Schutt, 2014, S. 24; Zikopoulos et al., 2012, S. 5)
Als Enabler für Big Data sind neben der Verfügbarkeit der Daten die steigenden Speichervolumen sowie die zunehmende Rechenleistung zu nennen. (Grobelnik, 2012, S. 10-12)
Der Treiber hingegen ist das Management und nicht die Informationstechnologie (IT). Das hohe Interesse an Anwendungen im Bereich Marketing und Vertrieb sowie das Ziel der Wettbewerbssteigerung zeigen, dass Big Data eher ein Management-Thema ist, als dass es durch die IT dominiert wird. (Schäfer et al., 2012, S. 9)
Gartner positioniert Big Data auf dem Hype-Cycle bereits auf der absteigenden Hype-Flanke im Wellental der Ernüchterung (en. trough of disillusionment). Nur wenn diese Desillusionierung eintritt und die Aufklärung (en. slope of enlightenment) und die Produktivitätsebene (en. plateau of productivity) folgen, kann damit zukünftig Geld verdient werden. Gartner entfernt jeweils Themen welche nach deren Einschätzung über zu geringes Potenzial verfügen bis zum Ende des Zyklus zu gehen. Das ist bei Big Data nicht der Fall. Gartner geht davon aus, dass Big Data die Ebene der Produktivität in fünf bis zehn Jahren erreichen wird. (speckund, 2014)
In Zusammenhang mit Big Data wird auch oft Cloud Computing genannt da dort viele Daten anfallen die jedoch üblicherweise nicht frei Verfügbar sind. Cloud Computing stellt Anwendungen und Dienste über das Internet bereit. Dabei geht es im speziellen auch um die Bereitstellung von Rechenleistung, Netzwerken und Speicherressourcen nach den Bedürfnissen der Kunden. Es wird werden Infrastructure-as-a-Service (IaaS), Platform-as-a-Service (PaaS) und Software-as-a-Service (SaaS) unterschieden. IaaS stellt die Infrastruktur wie Rechenleistung und Speicher ohne Betriebssysteme zur Verfügung. Beim PaaS sind dann das Betriebssystem und auch spezifische Anwendungen und Werkzeuge enthalten. SaaS stellt den Benutzern schliesslich komplette Anwendungen zur Verfügung.
Durch die zunehmende Datenmenge und den in substantiellem Umfang verfügbaren freien (nicht zwingend kostenfreien) Zugang zu Informationen entstehen Möglichkeiten Daten aufzubereiten, zu verbinden und schliesslich zu aggregieren. Der Themenkomplex Big Data steht am Anfang und die enormen Datenmengen sowie die ständige Veränderung derer, deuten aufgrund der Informationsfülle auf einen ungesättigten Markt. Um aus diesen Daten aber gewinnbringende Informationen zu extrahieren muss Big Data zu Smart Data werden.
Die weltweit produzierten Daten erreichte im 2010 erstmals ein Zettabyte. Prognosen zufolge verdoppelt sich das Volumen jeweils alle zwei Jahre. (UNECE, 2014)
Neben den offenen Daten im Internet produzieren Unternehmen selbst während ihren normalen operativen Tätigkeiten eine grosse Menge von Daten die sie für Auswertungen nutzen können. So etwas passiert zum Beispiel, wenn ein Energieerzeuger auf die jährliche Stromablesung verzichtet und dafür im Viertelstundentakt die Messdaten der Stromzähler elektronisch abliest. Oder wenn ein Turbinenhersteller bereits nach der Landung des Flugzeugs analysieren möchte, welche Turbinen in die Inspektion müssen. (Schäfer, Knapp, May & Voss, 2012, S. 6)
Charakteristisch ist dabei, dass die Daten eine hohe Varietät (en. variety) aufweisen da diese strukturiert und unstrukturiert vorzufinden sind. Die Datenmenge (en. volume) geht dabei von Terabyte in Richtung Zettabyte und passt nicht auf eine Maschine. Ausserdem sind die Daten nicht statisch sondern sie bewegen sich mit einer zunehmenden Geschwindigkeit (en. velocity) von der traditionellen Stapelverarbeitung (en. batch processing) in Richtung einer Verarbeitung sich bewegender Datenströme (en. streaming data, complex event processing). Big Data ist auch ein kulturelles Phänomen und beschreibt wie viele Daten Teil unseres normalen Lebens sind. Zu den drei V wird oft als viertes V auch Value genannt um den Wert der Daten zu betonen. (ONeil & Schutt, 2014, S. 24; Zikopoulos et al., 2012, S. 5)
Als Enabler für Big Data sind neben der Verfügbarkeit der Daten die steigenden Speichervolumen sowie die zunehmende Rechenleistung zu nennen. (Grobelnik, 2012, S. 10-12)
Der Treiber hingegen ist das Management und nicht die Informationstechnologie (IT). Das hohe Interesse an Anwendungen im Bereich Marketing und Vertrieb sowie das Ziel der Wettbewerbssteigerung zeigen, dass Big Data eher ein Management-Thema ist, als dass es durch die IT dominiert wird. (Schäfer et al., 2012, S. 9)
Gartner positioniert Big Data auf dem Hype-Cycle bereits auf der absteigenden Hype-Flanke im Wellental der Ernüchterung (en. trough of disillusionment). Nur wenn diese Desillusionierung eintritt und die Aufklärung (en. slope of enlightenment) und die Produktivitätsebene (en. plateau of productivity) folgen, kann damit zukünftig Geld verdient werden. Gartner entfernt jeweils Themen welche nach deren Einschätzung über zu geringes Potenzial verfügen bis zum Ende des Zyklus zu gehen. Das ist bei Big Data nicht der Fall. Gartner geht davon aus, dass Big Data die Ebene der Produktivität in fünf bis zehn Jahren erreichen wird. (speckund, 2014)
In Zusammenhang mit Big Data wird auch oft Cloud Computing genannt da dort viele Daten anfallen die jedoch üblicherweise nicht frei Verfügbar sind. Cloud Computing stellt Anwendungen und Dienste über das Internet bereit. Dabei geht es im speziellen auch um die Bereitstellung von Rechenleistung, Netzwerken und Speicherressourcen nach den Bedürfnissen der Kunden. Es wird werden Infrastructure-as-a-Service (IaaS), Platform-as-a-Service (PaaS) und Software-as-a-Service (SaaS) unterschieden. IaaS stellt die Infrastruktur wie Rechenleistung und Speicher ohne Betriebssysteme zur Verfügung. Beim PaaS sind dann das Betriebssystem und auch spezifische Anwendungen und Werkzeuge enthalten. SaaS stellt den Benutzern schliesslich komplette Anwendungen zur Verfügung.
Durch die zunehmende Datenmenge und den in substantiellem Umfang verfügbaren freien (nicht zwingend kostenfreien) Zugang zu Informationen entstehen Möglichkeiten Daten aufzubereiten, zu verbinden und schliesslich zu aggregieren. Der Themenkomplex Big Data steht am Anfang und die enormen Datenmengen sowie die ständige Veränderung derer, deuten aufgrund der Informationsfülle auf einen ungesättigten Markt. Um aus diesen Daten aber gewinnbringende Informationen zu extrahieren muss Big Data zu Smart Data werden.
Grobelnik, M. (2012). Big-Data Tutorial. Ljubljana: Jozef Stefan Institute.
ONeil, C. & Schutt, R. (2014). Doing Data Science. Sebastopol, CA: O'Reilly.
Schäfer, A., Knapp, M., May, M. & Voss, A. (2012). Big Data - Vorsprung durch Wissen - Innovationspotenzialanalyse. Sankt Augustin: Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS.
speckund (Hrsg.). (2014). Gartner Hype Cycle of Emerging Technologies, Hypes und Trends für 2014 / 2015. https://speckund.ch/2/gartner-hype-cycle-emerging-technologies-2014-2015
UNECE (Hrsg.). (2014, 5. September). Big Data. United Nations Economic Commission for Europe UNECE. https://www1.unece.org/stat/platform/display/msis/Big+Data
Zikopoulos, P. C., Eaton, C., Deroos, D., Deutsch, T. & Lapis, G. (2012). Understanding Big Data - Analytics for Enterprise Class Hadoop and Streaming Data. New York: Mc Graw Hill.