Big Data – proč je jejich zpracování budoucnost i možná cesta do pekel?

Skrze naše mobilní telefony, chytré vysavače, ledničky a další elektronická zařízení se denně vygeneruje obrovské množství digitálních dat o osobních i sociálních aktivitách jednotlivců. Není divu. Žijeme v technologické době, které stále více dominují tzv. big data.

Co big data vlastně jsou, jak je poznat a jak je řídit efektivně? Proč na jedné straně představují příležitost, jak zlepšit svět, a na druhé pekelný nástroj, který může v nesprávných rukou napáchat spoustu škod?

Co jsou big data neboli velká data

Big data představují tak velké množství digitálních dat, že není možné je sbírat a zpracovávat běžnými způsoby.

Klasický software by takový proces buď vůbec nezvládl zpracovat nebo by trval nadměrně dlouhou dobu. Efektivní nakládání s big daty proto vyžaduje speciální software a server s vysokým výpočetním výkonem.

7V aneb podle čeho poznám, že jde o big data

Velký objem dat ještě nutně nemusí znamenat, že máte tu čest s big daty. O jejich přítomnosti vám napoví sedm charakteristik pod anglickými názvy volume, velocity, variety, veracity, value, variability a visualization.

  1. Volume (velikost) – minimální objem dat, kdy už můžeme hovořit o big datech, není jasně daný. Většinou se ale jedná o vyšší desítky TB až PB. 
  1. Velocity (rychlost) – dalším znakem big dat je jejich rychlé generování i zpracování. A to kontinuálně během delší doby.
  1. Variety (různorodost) – obsahují různé typy proměnných od příspěvků na Facebooku po videa a mohou mít jak jasně danou strukturu, tak být zcela nestrukturovaná. Nemají jednotnou podobu a právě to je důvodem, proč je jejich zpracování obvykle velmi komplikované.
  1. Veracity (důvěryhodnost) – pro vypovídající výsledek je potřeba, aby byla big data z důvěryhodného zdroje. Bez toho je není možné správně interpretovat.
  1. Value (hodnota) – zpracování big dat je nákladná záležitost, a proto by měla získaná data stát za to. Například informace o tom, kde se na dálnici aktuálně tvoří kolony, má mnohem větší hodnotu, než ta, kolik lidí v obchodě mělo bílé tričko. Ve druhém případě se složité zjišťování pravděpodobně nevyplatí.
  1. Variability (proměnlivost) – pro big data je typické, že se neustále mění. Při jejich analýze nás tedy nezajímá skutečnost, že je každý den odliv a příliv, ale zejména čas, kdy se tak děje nebo jak se přitom mění teplota vody.
  1. Visualization (vizualizace) – big data vyžadují sofistikovanější vyhodnocení a zpracování výsledků. Výhodné je použít grafy, diagramy či jiné vizuální prostředky. Lze z nich mnohem lépe vyčíst vzájemné vztahy a návaznosti než z obyčejné  tabulky.

Příklady big dat a proč do jejich zpracování investovat

Big data souvisí nejčastěji s výzkumem, který firmám pomáhá zjistit skutečné potřeby a požadavky zákazníků a umožňuje jim tak nabízet výrazně lepší služby a zážitek z nakupování nebo z používání jejich produktů. Takové informace rovněž vytváří příznivé prostředí pro inovace a další rozvoj společnosti.

Odkud se big data berou

Může se jednat o analýzu chování zákazníků na e-shopu, webu nebo na sociálních sítích, o analýzu zveřejněných videí na YouTube nebo fotografií na Instagramu.

To je ale jen zlomek big dat, s nimiž se můžete v současném světě setkat. Na big data již narazíte téměř všude. Generují se ze všech obchodních transakcí, z kamerových systémů, ze satelitů, z chytrých automobilů, z biometrických senzorů, ze spotřebičů, které jsou součástí chytré domácnosti, z mobilních aplikací a tak bychom mohli pokračovat dál a dál.

Co přináší big data lidské společnosti

  • Umožňují vyšší bezpečnost (např. bankovních účtů), rychlejší vývoj (např. firem) a výrazné usnadnění běžného života (např. zmírněním dopravních zácp).
  • Důkladnější analýzu dat pro vědecké účely a vývoj medicíny, diagnostiky a léčby nemocí.
  • Využívání umělé inteligence a strojového učení.
  • Podklad pro vývoj samořiditelných aut a IoT čipů.
  • Zvyšování produktivity a snižování nákladů, protože lze lépe předvídat prodeje.
  • Díky satelitním datům je možné předcházet požárům a jiným přírodním katastrofám nebo alespoň urychlit následnou reakci na tyto události.
  • V zemědělství lze plodiny přizpůsobit měnícím se přírodním podmínkám či jiným okolnostem, dá se lépe využívat sluneční světlo a voda apod.

Nevýhody zpracování big dat a budoucí hrozby

  • Poskytovatelé digitálních služeb mohou informace o uživatelích zneužít pro politické i jiné nesouvisející účely.
  • Přesně cílenou reklamou na základě big dat lze do značné míry manipulovat se spotřebiteli.
  • Hrozí skupinové kategorizování a odpírání pracovních příležitostí, vycestování ze země nebo odepření lepšího vzdělání a třeba také získání hypotéky na základě sociálního kreditu (na tomto principu funguje například čínský systém Social Credit). Toto vše nepříjemně zavání technologickou diktaturou a ve své podstatě zrušením soukromého života.

Jak se big data zpracovávají

Zpracování big dat probíhá v několika krocích, které se ale neobejdou bez výkonného zařízení. Díky technologickému pokroku se však tato činnost stává stále dostupnější i pro menší podniky.

Postup zpracování big dat

Nejprve je potřeba data posbírat a uložit do tzv. data warehouse (zkráceně DW nebo DWH), česky datového skladu. Následně se data vhodně uspořádají a vyčistí od nepotřebného balastu. Až poté je vhodné přejít k analýze zjištěných dat a ke zpracování výsledků do grafů.

Software na míru pro zpracování big dat

Množství dat neustále skokově přibývá a je stále obtížnější z nich vytáhnout to nejdůležitější. Odhaduje se, že do roku 2025 vzroste oproti roku 2018 celkový celosvětový objem dat o 530 %. 

Big data je možné analyzovat z různých úhlů a získat tak mnoho užitečných informací. K tomu je ale potřeba kvalitní a výkonný systém, který to dokáže. Pro zpracování big dat existují různé systémy, ale ne všechny vám poskytnou vše, co potřebujete.

Rádi byste ze získaných dat vytěžili maximum a snadno se v nich vyznali díky přehledné grafice? Kdykoliv můžete kontaktovat odborníky z Think Easy a dát big datům řád, získat stabilní a výkonný software a důkladně analyzovat, co vás jen napadne!

Komentáře