Co jsou to velká data a proč se o nich mluví
Objem zpracovávaných dat ve firmách neustále roste. Meziroční růst je mnohde i exponenciální. S nástupem internetu věcí, Průmyslu 4.0 a dat ze všech dílčích součástí každého jednoho stroje ve výrobní hale se objem získávaných, a hlavně zpracovávaných dat ještě zvětší. Velká data jsou zkrátka tu. Proč bychom se o ně měli zajímat a co nám mohou přinést?
Velká data jako zdroj informací pro firmu
Známý americký statistik William Edwards Deming kdysi pronesl dnes už slavná slova: „Bez dat jste jen další člověk s názorem.“ Velká data dnes umožňují nejednat jen na základě nějakého názoru, dojmu či přesvědčení, ale také na základě tvrdých dat. V současné době totiž už konečně máme nástroje pro jejich sběr, ukládání a zpracování.
Menší problém spočívá v tom, že těch dat začíná být až příliš. Je jich už dokonce tolik, že se v nich důležité informace pro řízení a manažerské rozhodování začínají ztrácet. Proto ostatně vznikly a rychle se rozšířily business intelligence nástroje, které umožňují dávat množství nejrůznějších dat do důležitého kontextu i grafické reprezentace. Tím činí ona data pro člověka srozumitelná.
Business intelligence nástroje však vyžadují aktivní interakci člověka – datového analytika či zkušeného manažera, který je nějakým způsobem vyhodnotí a přijme na jejich základě exekutivní rozhodnutí. Samy o sobě jsou k ničemu. Jenže velká data lze zpracovávat i strojově a rozhodnutí už nemusí činit člověk. V době internetu věcí už to ani není možné dělat jinak. Jediný senzor – např. GPS tracker umístěný v automobilu – dokáže během minuty vygenerovat i desítky kilobajtů dat. A polohu sledovaného vozu také nezakreslujete na mapu ručně.
Na automatizovaném zpracování velkého množství dat a na strojovém rozhodování je ostatně postavená i celá myšlenka Průmyslu 4.0 – tzv. kyberfyzické systémy a umělá inteligence, která bude sama optimalizovat údržbu a servis strojů a měnit podle toho i kapacitní plán výroby, to bude každodenní chléb mnoha průmyslových podniků. A podobné postupy se samozřejmě uplatní a někdy již uplatňují i jinde – logistika, call centra nebo třeba doporučování vhodného doplňkového sortimentu při nákupu v e-shopu.
Na analýzu velkých dat často vlastní zdroje nestačí
Zpracování velkých dat, v dnešní době už vcelku běžně terabajtových databází, však vyžaduje odpovídající výpočetní výkon. Už ale začíná být příliš drahé ho držet tzv. in-house, či chcete-li on-premise. Navíc je to i značně neefektivní, protože jedna věc je někam uložit 2 TB databází, což dokáže dnes obstarat i velmi levné diskové pole, a druhá věc je nad ní začít provádět nějaké náročné výpočetní operace. Pro ty je potřeba obrovské množství RAM i mnohojádrových procesorů. Vtip je však v tom, že tyto operace provádíte obvykle jen jednou za čas. A pak se vyplatí využít cloudové služby. Ostatně jejich nasazení je i jedním ze základních pilířů Průmyslu 4.0.
Cloud se však často již využívá právě pro business intelligence nástroje. Možnost využít stovek procesorů pro zpracování jednoduchého manažerského výstupu vypadá lákavě. Takový výstup je totiž obvykle potřeba sice jen jednou za čas, ale zato rychle. Měl by být totiž interaktivní. Výkonná cloudová platforma vše vyřeší za zlomek sekundy, a přitom kvůli interaktivnímu reportu, se kterým pracujete jednou za měsíc, nemusíte hned investovat miliony do vlastních serverů.
Umělá inteligence a strojové učení už klepou na dveře
Budoucnost velkých dat tedy spočívá v nasazení umělé inteligence a strojového učení. A to do všech odvětví lidské činnosti. Ostatně čipy pro umělou inteligenci dnes začínají mít i chytré telefony. Inteligentní jsou i domácnosti, vysavače, ledničky či pračky. Základem všeho je však strojové učení. A to opět vyžaduje zkušené datové analytiky, kteří nastaví jednotlivé rozhodovací váhy. Ty pak pomohou při analýze přesných a čistých dat. Na některé firmy tak, podobně jako u business intelligence, dolehnou hříchy z minulosti a svá data budou muset vyčistit od duplicit i překlepů.
Budoucnost je v prediktivních analýzách důsledků
Byť někteří vizionáři jako třeba Elon Musk začínají svět umělou inteligencí strašit a hovoří o černých scénářích, které známe ze sci-fi filmů, v oblasti řízení podniků je budoucnost naopak růžová. Budoucnost velkých dat a jejich strojových analýz totiž spočívá v nástrojích, jako je třeba prediktivní analýza důsledků, jež dokáže sama odhalit, čistě na základě dat ve vašem podnikovém informačním systému, potenciální problém a upozorní na něj příslušného zodpovědného manažera. Jak by to mohlo v praxi vypadat? Třeba když budete mít vystaveny faktury plátci DPH, který se stane nespolehlivým, upozorní vás na možný negativní dopad na vaše cashflow v případě, že toto DPH budete muset místo něj zaplatit vy. Tato budoucnost přitom může být mnohem blíž, než to aktuálně vypadá.