K dispozici mají 50 milionů záznamů denně. Datová analýza není v Sazce jen frází
Nejsme datově zaměřená firma jen na slajdu v prezentaci, říká Martin Košina ze Sazky v seriálu Cloudová civilizace od CzechCrunche.
Homo sapiens neboli člověk moudrý se i přes svůj výmluvný biologický název ne vždycky rozhoduje na základě faktů. Lidé rádi pokoušejí štěstí a nejistý výsledek je pro ně často vyhledávaná forma adrenalinu. Lidé v Sazce jsou sice taky jen lidé, ale v práci své projekty staví na robustní datové analytice. Jak funguje sběr a taky využití dat v Sazce, v druhém díle seriálu Cloudová civilizace přiblíží šéf Business Intelligence (BI) oddělení Martin Košina.
„Po celé republice je osm tisíc terminálů Sazky, ze kterých sbíráme data. Víme, kolik lidí si který den vsadilo nebo kolik si jich vyzvedlo balík. Zároveň máme několik set tisíc aktivních zákazníků na online platformě, což je druhá obrovská část dat, která máme k dispozici. Kromě objemu pracujeme taky s rychlostí – všechna data umíme číst i real-time,” vysvětluje Martin Košina.
Velkým tématem je pro BI oddělení Sazky projekt Data Governance, který se zaměřuje na ochranu dat. Firma si poměrně složitým procesem nastavila to, že přesně ví, jaká data má, v jaké kvalitě jsou, kdo je za ně zodpovědný a kdo k nim má přístup. Tým Sazky dnes v tomto směru dokonce školí další české firmy.
„K dispozici máme 50 milionů záznamů denně, to už je pořádná porce. Pomocí strojového učení v nich můžeme sledovat třeba i různé anomálie, tedy že se něco chová jinak, než by mělo,” doplňuje Košina.
Propojování analytického světa a světa byznysového tady zajišťuje zajímavá pozice datového vědce. „Moje práce spočívá v tom, že si na základě dat, která máme, vymýšlím úkoly, hledám na ně řešení a následně ta řešení ‚prodávám‘ managementu. V podstatě jim tak pomáhám zformulovat směrování našich budoucích byznysových projektů,” popisuje BI Data Scientist Lukáš Pastorek.
Podívejte se na celou Epizodu #2 seriálu Cloudová civilizace se Sarou Polak!