Wow, tabulkové porno. Tým datové inteligence z České spořitelny sdílí svoje zkušenosti s úklidem milionů dat
Velký úklid pod taktovkou týmu datové inteligence v České spořitelně otevírá dveře mnohem zásadnější změně – cloudifikaci celé banky.
Česká spořitelna se vydala na cestu stát se datově řízenou firmou. Celý svět se po hlavě řítí do cloudu a jedna z největších českých bank ho následuje. Taková změna se ale neobejde bez absolutního pořádku v datech, jejich jasně přiděleného vlastnictví po celý jejich životní cyklus a zmapovaných procesů. Jen poté je možné přemýšlet o ukončení provozu obrovských vlastních datacenter a převést data do cloudu, který v současnosti umí daleko více než jen data ukládat.
Velký datový úklid České spořitelny dostala na starosti Pavlína Vajgarová, šéfka oddělení datové inteligence, která více než rok pracuje na interní demokratizaci dat, tedy jejich zpřístupnění i technicky nezdatným uživatelům. V jejím snažení jí pomáhá a podporuje ji vedoucí oddělení inženýringu a platforem Tomáš Metz, před kterým stojí trochu jiná výzva s názvem cloudifikace. Jaký životní cyklus mají data v České spořitelně a jak jsou důležitá pro provoz cloudové aplikace George jsme probrali v novém díle TechCastu, technologického podcastu CzechCrunche, který si můžete pustit na Spotify, Google Podcastech, Apple Podcastech nebo na YouTubu či na odkazu níže.
„Před rokem a půl jsem od svého šéfa dostala zadáno začít pracovat na demokratizaci dat, což kolegyně trefně pojmenovala jako vytvoření datového butiku. Jako první jsem se naučila metodu design thinking a pustila se do toho,“ popisuje začátek celé operace Pavlína Vajgarová. V té době chyběl v České spořitelně datový katalog, takže nikdo nevěděl, jaká data jsou k dispozici, komu patří ani zda je může vůbec použít. Problémy se týkaly byznysových dat, u těch regulatorních je slovy Metze nastavení „tip ťop vyladěné“.
Pavlína Vajgarová s pomocí dvou kolegů za tři měsíce přišla s prvním klikatelným prototypem pro aplikaci George zaměřenou na finanční zdraví. Reakce prvního testera byla výstižná: „Wow, to je úplné tabulkové porno!“ a tým datové inteligence měl otevřené dveře k dalším projektům. Efektivita využití dat je ve firmách často nízká především kvůli tomu, že je těžké určit, komu data patří – některé týmy nemají čas je zodpovědně řešit, striktně datové týmy zase nevidí byznysový přínos.
Druhým problémem je potom podle Tomáše Metze fakt, že datové týmy a datoví vědci tráví většinu času analýzou a zpracováním jedněch a těch stejných dat: „Ve Spořce máme stovky datových zdrojů a tisíce datových sestav. Skutečně hodně času jsme trávili dohledáváním dat a lidí, kteří by nám k nim uměli říct něco víc. Na prototypu jsme si dokázali, že tento neproduktivní čas umíme z velké části eliminovat, aby se datoví odborníci mohli věnovat tvorbě reportů a hledání skutečně zajímavých informací ve velkých datech,“ vysvětluje Metz.
Když ale firma v datech nastolí pořádek, tomu se věnuje disciplína pojmenovaná data governance, tyto problémy se rychle vyřeší. Vytváří se jednotné reporty, které využívají různá oddělení napříč celou firmou, ví se, odkud data pochází, kudy a kam tečou a lze je mnohem jednodušeji monetizovat. „Datový pořádek je navíc prerekvizitou případné cloudifikace,“ dodává Vajgarová.
Nahlásit komentář
Zdá se vám, že komentář je urážlivý, nebo sprostý? Dejte nám vědět.