Sbírají data o kozách, e-shopech i Teslách. Český startup dělá byznys na tom, co na sebe firmy prozradí

Někdy jsou data užitečná, jen když se spojí více zdrojů, sama by výpovědní hodnotu neměla. To je naše specialita, říká zakladatel BizMachine.

martin-ondas-bizmachine-boxedRozhovor

Foto: Dominik Wünsch/BizMachine

Martin Ondáš, spoluzakladatel BizMachine

Dokáže zjistit, kolik krav, ovcí a koz se nachází v jednotlivých krajích Česka. Nebo že sedmnáct zdejších e-shopů, které běží na platformě Shoptet, zároveň vlastní Teslu. Sdružuje také data o schránkových firmách nebo například o společnostech s ruskými majiteli. Pro běžné lidi jde nanejvýš o zajímavosti, obchodně zaměřeným firmám ale dokáže tuzemský nástroj BizMachine z veřejně dostupných zdrojů kombinovat informace s vysokou přidanou hodnotou, které využívají pro obchodní účely. A jsou za to ochotny platit.

Na trhu působí několik hráčů, kteří i z několika desítek veřejných zdrojů vytváří databáze s informacemi o firmách. „Mít a najít samotná data nemusí být tolik zajímavé, když je ale umíte správně propojit, přináší obrovskou hodnotu. A na to se soustředíme my,“ vysvětluje Martin Ondáš, jeden ze zakladatelů BizMachine.

Za firmou stojí tři Martinové – kromě Ondáše také Nepraš a Lucký. Všichni se prvně potkali v konzultační společnosti McKinsey, v roce 2016 se ale rozhodli začít budovat vlastní byznys. S BizMachine se pak do velké míry udržovali mimo mediální radar. Bez pomoci investora ale v obratu vyrostli na loňských 42 milionů korun, v týmu zaměstnávají 32 nadšenců do dat a využívá je 300 zákazníků, mezi něž patří menší firmy i globální hráči jako Microsoft, Siemens, MasterCard nebo Cisco.

Ondáš v rozhovoru pro CzechCrunch mluví o tom, jak taková práce s daty vůbec vypadá, jaké trendy na specifickém trhu pozoruje, jestli se data otevírají, i o tom, že budoucnost je v monetizaci interních dat firem.

Vy máte informace asi o sedmi milionech firem, kromě českých také všech slovenských a německých. Na druhou stranu, o vás se téměř neví, takže je to takový nepoměr…
Ano, je to tak. (smích) Šlo o naši strategii, kterou pomalu měníme. Máme tady přes tři sta zákazníků, přičemž jde hlavně o B2B firmy a marketingově-obchodní týmy. V začátcích jsme jim nabízeli řešení na míru, takže jsme je oslovovali přímo a plošnou komunikaci jsme nepotřebovali. Nyní se už celý trh posouvá směrem k „platformizaci“, tedy k nástrojům, které může využívat širší masa zákazníků. Na to máme dobrý základ a tím směrem se vydáváme.

martin-ondas-bizmachine-2

Foto: Dominik Wünsch/BizMachine

Martin Ondáš z BizMachine

Souvisí takový přístup mimo mediální radar se zkušenostmi, které jste sbírali před založením BizMachine?
Částečně ano, firmu jsme zakládali jako konzultanti z McKinsey a jejich mantra je neinvestovat do marketingu. Nemluví o sobě, o zákaznicích ani o projektech, většina prodeje probíhá napřímo nebo na základě referencí. Takový přístup jsme měli v DNA i my.

Jak jste se vůbec od konzultační práce dostali k založení vlastní firmy?
Projekty na podporu prodeje a marketingu s využitím dat a velkých analýz jsme dělali už předtím. Vždy to ale probíhalo stejně – na začátku projektu se investovalo hodně času a nemalé prostředky na vytvoření základní databáze a insightů z trhu, na čemž se dále stavělo. My jsme chtěli tento úvodní proces akcelerovat, což už teď děláme posledních pět let. Data a související spojitosti si předtím mohly dovolit jen největší firmy s velkými analytickými týmy, případně si koupily konzultační projekty za miliony korun. Díky platformám, jako jsme my, si je ale už může koupit v podstatě kdokoliv za desítky tisíc.

Jakým způsobem taková práce s hledáním dat vůbec probíhá? Datových zdrojů máte asi sto…
Už jich bude mnohem více, u stovky jsme je přestali počítat. (smích) Pro nás jsou inspirací klienti, se kterými jsme pořád v kontaktu. Řešíme pro ně konkrétní problémy, takže nás často navedou na nové cesty, kde a jaké zdroje se dají do platformy ještě připojit. To nám pomáhá odhalovat i netradiční zdroje. Navíc jsou někdy informace užitečné, jen když se spojí několik zdrojů dohromady – samy o sobě by výpovědní hodnotu neměly. A to je naše specialita.

Dokážete uvést konkrétní příklad?
Například máme zpracovanou databázi flotil, takže víme, jestli firmy mají elektroauta. Pomocí dat od energetického regulačního úřadu dokážeme odvodit, jestli mají na střeše solární panely. A když se tyto informace propojí, je to velmi specifická cílová skupina pro prodejce nabíječek. Oba zdroje jsou netradiční, samy o sobě vám až tak moc neřeknou, ale když se překryjí, dokážou nabídnout velký obchodní potenciál.

Vždy využíváme jen veřejné zdroje, nehledáme insider info. Firmy o sobě prozradí hodně.

Když se na to podíváme obecně, co všechno se dá o firmách vůbec zjistit?
Opravdu hodně věcí. Musím ale říct, že vždy využíváme jen veřejné zdroje, nehledáme takzvané insider info. Jinými slovy – každý, kdo je super dobrý v googlování, by měl umět všechna naše data najít také. Jde o kombinaci veřejných registrů a informací na webech, pracovních portálech, sociálních sítích a tak dále. Firmy o sobě prozradí hodně. Zajímavá data jsou pak v jednotlivých odvětvích. Hydrometeorologický úřad publikuje seznam největších znečišťovatelů, takže pokud rozumíte chemii a energetice, dokážete zjistit, jestli pálí zemní plyn nebo uhlí, a to i v jakém objemu ročně. V neposlední řadě je zajímavá oblast e-commerce, kde po sobě hráči zanechávají obrovskou digitální stopu.

V e-commerce i z toho důvodu existuje mnoho datově-analytických nástrojů, které taková data sbírají.
My se na ale tuto oblast díváme jinak. Běžně firmy sledují například úzkou škálu konkurentů nebo výsek informací a zjišťují vývoj na denní bázi. My se díváme na úplně celý trh. V Česku je asi 80 tisíc e-shopů, aktivních z nich je asi 35 tisíc a na každém z nich se pravidelně díváme, co se u nich děje – jaké produkty prodávají, do čeho asi budou tlačit reklamu, jak se vyvíjí návštěvnost, na jakých technologiích fungují, jaké využívají systémy a platební brány, jaké najímají lidi… V e-commerce jdeme opravdu do šířky.

Rozumím, že když pak tato data spojíte s dalšími databázemi, tak mohou nabídnout zajímavé postřehy. Samotná data ale nestačí, nejdůležitější je jejich interpretace. Jak pracujete právě s ní, abyste si byli jistí, že na základě dat docházíte ke správným závěrům?
Na jedné straně máme v týmu lidi, kteří přemýšlí „byznysově“, takže sami hledají možnosti, jaká data by se mohla obchodníkům hodit. Zároveň úzce a dlouhodobě spolupracujeme s klienty. Není to o tom, že jim poskytneme databázi a rozloučíme se. Díky jejich zpětné vazbě dokážeme databáze zlepšovat a iterovat, což nás posouvá. Máme klienty s velmi specifickými požadavky – Shoptet nebo Mall mají ohromné množství svých dat. My jim ale pomáháme s daty pracovat. Posouvají nás na hranici, co ještě a jak dokážeme zjistit a analyzovat. Za to je máme rádi. (úsměv)

Nebrzdí vás takový přístup ve škálování byznysu?
Nevím. Podobně jako u konkurence si většina našich klientů kupuje přístupy do databáze, kde využívá základní analytické nástroje. Co nás ale odlišuje, a hlavně posouvá ve vývoji, jsou velcí klienti se specifickými požadavky. Přitom žijeme kvalitou dat, na ni si dáváme hodně pozor a věnujeme tomu hodně času. Myslím, že jsme přišli na to, jak byznys škálovat.

Jak tedy?
Situace před pěti lety byla taková, že v případech, jak jsem popisoval, firma potřebovala supermana, který data hledal, čistil, analyzoval, spojoval a ručně aktualizoval. Dnes už máme platformu, kde máme velké množství „polotovarů“ – přístupů k databázím, které se pravidelně aktualizují automaticky. Jsou to takové kostičky ze stavebnice, a když pak za námi přijde klient, nepotřebujeme na vývoj řešení supermana, ale stačí i méně zkušený člověk, který je pak poskládá dohromady za jednu hodinu. Platforma je tak přístupná i pro lidi, kteří nejsou datoví vědci. A na tom se dá hodně stavět.

V čem do budoucna vidíte největší potenciál?
Opravdu dlouhodobá vize je, že chceme být nejenom tím, kdo přinese zajímavé postřehy a data, která zjednoduší život uživatelům – už teď máme hodně a dobře zpracovaných veřejných dat. K tomu ale chceme přidat data od firem, jež nejsou veřejná, ale jsou proprietární z jiného zdroje a mohou mít přidanou hodnotu. Tím i samotným firmám umožníme využít potenciál a jejich data monetizovat pro ně.

martin-ondas-bizmachine-1

Foto: Dominik Wünsch/BizMachine

Martin Ondáš z BizMachine

Něco jako datové tržiště?
Když to extrémně zjednoduším, člověk může vzít excelovskou tabulku a hodit ji na eBay, kde čeká na zájemce. Už teď existují tržiště, kde se s určitým druhem dat obchoduje. Problém ale je, že malé a střední firmy – z evropského kontextu se v Česku nachází asi pět opravdu velkých firem, všechny ostatní jsou v segmentu malých a středních – mohou mít zajímavá data, ale jde jen o velmi malý výsek trhu. My chceme na platformě integrovat několik takových výseků, aby dohromady poskytovaly přidanou hodnotu o celém trhu. Žádný z hráčů individuálně taková data neprodá, ale od určité velikosti se s nimi dá pracovat. My pak firmám nabídneme možnost, kde takovým způsobem svá data mohou prodávat a snižovat jim tak bariéru vstupu na trh s daty.

O jakých datech vlastně mluvíme? Trochu mi to připomíná kauzu kolem Facebooku a Cambrige Analytica.
V tomto případě nemluvíme o informacích o lidech, ale o firmách, produktech či technologiích. Jsou to data, která již firmy mají ve svých transakčních systémech pro interní použití a která by se dala agregovat a interpretovat pro nové účely.

Můžete být konkrétnější?
Například data z transakčních systémů jako objednávky a faktury na úrovni prodávaných produktů a služeb. Cílem je pak zjistit a monitorovat, kolik se čeho prodá a jaké cílové skupině. Může to sloužit jako vstup pro identifikaci trendů využití konkrétních technologií nebo změn nákupního chování. Když například mají tři firmy individuálně tržní podíl 5 až 10 procent, po propojení jejich dat už získáte slušný obrázek o trhu a můžete budovat i predikční modely, což má hodnotu pro výrobce nebo poskytovatele služeb. Také to mohou být technická a produktová data. Máme za sebou inovativní pilot na masové zpracování „product sheets v PDF“ do strukturovaného katalogu pro B2B tržiště pomocí strojového učení. I tak se dají monetizovat data, která jsou zatím běžně uvězněná v „interní kleci“.

Vidíme, že se zdroje otevírají. Ale mohly by rychleji. Čím více otevřených dat bude, tím lépe pro celý trh.

Když se bavíme o datech, tématem je také jejich otevřenost. I váš produkt stojí na veřejných zdrojích, přičemž už roky se mluví o tom, že někdy nejsou moc dostupné a měly by se otevírat.
Vidíme, že se zdroje otevírají. Ale mohly by rychleji. Čím více otevřených dat bude, tím lépe pro celý trh i pro nás. Uvedu příklad – účetní závěrky v Česku nejsou digitalizované, posílají se v PDF, některé jen naskenované, a to navíc křivě a nekvalitně. Pro náš byznys by bylo mnohem lepší, kdyby data byla ve strukturované podobě a mohlo se s nimi rovnou pracovat. Místo toho jsme hodně investovali a poslední dva roky vytváříme pokročilý interní nástroj, který dokumenty čte. Kolegové udělali skvělou práci a vyvinuli umělou inteligenci, jež nám přináší velkou konkurenční výhodu, ale možná bychom raději čas věnovali nadstavbě a přidané hodnotě než základnímu sběru dat.

To je konkrétní příklad. Kde má podle vás stát největší mezery v otevírání dat obecně? Je to právě ta rychlost?
Někdy je to o přístupu. V kontextu diskuze o státní digitalizační agendě na Slovensku jsem zachytil návrhy na projekt, který zkonsoliduje veřejná data, očistí je a dá je na jedno místo. To je opravdu špatný nápad. Něco takového by trvalo deset let a ani tak to nebude pořádné. Jednodušší cesta je otevřít data hned, ať už v jakékoliv rozumně zpracované podobě, aby to nebyla naskenovaná PDF. Trh si najde cestu, jak s takovými daty pracovat. Stát by se neměl zamýšlet nad tím, jak data očistit a propojovat.

Stát ale potřebuje data vyčistit i pro své interní potřeby, nemýlím se?
Ano, ale pro své interní potřeby je vyžaduje jinak – potřebuje menší, avšak velmi přesný výsek dat. My na trhu potřebujeme spíš velkou šíři a nepotřebujeme jít do takového detailu. Jsem přesvědčen o tom, že nemá smysl, aby stát čistil data pro potřeby vnějšího trhu. Když totiž někdo čistí data, tak musí vědět, jak se budou používat. A to stát neví. Trh a konkurenční prostředí se o vyčištění a propojení postará efektivněji a rychleji než stát. Hlavně se potřeby trhu často mění a důležitá je také kreativita při vymýšlení use casů. Zde je jasný velký prostor pro komerční agregátory a zpracovatele dat, kteří ušetří peníze daňových poplatníků a zároveň vytvoří hodnotu pro trh.

Peter Brejčák

Redaktor CzechCrunche, Slovák píšící česky. Buzzwords: startupy, technologie, byznys, e-commerce.

Redaktor CzechCrunche, Slovák píšící česky. Buzzwords: startupy, technologie, byznys, e-commerce.