Transparentnost, která je zbytečná. Twitter zveřejnil kód algoritmu, neříká ale skoro nic podstatného
Elon Musk se rád považuje za proponenta transparentnosti a svobody projevu, a tak zveřejnil část kódu Twitteru. Odpovědi na klíčové otázky ale chybí.
Elon Musk, šéf Tesly a SpaceX
Komentář Jiřího Svobody: Když loni Elon Musk kupoval Twitter, dělal to podle svých slov kvůli tomu, že chtěl vytvořit svobodné médium. Sám se označuje za „absolutistu svobody projevu“, tvrdí, že podporuje transparentnost, a tak zároveň slíbil, že zveřejní algoritmus sociální sítě, na jehož základě se řadí příspěvky, které pak uživatel vidí. Jak slíbil, tak také – alespoň zčásti – nakonec učinil a kód visí na platformě GitHub.
Mnozí se na tento okamžik těšili. Doporučovací algoritmy sociálních sítí jsou zpravidla neprůhledné černé skříňky a jejich otevření by mělo pomoct přijít na kloub palčivým otázkám. Třeba proč se někteří uživatelé dostávají do dezinformacemi protkaných informačních bublin nebo proč naopak některé příspěvky přes svou nepochybnou relevanci zapadnou v nekonečném proudu tweetů. A také proč se vám na twitterové zdi objevují stále dokola videa s roztomilými kočičkami, přestože jste to nikdy nechtěli.
Sociální sítě mají dobré obchodní důvody, proč tyto algoritmy nechávat utajené – je to koneckonců jeden z hlavních nástrojů, na kterých vydělávají. Zveřejnění doporučovacího algoritmu Twitteru by tak bylo revolučním momentem. Jenže kdo doufal v přelom, nakonec bude zklamaný. Transparentnost algoritmu totiž může znamenat mnoho věcí.
Twitter skutečně na svém webu popisuje, jak doporučovací algoritmus na stránce zvané „Pro vás“ funguje. Proces, jakým se na ní tweety řadí, rozděluje na tři hlavní fáze. Zaprvé takzvaný candidate sourcing, v němž Twitter dává dohromady tweety z několika zdrojů, přičemž polovina je ze sledovaných účtů. V této fázi výběru přichází do hry také první algoritmický model, takzvaný Real Graph, který predikuje pravděpodobnost interakce mezi dvěma uživateli. Zadruhé se relevantní tweety pomocí strojového učení seřadí. A za třetí Twitter vyfiltruje například tweety ze zablokovaných účtů. Výsledek tohoto procesu pak zamíří na displeje uživatelů.
Algoritmus Twitteru zajišťuje i to, aby se vám nezobrazovalo příliš mnoho tweetů od jednoho autora nebo aby doporučil „férový“ balanc obsahu. Vše je zajištěno pomocí neuronové sítě s přibližně 48 miliony parametrů, která je neustále trénována s cílem celkově většího počtu lajků, retweetů nebo odpovědí na tweet.