Zkoumání příspěvků na internetu a Facebooku přineslo jediný přesný odhad výsledků voleb

15. 1. 2013 | Petr Michl
Dá se dnes věřit tradičním výzkumům veřejného mínění? Postupující do druhého kola prezidentských voleb byli správně odhadnuti pouze analýzou zkoumající příspěvky v online médiích a na Facebooku.

Nepřesnost tradičních výzkumů veřejného mínění před volbami je známá. Přesto se jejich výsledky zveřejňují v masmédiích, ovlivňují mediální pokrytí jednotlivých stran či kandidátů, a výrazně tak formují i samotné volební výsledky. Výjimkou nebyl ani dosavadní průběh první přímé volby českého prezidenta. Více přesnou formu předpovědi nabízí výzkum pomocí analýzy článků na internetu a příspěvků na Facebooku. Tvrdí to společnost Semantic Visions na základě své zprávy, na které spolupracovala i se Socialbakers. V ní zkoumala četnost příspěvků spojených s prezidentskou volbou, jejich citové zabarvení a další ukazatele. Před volbami pak předpověděla, že na základě zmíněných hodnot za období 1.10.2012 – 1.1.2013 jsou favority prvního kola prezidentské volby Miloš Zeman a Karel Schwarzenberg.

Při českých prezidentských volbách byla využita stejná metodika jako při úspěšných předpovědích výsledků nedávných amerických prezidentských voleb či britských parlamentních voleb v roce 2010. „O volebních výsledcích rozhoduje všeobecná známost osoby a její vnímání veřejností. U každého z kandidátů jsme tedy zkoumali celkový počet článků a zmínek v médiích a jejich emoční zabarvení. Za období od 1. října 2012 do 1. ledna 2013 jsme tak zpracovali 375 880 článků z 1760 online zdrojů a 62 332 postů a komentářů z facebookových profilů všech prezidentských kandidátů,“ vysvětluje Jiří Prokeš.

Z grafu poměrného zastoupení kandidátů v online médiích během prosince 2012 je zřejmé, že nejčastěji diskutovanými postavami byli právě Karel Schwarzenberg a Miloš Zeman.

Naopak graf zobrazující počet zmínek na Facebooku ukazuje, že zde měl kandidát s „modrou krví“ oproti Zemanovi výrazně navrch. Komunikaci na nejrozšířenější sociální síti v celém zachyceném časovém období patřila Vladimíru Franzovi, ale můžeme vidět, že největší pokrytí mu náleželo v polovině října. S koncem roku se média začala intenzivněji zabývat blížící se volbou a i představování relevantních kandidátů. V souvislosti s Karlem Schwarzenbergem můžeme zmínit i využití Facebook reklamy, které se stalo výraznější právě během druhé půlky prosince. Schwarzenbergova kampaň měla vynikající načasování. Ač daný časový úsek analýza nepokrývá, dle názoru redakce jeho přítomnost na Facebooku poslední týden před volbami v 1. kole kulminovala a výrazně přispěla k úspěšnému postupu do kola dalšího. 


Další zajímavý trend představuje graf zachycující vývoj emočního náboje v online médiích. Ten ilustruje, že byl Schwarzenberg zpočátku podzimu tak trochu „mimo hru“. Jeho nástup jako relevantního kandidáta přichází později než u ostatních v druhé půlce listopadu.

Tato data nenaznačují, že se volby rozhodují na internetu. Superdebatu kandidátů sledovalo v televizi 1,7 milionů diváků, víc než jakékoliv volební video či pořad online. Je také zřejmé, že podpora Jana Fischera začala klesat po jeho konfrontaci s Milošem Zemanem a ostatními kandidáty v televizních debatách. Spíše tento výzkum ukazuje, že, ač není na internetu ani zdaleka celý elektorát, to, co se na něm povídá, může mít velkou vypovídací hodnotu z hlediska predikce výsledků voleb.

Metodologie výzkumu

Semantic Visions použila obdobný přístup jako v případě své úspěšné predikce parlamentních voleb 2010 ve Velké Británii (pro CNN) a prezidentských voleb 2012 ve Spojených státech. Zjednodušeně řečeno, o volebních výsledcích rozhoduje všeobecná známost osoby (celkový počet článků a zmínek v médiích), její vnímání (poměr pozitivnícha negativních zmínek v médiích) a v konečné fázi kampaně i jejich vzájemná dynamika.

Oproti předešlým případům, byly do analýzy zahrnuty i data z Facebooku, která přinesla další rozměr. Výchozí data z Facebook profilů jednotlivých prezidentských kandidátů laskavě poskytla analytická společnost Socialbakers, u online médií byla hodnocena data přímo získaná Semantic Visions.
Hodnoceným obdobím bylo 1.10.2012 – 1.1.2013. Analyzovány byly dva velké soubory dat:

  • Online média: 375 880 článků získaných z celkem 1.760 online zdrojů (zpravodajské portály a blogy), které publikují ve formátu RSS. V této množině článků bylo automaticky identifikováno 37 723 zmínek o jednotlivých kandidátech, které byly dále podrobeny detailní analýze sentimentu / emočního náboje (u všech kandidátů byly aplikovány stejné algoritmy).
  • Sociální sítě: 62 332 postů a komentářů z Facebook profilů všech devíti prezidentských kandidátů. V tomto obsahu bylo automaticky identifikováno 9 712 postů a komentářů majících emoční náboj. Tyto byly dále podrobeny detailní analýze, která rozlišovala tři úrovně pozitivního, resp. negativního sentimentu (u všech kandidátů byly aplikovány stejné algoritmy).

Kompletní výzkum si můžete prohlédnout na stránkách Semantic Visions.

Sdílejte tento článek:
Podobné články:
Tento web používá soubory cookie k poskytování služeb, personalizaci reklam a k analýze návštěvnosti. Používáním tohoto webu s tím souhlasíte.