Ukazuje se stále více, že Češi mají hodně nevyrovnaný vztah k matematice, který se projevuje abnormálními extrémy. 

Na jedné straně stojí svérázný miliardář, který i morální a etické otázky řeší pomocí „objektivní“ matematiky a z rovnice dělá věc svatější než svatá trojice. Na druhé straně spektra pak hrdě stojí experti na neumětelství z ministerstva vnitra, kteří dělají vše proto, aby dokázali, že na matematice absolutně nezáleží a že tahle pavěda si na českého byrokrata nepřijde. A kdyby se o to přece jen matematika rozhodla pokoušet, panák jí z moci úřední a pod svatozáří procesního alibi nekompromisně pošle k soudu, aby se zpovídala z toho, jak nemístně úřadům kazí klid na práci. (Pokud se jmenujete Václav Henych, mohli byste si svoje úvahy snad i nechat patentovat, protože teorie relativity svou banálností bledne vedle toho, co v matematice do­káže vymyslet obyčejný zaměstnanec českého ministerstva vnitra.)

Co z toho pro nás pro všechny plyne? Asi nic. Snad jen jeden pozoruhodný důsledek. Ať už v Čechách postavíte matematiku na piedestal, nebo jí pod tím piedestalem nechutně znásilníte, z hlediska výsledku je to úplně jedno – stejně z toho vznikne jen pozoruhodná blbost. Obávám se, že jediný, kdo nám to všem nakonec spočítá úplně správně, bude bohužel jen historie. Kdyby se to netýkalo i mě, řekl bych dobře nám tak. Ale takhle to neřeknu. Počítám, že by se mi to nemuselo vyplatit.

5 komentářů

  • Honzo, ja slyšel rozhovor děkana fakulty informatiky a statistiky z VŠE a ten potvrdil správnost vzorce, který se řídí statistikou. Takže ono asi jde spíše o to jak ty pravidla byla předem nastavena v zákoně. Sportovní terminilogií, jestli ve fotale neplatí gól rukou tak se ho nemůžu dožadovat :-)

  • Ještě jen bych chtěl dodat, aby to nebylo pochopeno jinak, že mě se osobně ten výpočet zdá taky postavený nahlavu, ale statistiku jsem měl asi jen dva semestry :-)

  • Komentář Marka Pokorného jsem žel nepochopil, tzn co na to ten děkan. Já jsem na Oxfordu měl statistiku jako vedlejší předmět, na výbornou, ale už je to dávno. Zaujalo mě, jak MVCR chápe pojem náhodný výběr. V jejich materiálech totiž stojí doslova, že se jedná o „pseudonáhodný“, a sice, že se náhodně vybírají archy, ne záznamy, takže se kumulují ve vzorku posloupné záznamy. Tzn, kdyby náhodně, či dokonce účelově, přišel na přetřes arch, který je celý zmetkový, samá chyba, tak to notně pokazí výmluvnost procenta chyb. To se zřejmě ukázalo v praxi u Bobošíkové, jejíž první a druhý vzorek se liší tak nepravděpodobně od sebe ve vykázané chybovosti, že to je jako hodit 30× po sobě férovou mincí, na hlavu. Ne, že bych byl jejím stoupencem, ale ať si kandiduje, protože to co Vnitro předvedlo je holý nesmysl.
    Vraťme se k selskému rozumu. Vzorek je od toho, aby byl representativní vůči celému petičnímu objemu, a přitom méně pracný, než prošetřit celek. Pokud je v prvním vzorku chybovost x% či více, je záhodno udělat druhý, kontrolní vzorek, proto taky to je v zákoně (3% a výš). Samozřejmě že správně je to jedině pokud druhý náhodný vzorek je pořízen ze všech záznamů (první vzorek se tedy nejprve vrátí do celku). Je též z logiky věci nutné, aby náhodný výběr byl výběrem záznamů, nikoli archů, které podléhají nenáhodným souvislostem – například některé archy mohou vzniknout záškodnicky a záměrně být plné chyb.
    Nejpodezřelejší je, jak ihned vystartuje Boris Štastný s tvrzením, že přímá volba je fraška a má se zrušit. Celé to je jasně záměrná dehonestace přímé volby, politici vyhověli vůli lidu stylem chytré horákyně – zbastlili co se dalo.

  • Přestože mám k matematice vřelý vztah, tak souhlasím, že se jí v těchto případech dává zbytečně velký vliv, obzvlášť v prezidentské vol­bě.

    Je to především proto, že drtivá většina lidí má s jejím pochopením větší či menší potíž. Vzhledem k tomu, jak se neplatné podpisy vyhodnocovaly, je totiž součet procent stejně tak špatně jako jejich průměr, i když součet je skutečné hodnotě překvapivě blíž. Jde totiž o to, že v druhém vzorku se hledaly duplicitní podpisy se zohledněním prvního vzorku. Takže pokud byly v prvním vzorku duplicitní podpisy, bude jich v obou vzorcích mnohem víc, než by odpovídalo součtu duplikátů v jednotlivých vzorcích. Pravděpodobnost tohoto jevu není mikroskopicky malá, ale naopak prakticky jistá.

    Výroky jako „správně je to jedině pokud druhý náhodný vzorek je pořízen ze všech záznamů“ jsou nesmyslné, protože podpisy duplicitní v součtu vzorků to neodhalí, takže se přesného výsledku nikdy nedobereme.

    Narážky na to, že pseudonáhodný výběr celých archů místo jednotlivých podpisů nás dovede k nepřesnému výsledku, jsou rovněž liché. Měly by smysl, pokud by archy měly tisícovky podpisů, což by výsledek skutečně mohlo značně zkreslit. Nicméně např. arch Jany Bobošíkové má místo na 12 podpisů a vzorek více než 700 archů je ze statistického hlediska stále v pořádku.

    Pro čtenáře, kteří to ještě neudělali, doporučuji přečíst článek Marka Antoše, kde popisuje, jak dost možná platné podpisy byly označeny jako neplatné, jak celá skupina neplatných podpisů je prakticky neodhalitelná a především jak je možné vygenerovat „podpisy“, které by sítem prošly, přestože by jejich nositelé o svém podpisu neměli ani tušení.

    Abych se vrátil k podstatě článku – smyslem opatření bylo vyřadit kandidáty, kteří by se přihlásili jen proto, že to jde. To se povedlo. Kandidáti, kteří sehnali alespoň 50000 podpisů, by tedy k volbě podle mě měli být připuštěni. Možná jsou některé podpisy neplatné, kandidáti to ale prakticky neměli jak zjistit. Možná někdo podváděl záměrně, to ale už těžko dohledáme. Na druhou stranu se dalo vygenerovat desítky tisíc neplatných podpisů, které by ale zkoumání označilo za platné. Klonil bych se tedy k tomu mávnout nad tím rukou (rozhodnutím správního soudu, které kandidáty vrátí do hry) a nechat volbu ukázat, jestli jsou kandidáti ti praví nebo ne.

  • Pane Vráno, nestojí mi za to se z Vámi přít o pravidlech statistiky. Nejsou moje, subjektivní. Jsou na to učebnice. Když si ty chyby v pojmech nedohledáte Vy, může dohledat každý „kolemčtoucí“. Jen jako ukázku bych však uvedl, že v náhodném vzorku z populace si přejeme nalézt chybovost typickou pro onu populaci. Jenže, náhodně, mezi náhodnými vzorky nám vyjde i chybovost atypická. S mizivou pravděpodobností, vzácně, bude hodně atypická. Pokud je chybovost nízká, byť třeba atypicky, ok, je to ve prospěch kandidáta. Pokud by byla vysoká, co když jen atypicky? Je to možné statistickým způsobem ověřit. Proto má být při vyšší chybovosti, řekněme 3% a výš, odebrán druhý náhodný vzorek. Pokud první vzorek dávám dle metodiky MV stranou a nevracím jej do populace, není druhý stejně početný vzorek statisticky s tím prvním plně srovnatelný. Je hned jasné, že jde o vzorek sice v absolutním smyslu stejně velký, ale vůči populaci poměrně větší, neboť je vybírán stejně vělkou naběračkou z hrnce kde zbylo méně polévky, dovolíte li. Ta populace je již o první vzorek zeštíhlená. Vzorky nejsou navzájem náhodné, ad absurdum příklad: kdybych v prvním vzorku našel náhodou všechny chyby, v druhém pak nutně nebudou žádné. Tyto dva vzorky nejsou na sobě nezávislé. Jsou početně vlastně jeden vzorek dvojnásobně velký, odebraný ve dvou polovinách, ve dvou krcích. Jenže, druhý krok následuje jen podmíněně, dle výsledku prvního kroku. To statisticky pravděpodobnostně není totéž, jako vybrat náhodně jeden dvojnásobně velký vzorek najednou, naslepo. (Nebudu zde rozebírat proč, ale naprosto obrazně – jeden velký krok vpřed na tenký led není totéž jako dva menší kroky, druhý jen tehdy, když led nepraská. To jen k odlehčení :)
    Promiňte, že jsem nenechal Vaše ctěné úvahy bez vyjádření nesouhlasu. Račte mít poslední slovo, tentokrát definitivně.