Bernsteinovy nerovnosti

Autor: MILAN

Představme si, že pracujete v továrně, která vyrábí třeba míče. Tyto míče by měly mít určitou velikost, ale občas se stane, že některé jsou trochu menší nebo trochu větší.

Chcete zjistit, jak velký je rozdíl mezi velikostí míčů, které továrna vyrábí, a standardní velikostí, kterou očekáváte. Ale míče se vyrábějí tak rychle, že nemáte čas změřit každý z nich. Místo toho vezmete náhodně několik míčů a změříte jejich velikost. Potom tyto výsledky porovnáte se standardní velikostí. To vám dá určitý odhad toho, jak moc se skutečná velikost míčů liší od očekávané.

Bernsteinovy nerovnosti vám umožní odhadnout, jak moc se tento odhad může lišit od skutečnosti, když se podíváte na více nebo méně míčů. Jinými slovy, Bernsteinovy nerovnosti vám poskytují nástroj pro odhadnutí, jak jistí můžete být výsledky svých měření, vzhledem k tomu, kolik míčů jste změřili.

Na základě toho pak můžete udělat informovaná rozhodnutí - například, zda je potřeba zlepšit proces výroby míčů, nebo zda jsou míče dostatečně blízko standardu, ať už jste změřili málo nebo mnoho míčů.

Představte si, že máte n náhodných veličin X1, X2, ..., Xn, které jsou nezávislé a mají očekávanou hodnotu nula. Dále si představte, že máte nějakou konstantu v, která je nejvyšší hodnotou, kterou mohou tyto náhodné veličiny nabýt.

Bernsteinova nerovnost nám potom říká následující. Pravděpodobnost, že součet těchto náhodných veličin přesáhne nějakou hodnotu t, je menší nebo rovna 

e^( -t^2 / (2nσ^2 + 2vt/3) ), 

kde e je Eulerovo číslo, σ^2 je rozptyl náhodných veličin (míra, jak moc se jednotlivé hodnoty liší od průměru), a t je hodnota, kterou určíme.

Ve vzorci je tedy důležitá:

  • e: je to základ přirozených logaritmů, který se v matematice a statistice často používá.
  • t: je to hodnota, kterou si sami zvolíme. Může to být například rozdíl, který jsme ochotni akceptovat mezi naším odhadem a skutečností.
  • σ^2: je to rozptyl našich náhodných veličin. Je to ukazatel, jak moc se naše měření liší od průměru.
  • n: je to počet náhodných veličin, které máme k dispozici.
  • v: je to maximum, které mohou naše náhodné veličiny nabýt.

Výsledek, který dostaneme, je tedy pravděpodobnost, že součet našich náhodných veličin bude větší než t. Je to míra, jak moc si můžeme být jisti, že naše odhady nebudou příliš vzdálené od skutečnosti.


Příkald 1.

Můžeme například zkoumat velikosti jablka v sadu. Chceme zjistit pravděpodobnost, že průměrná velikost jablka v sadu je o více než 1cm větší než skutečný průměr.

  1. Nejprve musíme definovat naše proměnné:

    • n: Počet jablek, které měříme.
    • σ^2: To je rozptyl našich měření. Můžeme ho například spočítat jako rozdíl mezi velikostí každého jablka a průměrnou velikostí, umocněný na druhou a poté všechny tyto hodnoty sečíst a vydělit počtem jablek.
    • v: To je maximum, které může velikost jablka nabýt. Předpokládejme, že největší jablko, které jsme kdy viděli, mělo 10 cm na průměru.
    • t: To je hodnota, kterou si sami zvolíme. V našem případě chceme zjistit pravděpodobnost, že průměrná velikost jablka je o více než 1cm větší než skutečný průměr.

Nyní můžeme použít vzorec pro Bernsteinovu nerovnost a spočítat pravděpodobnost. Představme si, že máme R skript, který to udělá za nás. Počítat to nemusíte. 

Program za nás vše spočítá. Výsledek je následující.

[1] 0.9997537. 

Co to znamená? Připomeňme si, že náš cíl byl zjistit pravděpodobnost, že průměrná velikost jablka v sadu přesahuje skutečný průměr o více než 1 cm. Bernsteinova nerovnost nám dala odhad této pravděpodobnosti.

V našem případě, pokud je tato pravděpodobnost téměř 1, znamená to, že je velmi nepravděpodobné, že průměrná velikost jablka v sadu by přesáhla skutečný průměr o více než 1 cm. Jinými slovy, naše měření a odhady velikosti jablek jsou dostatečně přesné a nemusíme se obávat velkých odchylek.