Předpokládejme, že máme k dispozici realizaci
náhodného výběru
z
. Obor hodnot
náhodné veličiny
rozdělíme na
disjunktních tříd
- a to
následovně:
1. Je-li diskrétní náhodná veličina, volíme za třídy
jednotlivé body
oboru hodnot
. Mluvíme o tzv. prostém třídění.
2. Je-li spojitá náhodná veličina, volíme za třídy
intervaly.
Mluvíme o tzv. skupinovém třídění.
Při třídění pak dodržujeme určitá pravidla. Např.
a) V případě skupinového třídění se doporučuje, aby intervaly měly
stejnou délku a aby hranice a středy tříd byly zaokrouhlená čísla.
b) Vyskytuje-li se v hraničních třídách velmi málo hodnot, je často vhodné spojit tyto třídy (nebo třídu) se sousední třídou v třídu jedinou.
c) Doporučuje se, aby počet výsledných tříd byl 5-20 podle rozsahu
výběru
(pokud je to možné). Podle
Sturgesova pravidla by pro počet
tříd mělo platit
Označme dále počet hodnot, které padly do třídy
. Číslo
nazýváme
absolutní četnost třídy
.
Zřejmě
Označme nyní počet prvků, resp. délku třídy
v případě prostého, resp. skupinového
třídění. Definujme reálnou funkci
předpisem
V případě prostého třídění je
V případě skupinového třídění je součet obsahů obdélníků v histogramu (tj.
obsah obrazce ohraničeného osou a histogramem) roven jedné. Tedy
Častěji se používá histogram relativních
četností, resp. absolutních
četností, kdy se na osu nanesou třídy
a nad každou třídou se
sestrojí "obdélník" o výšce rovné relativní, resp. absolutní
četnosti třídy
. Horní obrys těchto obdélníků je pak histogram relativních, resp.
absolutních četností. Nevýhodou těchto histogramů je, že pozbývají vlastnosti
rozdělovacích funkcí. Tak např. v případě skupinového třídění nemusí být
obsah plochy mezi histogramem relativních četností a osou
roven jedné.
Chceme-li mít orientační představu o tvaru teoretické rozdělovací funkce,
stačí ale tyto histogramy sestrojit.
Uvědomme si, že jsme pracovali s
realizací náhodného výběru z a tudíž
, resp.
byly vlastně
realizace náhodných veličin
, resp.
a pro každou realizaci náhodného
výběru z
dostaneme
obecně jiné realizace
a tudíž i jiné histogramy. (Nehledě na to,
ze samotné třídění je subjektivní a tudíž pro jedinou realizaci můžeme
dostat
různé histogramy.)