Cuantile empirice

Un ( -) cuantil empiric , numit pur și simplu cuantil pe scurt , este o figură cheie a unui eșantion în statistici . Pentru fiecare număr între 0 și 1, în termeni simplificați, o cuantilă empirică împarte eșantionul astfel încât o porțiune a eșantionului să fie mai mică decât cuantila empirică și o porțiune a eșantionului să fie mai mare decât cuantila empirică . De exemplu, dacă este dat un eșantion de dimensiuni de pantofi, cuantila empirică 0,35 este acea dimensiune de pantof , astfel încât 35% din dimensiunile de pantofi din eșantion sunt mai mici decât și 65% mai mari decât .

Unele cuantile empirice au nume proprii. Acestea includ mediana ( ), quartila superioară și quartila inferioară, precum și tercilele , chintilele , decilele și percentilele .

Cuantilele (în sensul teoriei probabilității ) trebuie să se distingă de cuantilele empirice discutate aici . Aceștia sunt indicatori ai unei distribuții de probabilitate și deci a unei funcții abstracte (cantitative) (similare valorii așteptate ), în timp ce cuantilele empirice sunt indicatori ai unui eșantion (similar cu media aritmetică ).

definiție

Denotă funcția de rotunjire . Rotunjește fiecare număr până la cel mai apropiat număr întreg mai mic. Deci, de exemplu, și .

Având în vedere un eșantion de mărime , ale cărui elemente sunt ordonate în funcție de mărime. Aceasta înseamnă că se aplică

.

Atunci înseamnă pentru un număr

cuantila empirică a .

Există câteva definiții care diferă de definiția dată aici.

exemplu

Următorul eșantion este format din zece numere întregi aleatorii (extrase din numerele cuprinse între zero și o sută, prevăzute cu distribuția uniformă discretă ):

Sortarea furnizează eșantionul

.

Este .

Căci unul primește . Deoarece acesta este un număr întreg, se ajunge la definiție

Căci unul primește . Funcția de rotunjire oferă apoi și astfel

.

În mod analog, obținem pentru direct și , prin urmare, este

.

Spre deosebire de media aritmetică, cuantila empirică este robustă împotriva valorilor aberante. Aceasta înseamnă că, dacă înlocuiți valorile unui eșantion de mai sus (sau de mai jos) o anumită cuantilă cu o valoare de mai sus (sau de mai jos) cuantila, cuantila în sine nu se schimbă. Aceasta se bazează pe faptul că cuantilele sunt determinate numai de ordinea lor și, prin urmare, de poziția lor una față de cealaltă și nu de valorile numerice specifice ale eșantionului. În cazul eșantionului de mai sus, aceasta ar fi media aritmetică . Dacă modificați acum cea mai mare valoare a eșantionului, de exemplu, seturile

,

la fel este , în timp ce mediana și quartilele inferioară și superioară rămân neschimbate, deoarece ordinea eșantionului nu sa schimbat.

Cuantile speciale

Pentru anumite valori, cuantilele corespunzătoare au nume proprii. Acestea sunt prezentate pe scurt aici mai jos. Trebuie remarcat faptul că cuantilele corespunzătoare ale distribuțiilor de probabilitate sunt uneori menționate cu aceleași nume proprii.

Median

Mediana este cuantila și astfel împarte proba în două jumătăți: o jumătate este mai mică decât mediana, cealaltă jumătate este mai mare decât mediana. Împreună cu modul și media aritmetică, este un parametru important de localizare în statisticile descriptive.

Tercile

Cele două -quantile pentru și sunt denumite treimi . Împărțiți eșantionul în trei părți egale: o parte este mai mică decât treimea inferioară (= -quantilă), o parte este mai mare decât treimea superioară (= -quantilă) și o parte se află între treimi.

Quartile

Cele două cuantile cu și sunt denumite quartile . -Quantile se numește quartile - urile aferente inferior și -quantile se numește quartila superioară. Jumătate din eșantion se află între cuartila superioară și inferioară, un sfert din eșantion se află sub cuartila inferioară și deasupra cuartilei superioare. Gama intercuartilă , o măsură a dispersiei, este definită pe baza quartilelor .

Quintile

Cele patru cuantile sunt denumite quintile . În consecință, 20% din eșantion este sub prima chintilă și 80% peste, 40% din eșantion este sub a doua chintilă și 60% peste, etc.

Decile

Cuantilele pentru multipli ai , adică pentru, se numesc decile. -Quantile se numește prima decimă, -quantile este al doilea decilei etc. Mai jos prima decimă este de 10% din eșantion, peste 90% corespunzătoare eșantionului. La fel, 40% din eșantion se află sub decila a patra și 60% peste.

Percentilă

Percentilele sunt cuantilele de la la în pași de .

Termeni derivați

Anumite măsuri de dispersie pot fi derivate din cuantile . Cea mai importantă este gama interquartile (English interquartile range )

.

Acesta indică cât de departe sunt quartile superioare și inferioare și, prin urmare, cât de largă este gama în care se află 50% din mijlocul eșantionului. Distanța (inter) cuantilă poate fi definită oarecum mai general decât pentru . Indică cât de largă este zona în care se află cele din mijloc ale eșantionului. Căci corespunde gamei interquartile.

O altă măsură derivată a răspândirii este deviația absolută medie de la mediană .

prezentare

Complotul cutiei unui eșantion

Un mod de a reprezenta cuantilele este graficul cutiei . Întreaga probă este reprezentată de o cutie cu două antene. Limitele exterioare ale cutiei sunt, respectiv, quartile superioare și inferioare. Aceasta înseamnă că jumătate din eșantion se află în cutie. Cutia în sine este subdivizată din nou, linia de separare este mediana eșantionului. Antenele nu sunt definite uniform. O posibilitate este de a alege prima și a noua decilă pentru a limita antenele.

Dovezi individuale

  1. Norbert Henze: Stochastics pentru începători . O introducere în fascinanta lume a întâmplării. Ediția a 10-a. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 30 , doi : 10.1007 / 978-3-658-03077-3 .
  2. Eric W. Weisstein : Quantile . În: MathWorld (engleză).
  3. Eric W. Weisstein : Interquartile Range . În: MathWorld (engleză).