Varianța empirică

Varianța empirică și varianța eșantionului (învechit: pătrat scattering empirică ) sau doar scurt de varianță ( latină variantia = „diversitate“ sau variare numit = „(ver) schimbarea, fie diferite“), o statistică indicație a răspândirii valorilor un eșantion și, în statistici descriptive, o cifră cheie a unui eșantion. Este una dintre măsurile de dispersie și descrie deviația pătrată medie a valorilor măsurate individuale față de media empirică . Astfel, reprezintă un fel de deviație pătrată medie.Rădăcina pozitivă a varianței empirice este deviația standard empirică . Abaterea standard empirică este cea mai comună măsură a dispersiei.

Termenii „varianță”, „varianță eșantion” și „varianță empirică” nu sunt folosiți în mod consecvent în literatura de specialitate. În general, trebuie făcută o distincție între

O delimitare și conexiuni precise pot fi găsite în secțiunea Relația dintre termenii variației .

definiție

motivare

Varianța unei dimensiuni a populației finite este o măsură a dispersiei valorilor individuale în jurul mediei populației și este definită ca

cu media populației .

Deoarece este necunoscut în situații practice și încă trebuie calculat, este adesea utilizată varianța empirică. Acest lucru este necesar mai ales atunci când în populațiile mari nu este posibil să se numere fiecare subiect din populație.

definiție

Având în vedere un eșantion de elemente . Denotă

media empirică a eșantionului. Această medie empirică este o estimare pentru media populației . Varianța empirică poate fi definită în două moduri. Fie varianța empirică a eșantionului este definită ca suma abaterilor pătrate împărțite la numărul de valori măsurate:

,

sau este definit ca o formă ușor modificată ca suma abaterilor pătrate împărțite la numărul de grade de libertate

.

Explicaţie

Varianța empirică reprezintă astfel un fel de „deviație pătrată medie” .Este un estimator pentru varianța populației . Reprezentările urmează direct din definiție

respectiv .

Această formă ușor modificată este adesea denumită varianță de eșantion și este utilizată de pachete de programe precum B. SPSS , R etc. sunt preferate. Dacă eșantionul nu prezintă variabilitate, i. H. , atunci există o varianță a . Media poate fi explicată intuitiv în loc de forma modificată a varianței empirice după cum urmează: Datorită proprietății de focalizare a mediei empirice , ultima abatere este deja determinată de prima . În consecință, numai abaterile variază liber și, prin urmare, o medie se împarte la numărul de grade de libertate .

Dacă se vorbește doar despre „varianța empirică”, trebuie acordată atenție la ce convenție sau definiție se aplică în contextul corespunzător. Nici denumirea definițiilor și nici notația corespunzătoare nu sunt uniforme în literatura de specialitate, dar termenul de varianță empirică este adesea folosit pentru forma nemodificată și termenul de varianță pentru eșantion pentru forma modificată . Există, de asemenea, notația , dar este menționată și ca sau . Unii autori se referă la abaterea medie pătratică din media empirică și variația teoretică sau varianța inductiv , spre deosebire de varianță empirice.

este la fel de imparțială și varianța eșantionului (și ca o varianță eșantionată denaturată numită) deoarece un estimator imparțial pentru varianță este.

Varianță empirică pentru datele de frecvență

Abaterea standard empirică este, de asemenea, o măsură a măsurii în care eșantionul se răspândește în medie în jurul mediei empirice. Fii frecvența absolută a evenimentelor și numărul de valori pentru adevărat, adică . Să fie în continuare frecvența relativă a , i. H. proporția de valori pentru care se aplică. Distribuția frecvenței absolute și distribuția relativă a frecvenței sunt adesea rezumate într-un tabel de frecvențe . Caracteristicile împreună cu frecvențele sau sunt, de asemenea, denumite date de frecvență . Pentru datele de frecvență cu caracteristicile și frecvențele relative , varianța empirică este calculată după cum urmează

,

cu .

Reguli de calcul

Comportamentul în transformări

Varianța nu se modifică atunci când datele sunt deplasate cu o valoare constantă c, așa și , așa este

la fel .

Dacă sunt scalate de un factor , se aplică următoarele

la fel .

Reprezentări alternative

Ca pătrat mediu al abaterii

Variația în analiza varianței de multe ori ca „mediu“ sau deviație „medie“ la pătrat menționată

.

Pătratele medii ale deviațiilor variabilelor respective sunt rezumate într-un așa-numit tabel de analiză a varianței.

Reprezentare prin bloc de deplasare

O altă reprezentare poate fi obținută din teorema deplasării , conform căreia

se aplică. Înmulțirea cu vă oferă

,

De la ce

urmează.

Reprezentare fără mijloace empirice

O altă reprezentare care se descurcă fără utilizarea mediei empirice este

sau.

.

Dacă puneți media aritmetică a valorilor observate în sumandurile sumei duble

adaugă și scade (adică inserează zero), apoi se aplică

.

Acest lucru este echivalent cu

.

Termeni derivați

Abaterea standard empirică

Deviația standard empiric, de asemenea , cunoscut sub numele de varianță proba sau proba deviație standard , este pozitiv rădăcina pătrată a varianței empirică, adică

sau

.

Spre deosebire de varianța empirică, abaterea standard empirică are aceleași unități ca media empirică sau eșantionul în sine. La fel ca și varianța empirică, denumirea și desemnarea abaterii standard empirice nu sunt uniforme. Abaterea standard empirică ar trebui să se distingă de abaterea standard în ceea ce privește teoria probabilității . Acesta este un indicator al unei distribuții de probabilitate sau al unei variabile aleatorii , în timp ce abaterea standard empirică este un indicator al unui eșantion.

Coeficientul de variație empiric

Coeficientul empiric de variație este o măsură adimensională dispersiei și este definită ca deviația standard empirică împărțită la empirică medie, adică

Spre deosebire de abaterea standard, există o varianță adimensională și, prin urmare, nu este supusă unităților. Avantajul său este că este exprimat ca procent din media empirică .

exemplu

Eșantionul este dat

,

așa este . Pentru rezultatele valorii medii empirice

.

În cazul unui calcul fragmentar, rezultatul

.

Prima definiție vă oferă

întrucât a doua definiție

,

provizii. Abaterea standard poate fi de asemenea calculată folosind exemplul de varianță de mai sus. Acest lucru se face prin simpla tragere a rădăcinilor. Dacă se determină varianța eșantionului necorectat, atunci (conform primei definiții)

.

Cu toate acestea, dacă deviația standard empirică este determinată prin varianța corectată a eșantionului, atunci (conform celei de-a doua definiții)

.

Originea diferitelor definiții

Definiția lui corespunde definiției varianței empirice ca deviație pătrată medie a rădăcinii de la media empirică. Aceasta se bazează pe ideea definirii unui grad de dispersie în jurul mediei empirice. Fie . O primă abordare este de a aduna diferența dintre valorile măsurate și media empirică. asta duce la

Cu toate acestea, acest lucru are ca rezultat întotdeauna 0, deoarece sumandurile pozitive și negative se anulează reciproc ( proprietatea centrului de greutate ), deci nu este adecvat pentru cuantificarea varianței. Pentru a obține o valoare pentru varianța mai mare sau egală cu 0, se poate calcula, de exemplu, cu cantitățile diferențelor, adică suma abaterilor absolute

considerați sau pătrat, adică suma pătratelor

formă. Cu toate acestea, acest lucru are ca efect secundar că abaterile mai mari de la media empirică sunt ponderate mai mult. Ca rezultat, valorile aberante individuale au, de asemenea, un impact mai puternic. Pentru a face gradul de dispersie independent de numărul de valori măsurate în eșantion, acesta este împărțit la acest număr. Rezultatul acestei măsuri de dispersie derivată pragmatic este deviația pătrată medie de la media empirică sau varianța definită mai sus .

Definiția lui își are rădăcinile în teoria estimării . Acolo va

folosit ca un estimator imparțial pentru varianța necunoscută a unei distribuții de probabilitate . Acest lucru este adevărat datorită următoarei teoreme: Dacă există variabile aleatorii independente și distribuite identic cu și , atunci se aplică . Prin urmare, există un estimator pentru varianța necunoscută a populației .

Dacă acum se trece de la variabilele aleatoare la realizări , valoarea estimată se obține din funcția de estimare abstractă . Raportul dintre to corespunde astfel raportului dintre o funcție și valoarea funcției sale la un moment dat .

Astfel, poate fi văzută ca o măsură practică motivată a dispersiei în statisticile descriptive, în timp ce o estimare pentru o varianță necunoscută este în statisticile inductive. Aceste origini diferite justifică modul de vorbire menționat mai sus pentru varianță empirică și pentru varianță inductivă sau varianță teoretică. Trebuie remarcat faptul că poate fi interpretat și ca o estimare a unei funcții de estimare. Când se utilizează metoda momentului , se obține ca funcție de estimare a varianței

.

Realizarea ta corespunde . Cu toate acestea, de obicei nu este utilizat deoarece nu îndeplinește criteriile comune de calitate . Acest estimator nu este corect față de așteptări , din cauza

.

Relația conceptelor de varianță

După cum sa menționat deja în introducere, există diferiți termeni de varianță, dintre care unii au același nume. Relația lor între ei devine clară atunci când se ia în considerare rolul lor în modelarea statisticilor inductive:

Cheia este diferența dintre metoda de estimare (varianța eșantionului în sensul statisticilor inductive) și estimarea sa concretă (varianța empirică). Corespunde diferenței dintre o funcție și valoarea funcției acesteia.

Varianța anualizată

În teoria pieței financiare , varianțe sau volatilități a se întoarce sunt adesea calculate. Aceste variații, dacă se bazează pe date zilnice, trebuie anualizate; H. poate fi extrapolat la un an. Acest lucru se face folosind un factor de anualizare (există în jur de zile de tranzacționare pe an ). Volatilitatea poate fi astfel estimată ca rădăcina varianței anualizate

.

Dovezi individuale

  1. Norbert Henze: Stochastics pentru începători . O introducere în fascinanta lume a întâmplării. Ediția a 10-a. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31 , doi : 10.1007 / 978-3-658-03077-3 .
  2. a b Ehrhard Behrends: elementari stochastici . O carte de învățare - co-dezvoltată de studenți. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274 , doi : 10.1007 / 978-3-8348-2331-1 .
  3. Thomas Cleff: statistici descriptive și analiza datelor exploratorii . O introducere computerizată cu Excel, SPSS și STATA. Ediția a 3-a, revizuită și extinsă. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 56 , doi : 10.1007 / 978-3-8349-4748-2 .
  4. ^ Ludwig Fahrmeir, Rita artist, Iris Pigeot, Gerhard Tutz: Statistics. Calea către analiza datelor. 8., revizuit. și ediție suplimentară. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65
  5. a b Helge Toutenburg, Christian Heumann: statistici descriptive . Ediția a 6-a. Springer-Verlag, Berlin / Heidelberg 2008, ISBN 978-3-540-77787-8 , pp. 75 , doi : 10.1007 / 978-3-540-77788-5 .
  6. Thomas Cleff: statistici descriptive și analiza datelor exploratorii . O introducere computerizată cu Excel, SPSS și STATA. Ediția a 3-a, revizuită și extinsă. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 255 , doi : 10.1007 / 978-3-8349-4748-2 .
  7. Capitolul 10: Estimatori neașteptați (fișier PDF), www.alt.mathematik.uni-mainz.de, accesat la 31 decembrie 2018
  8. ^ Ludwig Fahrmeir , Rita artist, Iris Pigeot , Gerhard Tutz : Statistics. Calea către analiza datelor. 8., revizuit. și ediție suplimentară. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65.
  9. Este și așa
    din care urmează revendicarea.
  10. Acest lucru urmează ca mai sus prin recalculare directă.
  11. Werner Timischl : Statistici aplicate. O introducere pentru biologi și profesioniștii din domeniul medical. 2013, ediția a III-a, p. 109.
  12. Lothar Sachs : Metode de evaluare statistică , p. 400.
  13. ^ Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: statistici descriptive . Noțiuni de bază - metode - exemple - sarcini. Ediția a 6-a. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0 , pp. 122 , doi : 10.1007 / 978-3-658-13640-6 .
  14. a b Norbert Henze: Stochastics pentru începători . O introducere în fascinanta lume a întâmplării. Ediția a 10-a. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31-32 , doi : 10.1007 / 978-3-658-03077-3 .
  15. a b Ehrhard Behrends: elementari stochastici . O carte de învățare - co-dezvoltată de elevi. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274-275 , doi : 10.1007 / 978-3-8348-2331-1 .
  16. Werner Timischl: Statistici aplicate. O introducere pentru biologi și profesioniștii din domeniul medical. 2013, ediția a III-a, p. 109.
  17. Norbert Henze: Stochastics pentru începători . O introducere în fascinanta lume a întâmplării. Ediția a 10-a. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 33 , doi : 10.1007 / 978-3-658-03077-3 .
  18. ^ Otfried Beyer, Horst Hackel: Calcul de probabilitate și statistici matematice. 1976, p. 123.