Cuprins
În acest tutorial, vom vedea cum să facem analiza de varianță Excel și ce formule să folosim pentru a găsi varianța unui eșantion și a unei populații.
Varianța este unul dintre cele mai utile instrumente din teoria probabilităților și statistică. În știință, descrie cât de departe este fiecare număr din setul de date de medie. În practică, arată adesea cât de mult se schimbă ceva. De exemplu, temperatura din apropierea ecuatorului are o varianță mai mică decât în alte zone climatice. În acest articol, vom analiza diferite metode de calculare a varianței în Excel.
Ce este variația?
Variație este măsura de variabilitate a unui set de date care indică cât de mult sunt răspândite valorile diferite. Din punct de vedere matematic, se definește ca fiind media diferențelor pătratice față de medie.
Pentru a înțelege mai bine ce calculați de fapt cu varianța, vă rugăm să luați în considerare acest exemplu simplu.
Să presupunem că în grădina zoologică locală există 5 tigri care au 14, 10, 8, 6 și 2 ani.
Pentru a găsi varianta, urmați acești pași simpli:
- Calculați media (media simplă) a celor cinci numere:
- Din fiecare număr, scădeți media pentru a afla diferențele. Pentru a vizualiza acest lucru, să reprezentăm diferențele pe grafic:
- Înscrieți la pătrat fiecare diferență.
- Calculați media diferențelor la pătrat.
Așadar, variația este de 16. Dar ce înseamnă de fapt acest număr?
În realitate, varianța vă oferă doar o idee foarte generală despre dispersia setului de date. O valoare de 0 înseamnă că nu există variabilitate, adică toate numerele din setul de date sunt identice. Cu cât numărul este mai mare, cu atât datele sunt mai dispersate.
Acest exemplu se referă la varianța populației (adică 5 tigri reprezintă întregul grup care vă interesează). Dacă datele dvs. reprezintă o selecție dintr-o populație mai mare, atunci trebuie să calculați varianța eșantionului utilizând o formulă ușor diferită.
Cum se calculează varianța în Excel
Există 6 funcții încorporate pentru a realiza variații în Excel: VAR, VAR.S, VARP, VAR.P, VAR.P, VARA și VARPA.
Alegerea formulei de variație este determinată de următorii factori:
- Versiunea de Excel pe care o utilizați.
- Dacă se calculează varianța eșantionului sau a populației.
- Dacă doriți să evaluați sau să ignorați valorile text și logice.
Funcții de variație Excel
Tabelul de mai jos oferă o prezentare generală a funcțiilor de variație disponibile în Excel pentru a vă ajuta să alegeți formula cea mai potrivită pentru nevoile dumneavoastră.
Nume | Versiunea Excel | Tipul de date | Text și logice |
VAR | 2000 - 2019 | Exemplu | Ignorat |
VAR.S | 2010 - 2019 | Exemplu | Ignorat |
VARA | 2000 - 2019 | Exemplu | Evaluat |
VARP | 2000 - 2019 | Populația | Ignorat |
VAR.P | 2010 - 2019 | Populația | Ignorat |
VARPA | 2000 - 2019 | Populația | Evaluat |
VAR.S vs. VARA și VAR.P vs. VARPA
VARA și VARPA diferă de alte funcții de variație doar prin modul în care tratează valorile logice și textuale din referințe. Tabelul următor oferă un rezumat al modului în care sunt evaluate reprezentările textuale ale numerelor și ale valorilor logice.
Argument Tip | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Valorile logice în cadrul array-urilor și referințelor | Ignorat | Evaluat (TRUE=1, FALSE=0) |
Reprezentări textuale ale numerelor în matrice și referințe | Ignorat | Evaluat ca fiind zero |
Valori logice și reprezentări text ale numerelor tastate direct în argumente | Evaluat (TRUE=1, FALSE=0) | |
Celule goale | Ignorat |
Cum se calculează varianța eșantionului în Excel
A eșantion este un set de date extrase din întreaga populație. Iar varianța calculată dintr-un eșantion se numește varianța eșantionului .
De exemplu, dacă doriți să aflați cum variază înălțimea oamenilor, ar fi imposibil din punct de vedere tehnic să măsurați fiecare persoană de pe pământ. Soluția este de a lua un eșantion din populație, de exemplu 1 000 de persoane, și de a estima înălțimea întregii populații pe baza acelui eșantion.
Varianța eșantionului se calculează cu această formulă:
Unde:
- x̄ este media (media simplă) a valorilor eșantionului.
- n este dimensiunea eșantionului, adică numărul de valori din eșantion.
Există 3 funcții pentru a găsi varianța eșantionului în Excel: VAR, VAR.S și VARA.
Funcția VAR în Excel
Este cea mai veche funcție Excel pentru a estima varianța pe baza unui eșantion. Funcția VAR este disponibilă în toate versiunile Excel 2000 până în 2019.
VAR(număr1, [număr2], ...)Notă. În Excel 2010, funcția VAR a fost înlocuită cu VAR.S, care oferă o acuratețe îmbunătățită. Deși VAR este încă disponibilă pentru compatibilitate retroactivă, se recomandă utilizarea VAR.S în versiunile actuale de Excel.
Funcția VAR.S în Excel
Este omologul modern al funcției VAR din Excel. Utilizați funcția VAR.S pentru a găsi varianța eșantionului în Excel 2010 și ulterior.
VAR.S(număr1, [număr2], ...)Funcția VARA în Excel
Funcția Excel VARA returnează un eșantion de varianță bazat pe un set de numere, text și valori logice, așa cum se arată în acest tabel.
VARA(valoare1, [valoare2], ...)Exemplu de formulă de variație în Excel
Atunci când lucrați cu un set de date numerice, puteți utiliza oricare dintre funcțiile de mai sus pentru a calcula varianța eșantionului în Excel.
Ca exemplu, să găsim varianța unui eșantion format din 6 elemente (B2:B7). Pentru aceasta, puteți utiliza una dintre formulele de mai jos:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
După cum se arată în captura de ecran, toate formulele returnează același rezultat (rotunjit la 2 zecimale):
Pentru a verifica rezultatul, să efectuăm manual calculul var:
- Găsiți media folosind funcția AVERAGE:
=MEDIA(B2:B7)
Media se duce în orice celulă goală, de exemplu B8.
- Scădeți media din fiecare număr din eșantion:
=B2-$B$8
Diferențele se trec în coloana C, începând cu C2.
- Se ridică la pătrat fiecare diferență și se trec rezultatele în coloana D, începând cu D2:
=C2^2
- Adunați diferențele la pătrat și împărțiți rezultatul la numărul de elemente din eșantion minus 1:
=SUMA(D2:D7)/(6-1)
După cum puteți vedea, rezultatul calculului nostru manual var este exact același cu numărul returnat de funcțiile încorporate în Excel:
În cazul în care setul de date conține Boolean și/sau text VAR și VAR.S ignoră orice alte valori decât numere în referințe, în timp ce VARA evaluează valorile textului ca fiind zerouri, TRUE ca 1 și FALSE ca 0. Prin urmare, alegeți cu atenție funcția de varianță pentru calculele dumneavoastră în funcție de faptul că doriți să procesați sau să ignorați textul și valorile logice.
Cum se calculează varianța populației în Excel
Populația reprezintă toți membrii unui anumit grup, adică toate observațiile din domeniul de studiu. Variația populației descrie modul în care sunt repartizate punctele de date din întreaga populație.
Varianța populației poate fi găsită cu această formulă:
Unde:
- x̄ este media populației.
- n este dimensiunea populației, adică numărul total de valori din populație.
Există 3 funcții pentru a calcula varianța populației în Excel: VARP, VAR.P și VARPA.
Funcția VARP în Excel
Funcția Excel VARP returnează varianța unei populații pe baza întregului set de numere. Este disponibilă în toate versiunile de Excel 2000 până în 2019.
VARP(număr1, [număr2], ...)Notă. În Excel 2010, VARP a fost înlocuită cu VAR.P, dar este păstrată pentru compatibilitate retroactivă. Se recomandă utilizarea VAR.P în versiunile actuale de Excel, deoarece nu există nicio garanție că funcția VARP va fi disponibilă în versiunile viitoare de Excel.
Funcția VAR.P în Excel
Este o versiune îmbunătățită a funcției VARP disponibilă în Excel 2010 și versiunile ulterioare.
VAR.P(număr1, [număr2], ...)Funcția VARPA în Excel
Funcția VARPA calculează varianța unei populații pe baza întregului set de numere, text și valori logice. Este disponibilă în toate versiunile de Excel 2000 până în 2019.
VARA(valoare1, [valoare2], ...)Formula de variație a populației în Excel
În exemplul de calculare a var, am găsit o varianță a 5 note la examen, presupunând că acele note au fost o selecție dintr-un grup mai mare de studenți. Dacă colectați date despre toți studenții din grup, acele date vor reprezenta întreaga populație și veți calcula o varianță a populației folosind funcțiile de mai sus.
Să presupunem că avem notele la examen ale unui grup de 10 studenți (B2:B11). Notele constituie întreaga populație, așa că vom face varianța cu aceste formule:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
Și toate formulele vor returna un rezultat identic:
Pentru a vă asigura că Excel a efectuat corect variația, puteți verifica cu formula de calcul manual al variației, prezentată în imaginea de mai jos:
În cazul în care unii dintre studenți nu au susținut examenul și au N/A în loc de un număr de punctaj, funcția VARPA va returna un rezultat diferit. Motivul este că VARPA evaluează valorile text ca fiind zerouri, în timp ce VARP și VAR.P ignoră valorile text și logice în referințe. Pentru detalii complete, consultați VAR.P vs. VARPA.
Formula de variație în Excel - note de utilizare
Pentru a face corect analiza variației în Excel, vă rugăm să urmați aceste reguli simple:
- Furnizați argumentele sub formă de valori, array-uri sau referințe de celule.
- În Excel 2007 și versiunile ulterioare, puteți furniza până la 255 de argumente corespunzătoare unui eșantion sau unei populații; în Excel 2003 și versiunile mai vechi - până la 30 de argumente.
- Pentru a evalua numai numere în referințe, ignorând celulele goale, textul și valorile logice, utilizați funcția VAR sau VAR.S pentru a calcula varianța eșantionului și VARP sau VAR.P pentru a afla varianța populației.
- Pentru a evalua logic și text în referințe, utilizați funcția VARA sau VARPA.
- Furnizați cel puțin două valori numerice la o formulă de varianță a eșantionului și cel puțin o valoare numerică la o formulă de varianță a populației în Excel, în caz contrar apare o eroare #DIV/0!
- Argumentele care conțin text care nu poate fi interpretat ca numere cauzează erori #VALUE!.
Varianța vs. abaterea standard în Excel
Varianța este, fără îndoială, un concept util în știință, dar oferă foarte puține informații practice. De exemplu, am găsit vârstele populației de tigri dintr-o grădină zoologică locală și am calculat varianța, care este egală cu 16. Întrebarea este - cum putem folosi efectiv acest număr?
Puteți utiliza varianța pentru a calcula abaterea standard, care este o măsură mult mai bună a gradului de variație dintr-un set de date.
Abaterea standard se calculează ca rădăcina pătrată a varianței. Deci, luăm rădăcina pătrată a lui 16 și obținem abaterea standard de 4.
În combinație cu media, abaterea standard vă poate spune ce vârstă au majoritatea tigrilor. De exemplu, dacă media este 8 și abaterea standard este 4, majoritatea tigrilor din grădina zoologică au între 4 ani (8 - 4) și 12 ani (8 + 4).
Microsoft Excel dispune de funcții speciale pentru a calcula abaterea standard a unui eșantion și a unei populații. Explicația detaliată a tuturor funcțiilor poate fi găsită în acest tutorial: Cum se calculează abaterea standard în Excel.
Iată cum se face variația în Excel. Pentru a vedea mai îndeaproape formulele discutate în acest tutorial, vă invităm să descărcați exemplul nostru de registru de lucru de la sfârșitul acestei postări. Vă mulțumesc pentru lectură și sper să ne revedem pe blog săptămâna viitoare!
Caiet de practică
Calculați varianța în Excel - exemple (fișier .xlsx)