Deviazione standard in Excel: funzioni ed esempi di formule

  • Condividi Questo
Michael Brown

Il tutorial spiega l'essenza della deviazione standard e dell'errore standard della media, nonché la formula migliore da utilizzare per calcolare la deviazione standard in Excel.

In statistica descrittiva, la media aritmetica (detta anche media) e la deviazione standard sono due concetti strettamente correlati, ma mentre la prima è ben compresa dai più, la seconda lo è da pochi. Lo scopo di questo tutorial è quello di fare luce su cosa sia effettivamente la deviazione standard e su come calcolarla in Excel.

    Che cos'è la deviazione standard?

    Il deviazione standard è una misura che indica quanto i valori dell'insieme di dati si discostano (si diffondono) dalla media. In altre parole, la deviazione standard mostra se i dati sono vicini alla media o se fluttuano molto.

    Lo scopo della deviazione standard è quello di aiutare a capire se la media restituisce davvero un dato "tipico". Quanto più la deviazione standard è vicina allo zero, tanto più bassa è la variabilità dei dati e tanto più affidabile è la media. Una deviazione standard pari a 0 indica che ogni valore del set di dati è esattamente uguale alla media. Quanto più alta è la deviazione standard, tanto maggiore è la variazione dei dati.dati e meno accurata è la media.

    Per avere un'idea più precisa di come funziona, date un'occhiata ai dati seguenti:

    Per Biologia, la deviazione standard è pari a 5 (arrotondata a un numero intero), il che ci dice che la maggior parte dei punteggi non si discosta più di 5 punti dalla media. È un dato positivo? Sì, indica che i punteggi di Biologia degli studenti sono piuttosto coerenti.

    Per la matematica, la deviazione standard è pari a 23. Ciò dimostra che c'è un'enorme dispersione (spread) nei punteggi, il che significa che alcuni studenti hanno ottenuto risultati molto migliori e/o altri molto peggiori rispetto alla media.

    In pratica, la deviazione standard è spesso utilizzata dagli analisti aziendali come misura del rischio di investimento: maggiore è la deviazione standard, maggiore è la volatilità dei rendimenti.

    Deviazione standard del campione vs. deviazione standard della popolazione

    In relazione alla deviazione standard, si sentono spesso i termini "campione" e "popolazione", che si riferiscono alla completezza dei dati con cui si lavora. La differenza principale è la seguente:

    • Popolazione include tutti gli elementi di un set di dati.
    • Campione è un sottoinsieme di dati che include uno o più elementi della popolazione.

    Ricercatori e analisti utilizzano la deviazione standard di un campione e di una popolazione in situazioni diverse. Per esempio, quando si riassumono i punteggi degli esami di una classe di studenti, un insegnante utilizzerà la deviazione standard della popolazione. Gli statistici che calcolano il punteggio medio nazionale del SAT utilizzeranno la deviazione standard del campione perché hanno a disposizione solo i dati di un campione, non quelli di una popolazione.dall'intera popolazione.

    Comprendere la formula della deviazione standard

    Il motivo per cui la natura dei dati è importante è che la deviazione standard della popolazione e la deviazione standard del campione sono calcolate con formule leggermente diverse:

    Deviazione standard del campione

    Deviazione standard della popolazione

    Dove:

    • x i sono valori individuali nell'insieme dei dati
    • x è la media di tutti i x valori
    • n è il numero totale di x valori nel set di dati

    Se non riuscite a capire le formule, la suddivisione in semplici passaggi potrebbe aiutarvi. Ma prima di tutto, lasciateci lavorare su alcuni dati di esempio:

    1. Calcolare la media

    Per prima cosa, si trova la media di tutti i valori dell'insieme di dati ( x Quando si calcola a mano, si sommano i numeri e poi si divide la somma per il numero di quei numeri, come in questo caso:

    (1+2+4+5+6+8+9)/7=5

    Per trovare la media in Excel, utilizzare la funzione MEDIA, ad esempio =Media(A2:G2)

    2. Per ogni numero, sottrarre la media e elevare al quadrato il risultato.

    Questa è la parte della formula della deviazione standard che dice: ( x i - x )2

    Per visualizzare ciò che sta accadendo, date un'occhiata alle immagini seguenti.

    In questo esempio, la media è 5, quindi si calcola la differenza tra ogni punto di dati e 5.

    Poi si eleva al quadrato la differenza, trasformandola in un numero positivo:

    3. Sommare le differenze al quadrato

    Per dire "sommare le cose" in matematica, si usa il sigma Σ. Quindi, quello che facciamo ora è sommare le differenze al quadrato per completare questa parte della formula: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Dividere le differenze quadratiche totali per il numero di valori.

    Finora le formule della deviazione standard del campione e della popolazione erano identiche, ma a questo punto sono diverse.

    Per il deviazione standard del campione , si ottiene il varianza del campione dividendo il totale delle differenze quadratiche per la dimensione del campione meno 1:

    52 / (7-1) = 8.67

    Per il deviazione standard della popolazione , si trova il media delle differenze quadratiche dividendo le differenze quadratiche totali per il loro numero:

    52 / 7 = 7.43

    Perché questa differenza nelle formule? Perché nella formula della deviazione standard campionaria è necessario correggere la distorsione nella stima di una media campionaria anziché della vera media della popolazione. E per farlo si usa n - 1 invece di n , che viene chiamata correzione di Bessel.

    5. Prendere la radice quadrata

    Infine, si estrae la radice quadrata dei numeri di cui sopra e si ottiene la deviazione standard (nelle equazioni sottostanti, arrotondata a 2 cifre decimali):

    Deviazione standard del campione Deviazione standard della popolazione
    √ 8.67 = 2.94 √ 7.43 = 2.73

    In Microsoft Excel, la deviazione standard viene calcolata allo stesso modo, ma tutti i calcoli di cui sopra vengono eseguiti dietro le quinte. La cosa fondamentale è scegliere una funzione di deviazione standard appropriata, sulla quale la sezione seguente vi fornirà alcuni indizi.

    Come calcolare la deviazione standard in Excel

    In generale, esistono sei diverse funzioni per trovare la deviazione standard in Excel. Quale utilizzare dipende principalmente dalla natura dei dati con cui si lavora, se si tratta dell'intera popolazione o di un campione.

    Funzioni per calcolare la deviazione standard dei campioni in Excel

    Per calcolare la deviazione standard sulla base di un campione, utilizzare una delle seguenti formule (tutte si basano sul metodo "n-1" descritto sopra).

    Funzione STDEV di Excel

    STDEV(numero1,[numero2],...) è la più antica funzione di Excel per stimare la deviazione standard sulla base di un campione ed è disponibile in tutte le versioni di Excel dalla 2003 alla 2019.

    In Excel 2007 e versioni successive, STDEV può accettare fino a 255 argomenti che possono essere rappresentati da numeri, matrici, intervalli di nomi o riferimenti a celle contenenti numeri. In Excel 2003, la funzione può accettare solo fino a 30 argomenti.

    Vengono conteggiati i valori logici e le rappresentazioni testuali dei numeri forniti direttamente nell'elenco degli argomenti. Nelle matrici e nei riferimenti vengono conteggiati solo i numeri; le celle vuote, i valori logici di VERO e FALSO, il testo e i valori di errore vengono ignorati.

    Nota: Excel STDEV è una funzione obsoleta, che viene mantenuta nelle nuove versioni di Excel solo per retrocompatibilità. Tuttavia, Microsoft non fa promesse sulle versioni future. Pertanto, in Excel 2010 e versioni successive, si consiglia di utilizzare STDEV.S invece di STDEV.

    Funzione STDEV.S di Excel

    STDEV.S(numero1,[numero2],...) è una versione migliorata di STDEV, introdotta in Excel 2010.

    Come STDEV, la funzione STDEV.S calcola la deviazione standard campionaria di un insieme di valori basandosi sulla classica formula della deviazione standard campionaria discussa nella sezione precedente.

    Funzione STDEVA di Excel

    STDEVA(valore1, [valore2], ...) è un'altra funzione per calcolare la deviazione standard di un campione in Excel. Si differenzia dalle due precedenti solo per il modo in cui gestisce i valori logici e di testo:

    • Tutti valori logici vengono contati, sia che siano contenuti in array o riferimenti, sia che siano digitati direttamente nell'elenco degli argomenti (TRUE vale 1, FALSE vale 0).
    • Valori di testo all'interno di matrici o argomenti di riferimento vengono contati come 0, comprese le stringhe vuote (""), le rappresentazioni testuali dei numeri e qualsiasi altro testo. Le rappresentazioni testuali dei numeri fornite direttamente nell'elenco degli argomenti vengono contate come i numeri che rappresentano (ecco un esempio di formula).
    • Le celle vuote vengono ignorate.

    Nota: affinché la formula della deviazione standard di un campione funzioni correttamente, gli argomenti forniti devono contenere almeno due valori numerici, altrimenti viene restituito l'errore #DIV/0!

    Funzioni per calcolare la deviazione standard della popolazione in Excel

    Se avete a che fare con l'intera popolazione, utilizzate una delle seguenti funzioni per effettuare la deviazione standard in Excel. Queste funzioni si basano sul metodo "n".

    Funzione STDEVP di Excel

    STDEVP(numero1,[numero2],...) è la vecchia funzione di Excel per trovare la deviazione standard di una popolazione.

    Nelle nuove versioni di Excel 2010, 2013, 2016 e 2019, viene sostituita dalla funzione STDEV.P migliorata, ma viene comunque mantenuta per la compatibilità con le versioni precedenti.

    Funzione STDEV.P di Excel

    STDEV.P(numero1,[numero2],...) è la versione moderna della funzione STDEVP che offre una maggiore precisione ed è disponibile in Excel 2010 e versioni successive.

    Come le loro controparti di deviazione standard del campione, all'interno degli array o degli argomenti di riferimento, le funzioni STDEVP e STDEV.P contano solo i numeri. Nell'elenco degli argomenti, contano anche i valori logici e le rappresentazioni testuali dei numeri.

    Funzione STDEVPA di Excel

    STDEVPA(valore1, [valore2], ...) calcola la deviazione standard di una popolazione, compresi i valori testuali e logici. Per quanto riguarda i valori non numerici, STDEVPA funziona esattamente come la funzione STDEVA.

    Nota: qualunque sia la formula di deviazione standard di Excel utilizzata, essa restituirà un errore se uno o più argomenti contengono un valore di errore restituito da un'altra funzione o un testo che non può essere interpretato come un numero.

    Quale funzione di deviazione standard di Excel utilizzare?

    La varietà di funzioni di deviazione standard in Excel può sicuramente creare confusione, soprattutto per gli utenti non esperti. Per scegliere la formula di deviazione standard corretta per un compito particolare, basta rispondere alle 3 domande seguenti:

    • Si calcola la deviazione standard di un campione o di una popolazione?
    • Quale versione di Excel utilizzate?
    • Il vostro set di dati comprende solo numeri o anche valori logici e testo?

    Per calcolare la deviazione standard sulla base di un dato numerico campione utilizzare la funzione STDEV.S in Excel 2010 e successivi; STDEV in Excel 2007 e precedenti.

    Per trovare la deviazione standard di un popolazione utilizzare la funzione STDEV.P in Excel 2010 e successivi; STDEVP in Excel 2007 e precedenti.

    Se volete logico o testo Sebbene non mi venga in mente nessuno scenario in cui una delle due funzioni possa essere utile da sola, esse possono essere utili in formule più grandi, in cui uno o più argomenti sono restituiti da altre funzioni come valori logici o rappresentazioni testuali di numeri.

    Per aiutarvi a decidere quale funzione di deviazione standard di Excel è più adatta alle vostre esigenze, consultate la seguente tabella che riassume le informazioni già apprese.

    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Versione Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Campione
    Popolazione
    Valori logici in array o riferimenti Ignorato Valutato

    (TRUE=1, FALSE=0)

    Testo in array o riferimenti Ignorato Valutato come zero
    Valori logici e "numeri-testo" nell'elenco degli argomenti Valutato

    (TRUE=1, FALSE=0)

    Celle vuote Ignorato

    Esempi di formula di deviazione standard in Excel

    Una volta scelta la funzione corrispondente al tipo di dati, non dovrebbero esserci difficoltà a scrivere la formula - la sintassi è così semplice e trasparente che non lascia spazio a errori :) Gli esempi seguenti mostrano un paio di formule di deviazione standard di Excel in azione.

    Calcolo della deviazione standard di un campione e di una popolazione

    A seconda della natura dei dati, utilizzare una delle seguenti formule:

    • Per calcolare la deviazione standard sulla base dell'intero popolazione , cioè l'elenco completo dei valori (B2:B50 in questo esempio), utilizzare la funzione STDEV.P:

      =STDEV.P(B2:B50)

    • Per trovare la deviazione standard sulla base di un campione che costituisce una parte, o un sottoinsieme, della popolazione (B2:B10 in questo esempio), utilizzare la funzione STDEV.S:

      =STDEV.S(B2:B10)

    Come si può vedere nella schermata sottostante, le formule restituiscono numeri leggermente diversi (più piccolo è il campione, maggiore è la differenza):

    In Excel 2007 e versioni successive, si utilizzano invece le funzioni STDEVP e STDEV:

    • Per ottenere la deviazione standard della popolazione:

      =STDEVP(B2:B50)

    • Per calcolare la deviazione standard del campione:

      =STDEV(B2:B10)

    Calcolo della deviazione standard per le rappresentazioni testuali dei numeri

    Quando abbiamo parlato delle diverse funzioni per calcolare la deviazione standard in Excel, abbiamo talvolta menzionato le "rappresentazioni testuali dei numeri" e potreste essere curiosi di sapere cosa significhi in realtà.

    In questo contesto, le "rappresentazioni testuali dei numeri" sono semplicemente numeri formattati come testo. Come possono comparire questi numeri nei vostri fogli di lavoro? Il più delle volte sono esportati da fonti esterne o restituiti dalle cosiddette funzioni di testo che sono progettate per manipolare stringhe di testo, ad esempio TESTO, MEDIO, DESTRA, SINISTRA, ecc.se assomiglia molto a un numero.

    Per illustrare meglio il punto, si consideri il seguente esempio. Supponiamo di avere una colonna di codici prodotto come "Jeans-105", in cui le cifre dopo il trattino indicano la quantità. L'obiettivo è quello di estrarre la quantità di ogni articolo e quindi trovare la deviazione standard dei numeri estratti.

    Il trasferimento della quantità in un'altra colonna non è un problema:

    =DESTRA(A2,LEN(A2)-RICERCA("-",A2,1))

    Il problema è che l'utilizzo di una formula di deviazione standard di Excel sui numeri estratti restituisce #DIV/0! o 0, come mostrato nella schermata seguente:

    Come già detto, l'output della funzione RIGHT è sempre una stringa di testo, ma né STDEV.S né STDEVA sono in grado di gestire i numeri formattati come testo nei riferimenti (il primo li ignora semplicemente, mentre il secondo li conta come zeri). Per ottenere la deviazione standard di questi "numeri-testo", è necessario fornirli direttamente all'elenco degli argomenti, il che può essere fatto incorporando tutti gli argomenti di STDEV.S.nella formula STDEV.S o STDEVA:

    =STDEV.S(DESTRA(A2,LEN(A2)-RICERCA("-",A2,1)), DESTRA(A3,LEN(A3)-RICERCA("-",A3,1)), DESTRA(A4,LEN(A4)-RICERCA("-",A4,1)), DESTRA(A5,LEN(A5)-RICERCA("-",A5,1))

    =STDEVA(DESTRA(A2,LEN(A2)-RICERCA("-",A2,1)), DESTRA(A3,LEN(A3)-RICERCA("-",A3,1)), DESTRA(A4,LEN(A4)-RICERCA("-",A4,1)), DESTRA(A5,LEN(A5)-RICERCA("-",A5,1))

    Le formule sono un po' macchinose, ma potrebbe essere una soluzione efficace per un campione piccolo. Per un campione più grande, per non parlare dell'intera popolazione, non è assolutamente un'opzione. In questo caso, una soluzione più elegante sarebbe quella di far convertire alla funzione VALORE i "numeri di testo" in numeri comprensibili da qualsiasi formula di deviazione standard (si notino i numeri allineati a destra nella schermatain basso, rispetto alle stringhe di testo allineate a sinistra nella schermata precedente):

    Come calcolare l'errore standard della media in Excel

    In statistica, esiste un'altra misura per stimare la variabilità dei dati. errore standard della media La deviazione standard e l'errore standard della media sono due concetti strettamente correlati, ma non sono la stessa cosa.

    Mentre la deviazione standard misura la variabilità di un insieme di dati rispetto alla media, l'errore standard della media (SEM) stima quanto è probabile che la media del campione sia lontana dalla vera media della popolazione. Detto in altro modo, se si prendessero più campioni dalla stessa popolazione, l'errore standard della media mostrerebbe la dispersione tra queste medie campionarie. Poiché di solito si calcola solo unomedia di un insieme di dati, non di medie multiple, l'errore standard della media viene stimato piuttosto che misurato.

    In matematica, l'errore standard della media si calcola con questa formula:

    Dove SD è la deviazione standard e n è la dimensione del campione (il numero di valori nel campione).

    Nei fogli di lavoro di Excel è possibile utilizzare la funzione COUNT per ottenere il numero di valori in un campione, SQRT per ottenere la radice quadrata di tale numero e STDEV.S per calcolare la deviazione standard di un campione.

    Mettendo insieme tutti questi elementi, si ottiene la formula dell'errore standard della media in Excel:

    STDEV.S( gamma )/SQRT(CONTO( gamma ))

    Supponendo che i dati del campione siano in B2:B10, la nostra formula SEM sarebbe la seguente:

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    Il risultato potrebbe essere simile a questo:

    Come aggiungere barre di deviazione standard in Excel

    Per visualizzare un margine della deviazione standard, è possibile aggiungere barre di deviazione standard al grafico di Excel. Ecco come fare:

    1. Creare un grafico nel modo consueto ( Inserire scheda> Grafici gruppo).
    2. Fare clic su un punto qualsiasi del grafico per selezionarlo, quindi fare clic sul pulsante Elementi del grafico pulsante.
    3. Fare clic sulla freccia accanto a Barre di errore e scegliere Deviazione standard .

    In questo modo si inseriscono le stesse barre di deviazione standard per tutti i punti dati.

    Ecco come fare la deviazione standard in Excel. Spero che queste informazioni vi siano utili. In ogni caso, vi ringrazio per la lettura e spero di vedervi sul nostro blog la prossima settimana.

    Michael Brown è un appassionato di tecnologia dedicato con una passione per la semplificazione di processi complessi utilizzando strumenti software. Con oltre un decennio di esperienza nel settore tecnologico, ha affinato le sue competenze in Microsoft Excel e Outlook, nonché in Fogli Google e Documenti. Il blog di Michael è dedicato alla condivisione delle sue conoscenze e competenze con gli altri, fornendo suggerimenti e tutorial facili da seguire per migliorare la produttività e l'efficienza. Che tu sia un professionista esperto o un principiante, il blog di Michael offre spunti preziosi e consigli pratici per ottenere il massimo da questi strumenti software essenziali.