Lezioni Di Statistica: Come Calcolare Mediana, Moda e Covarianza

Al pari della Matematica, anche la Statistica è una delle materie universitarie più difficili da studiare ed imparare. La statistica è una disciplina costituita da caratteri, cioè aspetti della realtà osservabili (lo stato di una spiaggia, la professione di una persona che lavora) e variabili, nel senso che possono assumere espressioni differenti (balneabile, inquinata; calzolaio, scrittore, deputato, regista). Questi, a loro volta, devono poter essere rilevati sui soggetti che li esprimono (unità statistiche); questi ultimi devono appartenere a una collettività (un unico dato rilevato su un singolo individuo è privo di interesse per la statistica!). La statistica ha quindi due obiettivi principali: sintetizzare, cioè predisporre i dati raccolti in una forma (tabelle, grafici, sintesi numeriche) che consenta di comprendere meglio i fenomeni rispetto ai quali è stata eseguita la rilevazione. Il suo secondo obiettivo è sintetizzare, cioè estendere il risultato dell’analisi effettuata sui dati di un gruppo limitato di unità statistiche (campione) all’intera collettività di appartenenza (universo, popolazione).

lezioni di statistica

Oggi vorrei esporre una breve guida su come calcolare facilmente e senza sforzo la mediana, la moda e la covarianza, che rappresentano la base principale delle discipline matematiche e scientifiche.

MEDIANA

Nella statistica descrittiva, con il termine mediana si indica il valore (o l’insieme di valori) assunto dalle unità statistiche che si trovano nel mezzo della distribuzione…..se i dati sono dispari; mentre è la somma dei due valori diviso due se i dati sono di numero pari. In particolare, per calcolare la mediana:

  • si ordinano i numeri (n) in ordine crescente (o decrescente);
  • se il numero di dati è dispari, la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione (n + 1) / 2
  • se i dati in questione sono in numero dispari, la mediana è stimata usando i due valori che occupano le posizione (n / 2) e [(n / 2) + 1]. Generalmente, però, si sceglie la loro media aritmetica se il carattere è quantitativo.

Dunque, se la lista dei dati è costituita dai numeri: 18 24 32 60 70, la mediana è 32 (cioè, il valore al centro). Se la lista è costituita da dati in numero dispari come 5 22 34 52, la mediana è 28: cioè: 22 + 34 = 56 / 2 = 28.

MODA

La moda o norma della distribuzione di frequenza X, è la modalità (o la classe di modalità) caratterizzata dalla massima frequenza e viene spesso rappresentata con la simbologia ν0. In pratica, è il valore che compare più frequentemente.

Ciò vuol dire che se abbiamo questa lista di dati: 2 2 4 5 6 7 8, la moda è 2; ovvero il numero che si è ripetuto più volte. Nella sequenza 45 46 46 47 48 50 50, invece, le mode sono due: 46 e 50. Esistono casi in cui la moda può essere nulla, in quanto nessun numero si ripete.

COVARIANZA

La covarianza è un indicatore statistico che esprime la dipendenza tra due variabili. Misura cioè quanto queste variano insieme e si calcola andando ad osservare appunto come si distribuiscono queste variabili. Vediamo come calcolarla. Innanzitutto, il calcolo ci spiega quando due variabili abbiano un andamento che varia contemporaneamente e ci fornisce quindi una indicazione sul grado di dipendenza tra le due. Per calcolare la covarianza, dobbiamo partire dalla distribuzione di due variabili casuali: avendo quindi l’insieme dei valori che le due variabili assumono, possiamo calcolarne la media. La varianza non è altro che il valore atteso (E) del prodotto delle distanze delle due variabili dalla rispettiva media, in statistica indicata con E (variabile). La formula è: Cov (X,Y) = E [(X – E [ X] ] * (Y – E[Y])].

Facciamo un esempio. La variabile X assume valori: 3,5,7.

La variabile Y assume valori: 3,6,9. Innanzitutto, bisognerà calcolare i valori attesi delle due variabili (cioè le medie). E[X]= (3 + 5 + 7) / 3 = 5.  E[Y]= 6 (calcolato con lo stesso procedimento). Ora dobbiamo calcolare le distanze delle variabili dalla media, ottenendo per la variabile X: -2 (3-5), 0 (5-5), 2 (7-5).  Allo stesso modo per Y avremo: -3, 0, 3. A questo punto, calcoliamo il prodotto di queste differenze ottenendo 6 (-2 x -3), 0 (0 x 0), 6 (2 x 3). Infine, dobbiamo calcolare la media di questi prodotti per ottenere la covarianza, che in questo caso è uguale a 4 (cioè la media di 6, 0 e 6).

Per chi volesse approfondire sui metodi e gli strumenti della statistica consiglio i seguenti libri:

Corso Online di Statistica

La comprensione delle statistiche è essenziale per comprendere la ricerca nelle scienze sociali e comportamentali. In questo corso imparerai le basi della statistica; non solo come calcolarli, ma anche come valutarli.

Nella prima parte del corso verranno discussi i metodi della statistica descrittiva. Imparerai cosa sono i casi e le variabili e come puoi calcolare misure di tendenza centrale (media, mediana e moda) e dispersione (deviazione standard e varianza). Successivamente, come valutare le relazioni tra variabili e i concetti di correlazione e regressione.

La seconda parte del corso riguarda i fondamenti della probabilità: calcolo delle probabilità, distribuzioni di probabilità e distribuzioni campionarie. Devi conoscere queste cose per capire come funzionano le statistiche inferenziali.

La terza parte del corso consiste in un’introduzione ai metodi della statistica inferenziale – metodi che ci aiutano a decidere se i modelli che vediamo nei nostri dati sono abbastanza forti da trarre conclusioni sulla popolazione sottostante a cui siamo interessati. Intervalli di confidenza e test di significatività.

Non solo imparerai a conoscere tutti questi concetti statistici, ma imparerai anche a calcolare e generare queste statistiche da solo utilizzando un software statistico disponibile gratuitamente.

Il corso è offerto su Coursera dall’Università di Amsterdam. Il corso ha una durata di 27 ore, è in lingua inglese ma con sottotitoli anche in italiano.

ISCRIVITI AL CORSO DA QUI

1 Comment on "Lezioni Di Statistica: Come Calcolare Mediana, Moda e Covarianza"

  1. Nella mediana c’è un errore.

Leave a comment

Your email address will not be published.


*