Uno dei calcoli statistici Microsoft Excel più semplici e più comuni che puoi fare è la correlazione. È una statistica semplice, ma può essere molto istruttiva quando si desidera vedere se due variabili sono correlate. Se conosci i comandi corretti, trovare il coefficiente di correlazione in Excel è estremamente semplice.
Diamo un’occhiata alla correlazione per darti un’idea delle informazioni che fornisce . Quindi troveremo il coefficiente di correlazione in Excel usando due metodi e un buon grafico per osservare le correlazioni.
Infine, darò una rapida introduzione alla regressione lineare, un’altra funzione statistica che potrebbe essere utile quando si osservano correlazioni.
Qual è la correlazione?
Prima di iniziare, discutiamo della definizione di correlazione. È una semplice misura di come le cose si relazionano. Diamo un’occhiata a due variabili che non hanno correlazione.
Queste due variabili (una tracciata sull’asse X, una sull’asse Y) sono completamente casuali e non strettamente correlate. Tuttavia, le due variabili seguenti sono correlate.
In generale, all’aumentare di una variabile, aumenta anche l’altra . Questa è correlazione. (Nota che può essere anche il contrario; se uno sale e l’altro scende, questa è una correlazione negativa).
Comprensione del coefficiente di correlazione
Il coefficiente di correlazione indica la relazione tra le due variabili. Il coefficiente è compreso tra -1 e 1. Un coefficiente di correlazione pari a 0 significa che non esiste assolutamente alcuna correlazione tra due variabili. Questo è ciò che dovresti ottenere quando hai due serie di numeri casuali.
Un coefficiente di -1 significa che ha una correlazione negativa perfetta : all’aumentare di una variabile, l’altra diminuisce in modo proporzionale. Un coefficiente di 1 è una correlazione positiva perfetta: all’aumentare di una variabile, anche l’altra aumenta proporzionalmente.
Qualsiasi numero tra questi rappresenta una scala. Una correlazione di 0,5, ad esempio, è una moderata correlazione positiva.
Come trovare il coefficiente di correlazione usando CORREL
Esiste una funzione integrata per la mappatura in Excel. La funzione CORREL ha una sintassi molto semplice:
= CORREL (array1, array2) array1 è il suo primo gruppo di numeri e array2 è il secondo gruppo. Excel sputerà un numero, e questo è il suo coefficiente di correlazione.
In questo foglio di calcolo, abbiamo un elenco di auto, con modello e anno, e i loro valori. Ho usato la funzione CORREL per vedere se l’anno e il valore del modello erano correlati:
Correlazioni grafiche
Quando si eseguono correlazioni, è consigliabile utilizzare un diagramma a dispersione per ottenere una comprensione visiva di come i set di dati sono correlati. Vai a Grafica> Scatter per vedere l’aspetto dei tuoi dati:
Puoi vedere che in questi dati, l’anno dell’auto non influisce molto sul valore. C’è una leggera tendenza positiva, ma è debole. Questo è ciò che abbiamo trovato con la nostra funzione CORREL.
- In Windows, fai clic su Strumenti grafici> Progettazione> Aggiungi elemento grafico.
- Seleziona la linea di tendenza.
- Su un Mac, devi andare a Letter Design o Letter Design, a seconda dell’edizione Excel.
Come trovare il coefficiente di correlazione in Excel?
Nell’immagine sopra, abbiamo eseguito correlazioni in quattro diversi set di dati: l’anno, la popolazione mondiale e due set di numeri casuali.
La correlazione di ciascun set di dati con se stessa è 1. L’anno e la popolazione mondiale hanno una correlazione estremamente forte, mentre ci sono correlazioni molto deboli in altri luoghi, come previsto con numeri casuali.
Correlazione vs. Regressione lineare in Excel
La correlazione è una misura semplice: quanto sono correlati tra due variabili? Questa misura, tuttavia, non ha alcun valore predittivo o causale. Il fatto che due variabili siano correlate non significa che una stia causando cambiamenti nell’altra. Questo è fondamentale per capire la correlazione.
Se sei interessato a fare una dichiarazione sulla causalità , dovresti usare la regressione lineare. Puoi anche accedervi tramite il Data Analysis Toolpak.
(Questo articolo non tratta i dettagli di come funziona la regressione lineare, ma ci sono molte risorse statistiche gratuite che possono guidarti attraverso le basi.)
Apri il Data Analysis Toolkit, seleziona Regressione e fai clic su OK.