Come calcolare il coefficiente di correlazione in Excel?

Uno dei calcoli statistici Microsoft Excel più semplici e più comuni che puoi fare è la correlazione. È una statistica semplice, ma può essere molto istruttiva quando si desidera vedere se due variabili sono correlate. Se conosci i comandi corretti, trovare il coefficiente di correlazione in Excel è estremamente semplice.

Diamo un’occhiata alla correlazione per darti un’idea delle informazioni che fornisce . Quindi troveremo il coefficiente di correlazione in Excel usando due metodi e un buon grafico per osservare le correlazioni.

Infine, darò una rapida introduzione alla regressione lineare, un’altra funzione statistica che potrebbe essere utile quando si osservano correlazioni.

Come calcolare il coefficiente di correlazione in Excel? 1

Qual è la correlazione?

Prima di iniziare, discutiamo della definizione di correlazione. È una semplice misura di come le cose si relazionano. Diamo un’occhiata a due variabili che non hanno correlazione.

Queste due variabili (una tracciata sull’asse X, una sull’asse Y) sono completamente casuali e non strettamente correlate. Tuttavia, le due variabili seguenti sono correlate.

In generale, all’aumentare di una variabile, aumenta anche l’altra . Questa è correlazione. (Nota che può essere anche il contrario; se uno sale e l’altro scende, questa è una correlazione negativa).

Comprensione del coefficiente di correlazione

Il coefficiente di correlazione indica la relazione tra le due variabili. Il coefficiente è compreso tra -1 e 1. Un coefficiente di correlazione pari a 0 significa che non esiste assolutamente alcuna correlazione tra due variabili. Questo è ciò che dovresti ottenere quando hai due serie di numeri casuali.

Un coefficiente di -1 significa che ha una correlazione negativa perfetta : all’aumentare di una variabile, l’altra diminuisce in modo proporzionale. Un coefficiente di 1 è una correlazione positiva perfetta: all’aumentare di una variabile, anche l’altra aumenta proporzionalmente.

Qualsiasi numero tra questi rappresenta una scala. Una correlazione di 0,5, ad esempio, è una moderata correlazione positiva.

Come trovare il coefficiente di correlazione usando CORREL

Esiste una funzione integrata per la mappatura in Excel. La funzione CORREL ha una sintassi molto semplice:
= CORREL (array1, array2) array1 è il suo primo gruppo di numeri e array2 è il secondo gruppo. Excel sputerà un numero, e questo è il suo coefficiente di correlazione.

In questo foglio di calcolo, abbiamo un elenco di auto, con modello e anno, e i loro valori. Ho usato la funzione CORREL per vedere se l’anno e il valore del modello erano correlati:

Correlazioni grafiche

Quando si eseguono correlazioni, è consigliabile utilizzare un diagramma a dispersione per ottenere una comprensione visiva di come i set di dati sono correlati. Vai a Grafica> Scatter per vedere l’aspetto dei tuoi dati:

Puoi vedere che in questi dati, l’anno dell’auto non influisce molto sul valore. C’è una leggera tendenza positiva, ma è debole. Questo è ciò che abbiamo trovato con la nostra funzione CORREL.

  • In Windows, fai clic su Strumenti grafici> Progettazione> Aggiungi elemento grafico.
  • Seleziona la linea di tendenza.
  • Su un Mac, devi andare a Letter Design o Letter Design, a seconda dell’edizione Excel.

Come trovare il coefficiente di correlazione in Excel?

Nell’immagine sopra, abbiamo eseguito correlazioni in quattro diversi set di dati: l’anno, la popolazione mondiale e due set di numeri casuali.

La correlazione di ciascun set di dati con se stessa è 1. L’anno e la popolazione mondiale hanno una correlazione estremamente forte, mentre ci sono correlazioni molto deboli in altri luoghi, come previsto con numeri casuali.

Correlazione vs. Regressione lineare in Excel

La correlazione è una misura semplice: quanto sono correlati tra due variabili? Questa misura, tuttavia, non ha alcun valore predittivo o causale. Il fatto che due variabili siano correlate non significa che una stia causando cambiamenti nell’altra. Questo è fondamentale per capire la correlazione.

Se sei interessato a fare una dichiarazione sulla causalità , dovresti usare la regressione lineare. Puoi anche accedervi tramite il Data Analysis Toolpak.

(Questo articolo non tratta i dettagli di come funziona la regressione lineare, ma ci sono molte risorse statistiche gratuite che possono guidarti attraverso le basi.)
Apri il Data Analysis Toolkit, seleziona Regressione e fai clic su OK.

 

Potrebbe interessarti

Lascia un commento