În timp ce utilizați Foi de calcul Google pentru a lucra cu două seturi de date, este posibil să doriți să le comparați pe cele două, determinând gradul în care unul îl influențează pe celălalt.

Corelațiile pot oferi o perspectivă asupra existenței unei relații predictive între planurile x și y, dar nu indică neapărat cauzalitate. Iată cum puteți utiliza Foi de calcul Google pentru a identifica corelațiile în datele dvs.

Ce este corelația și pentru ce o poți folosi?

Când două variabile sunt corelate, una poate determina modul în care o variabilă o afectează pe cealaltă. Dar, este esențial să ne amintim că corelația nu implică încredere în acest caz; arată doar cât de strâns și rapid se compară sau se relaționează două variabile.

Metricurile statistice ajută la înțelegerea tendințelor subiacente în analiza datelor. Corelația este printre valorile statistice cele mai des utilizate și determină cât de strâns legate sau dependente sunt două variabile.

Înțelegerea coeficientului de corelație în Foi de calcul Google

instagram viewer

În Google Sheets, se calculează un coeficient de corelație folosind funcția CORREL. Coeficientul de corelație servește ca un indicator al cât de strâns sunt conectate seturile de date. Poate fi folosit pentru a obține coeficientul de corelație produs-moment Pearson (r) dacă aveți două seturi variabile de date. Dacă doriți să aflați mai multe despre acest coeficient, puteți citi mai multe în acest ghid de la Statistici la Leard.

S-ar putea întâlni una dintre cele trei valori de corelare. Fiecare măsurătoare definește relațiile dintre variabile în mod diferit. Valoarea sa este între -1 și +1:

  • -1 denotă o corelație negativă perfectă: Când o corelație are un coeficient de corelație care este egal sau sub -0,9, se spune că este puternic negativă. Este un indiciu că datele sunt corelate. Totuși, variabila x continuă să crească, în timp ce variabila y continuă să scadă.
  • 0 indică nicio conexiune: Se consideră că variabilele nu se corelează dacă coeficientul de corelație este mai mare de 0,01, dar mai mic de 0,1, deoarece nu există o relație perceptibilă între fiecare variabilă. Sunt independente unul de altul.
  • +1 denotă o corelație pozitivă perfectă: Când coeficientul unei corelații se încadrează între 0,9 și 1, acesta este considerat extrem de pozitiv. Indică faptul că a existat o creștere a celor două seturi de variabile.

Cea mai mare valoare a unui coeficient poate fi un coeficient de corelație de 1. Când valoarea corelației este 1, înseamnă că, dacă ar fi să reprezentați grafic datele, acestea ar fi complet aliniate pentru a crea o linie dreaptă.

Dacă ești încă puțin pierdut, nu-ți face griji. Vom explica sintaxa funcției CORREL și apoi vom explora câteva exemple din lumea reală pentru a vă ajuta să o înțelegeți mai bine. Înțelegerea liniilor de cea mai bună potrivire și cum să creați linii de tendințe în Foi de calcul Google te va ajuta cu asta.

Sintaxa funcției CORREL în Foi de calcul Google

=CORREL(data_y, data_x) 

Să împărțim acest lucru în părți și să înțelegem mai bine ce înseamnă fiecare frază:

  • =CORREL: Aceasta este funcția Google Sheet care determină r (coeficientul de corelație produs-moment Pearson al setului de date).
  • date_y: Aceasta se referă la grupul de celule care conține datele dependente sau intervalul de valori pentru acele celule.
  • date x: Aceasta este fie o referință la matricea de celule cu date independente, fie la intervalul de valori pentru acele celule.

Dacă ar fi să reprezentați grafic punctele de date, data_y ar fi axa Y și data_x axa X. Veți observa că există două moduri diferite de a introduce intervalul de date. Fie un interval de celule de referință, fie o intrare de date directă în funcție sunt opțiuni.

În cele mai multe cazuri, utilizarea intervalului de celule de referință este de preferat. Asta pentru că foaia de calcul, cel mai probabil, conține deja datele dvs. Utilizarea unui interval de celule de referință poate evita introducerea excesivă de tastare care poate duce la erori ale utilizatorului.

Exemple de funcții CORREL în Foi de calcul Google

Să vedem câteva exemple pentru a înțelege cum să folosiți funcția CORREL în Foi de calcul Google.

Exemplul 1: O corelație pozitivă puternică

Pentru acest prim exemplu, să presupunem că lucrăm în industria imobiliară. În foaia de calcul de mai jos, avem partiții de hectare de teren pe care le vindeți și numărul de unități vândute din datele acelor terenuri diferite în foaia dvs. Google.

  1. Dacă urmăriți într-o foaie, veți începe prin a introduce datele variabilelor în foaia de calcul, după cum se arată mai jos:
  2. Faceți clic pe celulă C2
  3. Tip =CORREL(
  4. Veți trece apoi la tastați data_y, care, în cazul nostru, este intervalul de celule la care se face referire A2:A6, apoi introduceți o virgulă.
  5. Continuați cu tastați data_x, care, în cazul nostru, este referit ca B2:B6.
  6. Încheiați cu o paranteză de închidere, după cum se arată mai jos:
  7. În sfârșit, apăsați introduce pentru a returna coeficientul de corelație al celor două date din celulă C2.

Folosind exemplul prezentat mai sus, ați obținut un coeficient de corelație de 0,90, care este o corelație pozitivă puternică, deoarece valoarea sa se încadrează între 0,9 și 1. Prin urmare, aceasta indică faptul că, pe măsură ce y se schimbă, x se schimbă și într-o manieră substanțial comparabilă.

Mai jos este o reprezentare a exemplelor noastre de date pe un grafic de dispersie XY. După cum puteți vedea, linia de cea mai bună potrivire este aproape de punctele de date de pe grafic, ceea ce susține ideea că cifrele sunt puternic corelate.

Puteți afla mai multe despre crearea de grafice de dispersie XY în Foi de calcul Google în celălalt articol al nostru.

Exemplul 2: O corelație negativă slabă

De data aceasta, vom folosi un exemplu mai generic de „variabile x și y” în foaia de calcul. Am inclus în mod intenționat cifre pentru a demonstra o corelație negativă, pe care funcția CORREL o demonstrează mai jos:

Nu există o relație puternică între variabilele y și x, astfel încât rezultatul pe care îl obținem este un coeficient de corelație mai puțin semnificativ decât în ​​exemplul anterior. Rezultatul pe care l-am obținut este -0,47. Acest lucru nu înseamnă, totuși, că nu există deloc o corelație. Să ne uităm din nou la o linie de cea mai bună potrivire pentru a-i înțelege.

După cum puteți vedea prin diagrama de dispersie, punctele de date sunt mai departe de linia de cea mai bună potrivire. Există, așadar, o corelație mai mică decât în ​​primul exemplu, dar nu nici una. Veți observa, de asemenea, că linia de cea mai bună potrivire scade. Aceasta arată o corelație negativă, o valoare scade pe măsură ce cealaltă crește.

Exemplul 3: Nicio conexiune

Aici avem un set de numere complet aleatorii. Să atingem rapid cum să folosiți din nou funcția CORREL:

  1. Tastați în Celulă C2 formula CORREL
  2. Argumentele noastre sunt A2:A10 și B2:B10
  3. Apăsați Enter

Valoarea returnată pe C2 este 0,02. Dacă un coeficient de corelație se încadrează între 0,01 și 0,1, se determină că variabilele în cauză nu se corelează deoarece nu există o legătură perceptibilă între ele. Relațiile dintre variabile sunt complet independente.

Mai jos este reprezentarea acestuia pe un grafic de dispersie. Linia de cea mai bună potrivire este aproape plată, indicând o corelație mică între cele două seturi de date.

Corelați cu ușurință datele dvs. în Foi de calcul Google

Corelația ar putea fi un subiect provocator dacă nu ai lucrat prea mult cu ea în liceu. Acest ghid a acoperit toate elementele de bază, dar va trebui să continuați să utilizați funcția CORREL din Foi de calcul Google pentru a o păstra proaspătă în minte.

Aceasta este o funcție puternică, deoarece ajută la evitarea construirii de grafice de dispersie și poate găsi rapid tendințe în datele dvs. Totuși, nu vă fie teamă să adăugați diagrame pentru a ajuta alți utilizatori să înțeleagă mai bine datele din foile de calcul.