Iată cum să utilizați instrumentele încorporate Excel pentru a ușura analiza statistică.

Graficele reziduale joacă un rol esențial în analiza regresiei. Ei vă spun cât de exact reprezintă linia de regresie relația dintre două variabile. Următorul ghid explică cum să calculați și să reprezentați grafic reziduurile Excel folosind două metode.

Dar înainte de a ajunge la lucrurile bune, să înțelegem pe scurt reziduurile și importanța lor într-o analiză de regresie.

Ce sunt reziduurile și de ce sunt importante?

Un rezidual este o diferență între valoarea observată (reală) și valoarea prezisă. În termeni mai simpli, un rezidual este o eroare. De exemplu, dacă valoarea observată este 10, iar modelul dvs. a dat o valoare de 8, atunci valoarea reziduală ar fi 2.

Pe de altă parte, un grafic rezidual este un grafic de dispersie în care variabila independentă (vârsta) este reprezentată pe axa orizontală, iar reziduurile (erorile) sunt reprezentate pe axa verticală.

Ok, știi ce sunt reziduurile, dar de ce sunt acestea importante? Pentru a înțelege acest lucru, luați în considerare următorul caz:

instagram viewer

Vrem să înțelegem relația dintre vârstă și ratele de economisire. Pentru asta, vom trasa o linie de regresie. Cu toate acestea, nu suntem siguri dacă linia de regresie reprezintă cu exactitate relația dintre cele două variabile. Acolo intervin reziduurile. Folosim un grafic rezidual pentru a verifica acuratețea dreptei de regresie.

Acum că știți ce sunt reziduurile, să învățăm cum să creați un grafic rezidual în Excel:

Cum se creează o diagramă reziduală utilizând ecuația de tendință

Prima metodă de trasare a reziduurilor în Excel utilizează o ecuație de tendință pentru a calcula valorile prezise pentru datele noastre. Odată ce avem asta, putem calcula reziduurile scăzând valorile prezise din valorile observate. În cele din urmă, creăm un grafic de dispersie cu predictorii pe axa orizontală și reziduurile pe axa verticală.

Deși această metodă necesită mai mulți pași decât a doua metodă, este o modalitate excelentă de a înțelege conceptul. Odată ce ai o înțelegere decentă, poți folosi a doua metodă, care necesită mai puțin timp și efort.

Haideți să vă ghidăm prin proces, pas câte unul:

Pasul 1: Introduceți datele

Începem prin a introduce valorile pentru predictor (sub X coloana) și valorile observate (sub Y coloană):

Pasul 2: Creați un diagramă de dispersie a datelor

Acum creăm un grafic de dispersie a datelor urmând pașii de mai jos:

Dacă nu sunteți familiarizat cu diagramele de dispersie, iată un articol cuprinzător despre crearea unui grafic de dispersie în Excel și prezentarea datelor dvs. De asemenea, puteți învăța utilizați un grafic de dispersie în Excel pentru a prezice comportamentul datelor.

  1. Selectați datele (sub X și Y coloane).
  2. Du-te la Panglică Excel și faceți clic Introduce.
  3. În Diagrame secțiunea, faceți clic pe săgeata de sub Scatterplot opțiune.
  4. Selectați primul Scatterplot (Imprăștiați doar cu markere).
  5. Veți obține o diagramă de dispersie similară cu următoarea diagramă:

Pasul 3: Adăugați o linie de tendință și afișați ecuația liniei de tendință pe Scatterplot

Urmați pașii de mai jos pentru a adăuga o linie de tendință la graficul de dispersie:

  1. Faceți clic pe graficul de dispersie.
  2. Du-te la Panglică Excel și faceți clic Aspect.
  3. În fundal secțiunea, faceți clic pe săgeata de sub Linie de tendințe pictograma.
  4. Selectează Linia de tendință liniară opțiune.

Veți vedea acum o linie (linia de tendință) care intersectează punctele de pe diagrama de dispersie. Pentru a afișa ecuația liniei de tendință pe graficul de dispersie, urmați pașii de mai jos:

  1. Du-te din nou la Linie de tendințe pictograma și faceți clic pe săgeata de sub ea.
  2. Clic Mai multe opțiuni pentru linii de tendințe.
  3. A Formatați linia de tendințe va apărea caseta de dialog.
  4. Verifică Afișați ecuația pe diagramă opțiunea din partea de jos a Formatați linia de tendințe căsuță de dialog. Ecuația liniei de tendință va apărea pe grafic.

Pasul 4: Calculați valorile estimate

Pentru a calcula valorile prezise, ​​creați o altă coloană (Z) lângă datele dvs. și urmați pașii de mai jos:

  1. Introduceți formula liniei de tendință afișată pe grafic și lipiți-o sub coloana Z (celula C2). Schimba X în formula cu valori sub coloana X.
  2. Deci, pentru prima valoare prezisă, formula ar fi dată după cum urmează:
    =1,5115*A2+23,133
  3. A inlocui A2 cu A3 în formula liniei de tendință pentru a doua valoare predicată.
  4. Pentru a treia valoare estimată, înlocuiți A3 cu A4, și așa mai departe, până când obțineți toate valorile predicate pentru predictorii lor corespunzători.

Pasul 5: Găsiți valorile reziduale

Acum că avem valorile prezise, ​​putem găsi valorile reziduale scăzând valorile prezise din valorile observate (reale) sub coloana Y. Formula pentru prima valoare reziduală ar fi =B2-C2. Pentru al doilea, formula ar fi =B3-C3, și așa mai departe.

Pasul 6: Creați graficul rezidual

Pentru a crea un grafic rezidual, avem nevoie de predictor și de valori reziduale. Acum că le avem pe amândouă, urmați pașii de mai jos:

  1. Selectați coloanele Y și Z.
  2. Faceți clic dreapta și selectați Ascunde.
  3. Acum selectați X și Reziduuri coloane.
  4. Du-te la Introduce fila din Panglica Excel.
  5. Faceți clic pe săgeata de sub Împrăștia pictograma.
  6. Selectează Împrăștiați doar cu Markere opțiune.
  7. Veți obține graficul rezidual, așa cum se arată mai jos.

Pentru a doua metodă, tot ce trebuie să faceți este să furnizați Excel cu datele și face toată treaba. Puteți crea o diagramă reziduală în doar câteva clicuri. Dar pentru asta, va trebui să încărcați pachetul de instrumente de analiză Excel. Să începem:

  1. Du-te la Fişier filă și faceți clic Opțiuni.
  2. The Opțiuni Excel va apărea caseta de dialog.
  3. Du-te la Administra caseta (în partea de jos), selectați Suplimente Excel, și faceți clic Merge.
  4. Un Adăugați ins va apărea caseta de dialog.
  5. Verifică Pachet de instrumente de analiză casetă și faceți clic Bine.
  6. Acum du-te la Panglică Excel și faceți clic Date.
  7. Veți găsi Analiza datelor pictograma în Analiză secțiune.

Pasul 2: Introduceți datele

  1. Selectați coloanele A și Dși faceți clic dreapta pe mouse. Clic Afișează.
  2. Acum copiați X și Y coloane.

    Veți observa că graficul s-a schimbat după ce ați scos coloanele. Pentru a-l schimba înapoi la graficul rezidual inițial, va trebui să ascundem Y și Z coloane (prin selectarea Y și Z coloane, făcând clic dreapta pe mouse și selectând Ascunde).

  3. Deschideți o nouă foaie Excel și inserați X și Y coloane.
  4. Faceți clic pe noul apărut Analiza datelor opțiunea în Analiză secțiunea Date fila.
  5. A Analiza datelor va apărea caseta de dialog.
  6. Găsiți și selectați Regresia sub Instrumente de analiză.
  7. Clic BINE. The Regresia va apărea caseta de dialog.
  8. Introduceți valorile în Y coloana (predictorii, B2:B11) în Interval Y de intrare camp.
  9. Introduceți intervalul de celule în X coloana (variabilele independente, A2:A11) în Interval X de intrare camp.

Pasul 3: Creați graficul rezidual

În Regresia caseta de dialog, sub Opțiuni de ieșire, Verifica Noua foaie de lucru Ply, și faceți clic Bine.

Excel va crea automat graficul rezidual împreună cu următoarele rezultate pe care le puteți utiliza pentru a verifica fiabilitatea modelului dvs. de regresie:

  • Statistici de regresie
  • Tabelul ANOVA
  • Tabelul coeficienților
  • Ieșire reziduală

Instrumentul de analiză Excel oferă o gamă largă de funcționalități statistice valoroase pe care le puteți utiliza pentru a vă analiza seturile de date. După ce ați creat graficul rezidual prin Instrumentul de analiză Excel, este posibil să începeți să vă zgâriați în timp ce vă uitați la toate tabelele complicate. Dar odată ce înveți cum să faci analiză fundamentală a datelor în Excel, numerele nu par atât de înfricoșătoare.