Regiuni multiple de regresie liniară, metode și utilizări



regresia liniară multiplă este un instrument de calcul care investighează relațiile cauză-efect ale obiectelor de studiu și testează ipoteze complexe.

Este folosit în matematică și statistică. Acest tip de regresie liniară necesită dependent (cu alte cuvinte, rezultatele) și variabilele independente (adică, cauze) urmează o ordine ierarhică și de alți factori inerente în diverse domenii de studiu.

De obicei, regresia liniară este una care este reprezentată de o funcție liniară care este calculată de la două variabile dependente. Acest lucru are ca cel mai important caz cel în care fenomenul studiat are o linie dreaptă de regresie.

Într-un anumit set de date (x1, y1) (xn, yn) și valorile corespunzătoare unei perechi de variabile aleatoare în corelație directă între ele, regresia drept poate lua, pentru a începe, sub forma unei ecuații, ca y = a · x + b.

Situri teoretice de calcul în regresia liniară multiplă

Orice calcul care utilizează mai multe regresii liniare va depinde mult de obiectul studiat și de aria de studiu, cum ar fi economia, deoarece variabilele fac ca formulele utilizate să aibă complexități care variază în funcție de caz.

Acest lucru înseamnă că mai complicate problema, cei mai mulți factori trebuie să fie luate în considerare, ar trebui să fie colectate mai multe date și, prin urmare, o mai mare va fi volumul de articole care urmează să fie incluse în calcul, ceea ce va face cu formula mai mare.

Cu toate acestea, comun în toate aceste formule care există o axă verticală (ordonata sau axa Y) și o axă orizontală (abscisă sau X axa) calculat apoi reprezentat grafic printr-un sistem cartezian.

De aici se fac interpretările datelor (a se vedea secțiunea următoare) și se fac concluzii sau predicții. În orice situație, premizele statistice pot fi folosite pentru a cântări variabilele, cum ar fi:

Exogenitatea slabă

Aceasta înseamnă că variabila ar trebui să fie asumată cu o valoare fixă ​​care, cu greu, nu se poate suporta schimbărilor din modelul său datorită cauzelor externe proprii.

2-caractere liniare

Aceasta presupune că valorile variabilelor, precum și ale altor parametri și coeficienți de predicție trebuie să fie arătate ca o combinație liniară de elemente care pot fi reprezentate în grafic, în sistemul cartezian.

- Homocedasticitatea

Aceasta trebuie să fie constantă. Aici se înțelege că, indistinct de variabilele predictive, trebuie să existe aceeași variație a erorilor pentru fiecare variabilă de răspuns diferită.

4- Independența

Aceasta se aplică numai erorilor variabilelor de răspuns, care trebuie prezentate separat și nu ca un grup de erori care reprezintă un model definit.

5- Absența multicoliniarității

Este folosit pentru variabile independente. Se întâmplă atunci când încercați să studiați ceva, dar sunt disponibile foarte puține informații, astfel încât pot exista multe răspunsuri și, prin urmare, valorile pot avea multe interpretări, care în cele din urmă nu rezolvă problema.

Există și alte ipoteze decât sunt luate în considerare, dar cele prezentate mai sus, în mod clar că regresia liniară multiplă necesită o mulțime de informații nu numai pentru a avea un studiu mai riguros, cuprinzătoare și fără părtinire, dar că soluția la întrebarea propunerea este concretă.

Adică, trebuie să meargă la un punct cu ceva foarte specific, specific, care nu se supune la vagă și care, în cea mai mică măsură posibilă, duce la erori.

Rețineți că regresia liniară multiplă nu este infailibilă și poate fi predispusă la erori de calcul și inexactități. Acest lucru nu se datorează atât persoanei care efectuează studiul, ci și datorită faptului că un anumit fenomen al naturii nu este complet previzibil și nu este neapărat produsul unei anumite cauze.

Se întâmplă de multe ori că orice obiect se poate schimba brusc sau că un eveniment apare din acțiunea (sau inacțiunea) a numeroase elemente care interacționează unul cu celălalt.

Interpretări ale graficii

Odată ce datele au fost calculate conform modelelor proiectate în fazele anterioare ale studiului, formulele vor produce valori care pot fi reprezentate într-un grafic.

În această ordine de idei, sistemul cartesian nu va arăta câteva puncte care vor corespunde variabilelor calculate. Unele vor fi mai mult în axa ordinelor, în timp ce altele vor fi mai mult pe axa absciselor. Unii vor fi mai grupați, în timp ce alții vor fi mai izolați.

Pentru a observa complexitatea implicată în interpretarea datelor din grafice, se poate observa, de exemplu, Cvartetul Ascombe. În acest cvartet, sunt tratate patru seturi diferite de date, fiecare dintre ele fiind într-un grafic separat care, prin urmare, merită o analiză separată.

Linearitatea rămâne, dar punctele din sistemul cartezian trebuie privite foarte atent înainte de a cunoaște cum se întâlnesc piesele puzzle-ului. Ulterior, se pot formula concluziile pertinente.

Desigur, există mai multe mijloace pentru ca aceste piese să se potrivească împreună, deși urmează diferite metode descrise în manualele de calcul specializate.

regresie liniară multiplă, așa cum sa menționat deja, depinde de multe variabile ca obiect de studiu și domeniul în care se aplică, astfel încât procedurile în economie nu sunt aceleași ca și în medicină sau informatică. În toate, da, se face o estimare, o ipoteză care este apoi verificată la sfârșit.

Extensii de regresie liniară multiplă

Există mai multe tipuri de regresie liniară, cum ar fi simple și generale, dar există și câteva fațete de regresie multiplă care se adaptează diferitelor obiecte de studiu și, prin urmare, nevoilor științei.

Acestea se ocupă, de obicei, de un număr mare de variabile, astfel încât puteți vedea adesea modele precum multivariate sau pe mai multe niveluri. Fiecare utilizează postulate și formule de complexitate variată, astfel încât interpretarea rezultatelor acestora să aibă o importanță mai mare.

Metode de estimare

Există o gamă largă de proceduri pentru a estima datele obținute prin regresie liniară multiplă.

Din nou, aici totul depinde de soliditatea modelului utilizat, formulele de calcul, numărul de variabile, postulatelor teoretice care au fost luate în considerare, zona de studiu, algoritmii care sunt programate în programe de calculator specializate și , prin excelență, complexitatea obiectului, fenomenului sau evenimentului care este analizat.

Fiecare metodă de estimare utilizează formule complet diferite. Niciuna nu este perfectă, dar are virtuți unice care trebuie folosite în conformitate cu studiul statistic realizat.

Există tot felul: variabile instrumentale generalizate mai mici pătrate, de regresie liniară bayesiană, modele mixte, Tihonov de regularizare, Estimatorul de regresie cuantila Theil-Sen și o lungă listă de instrumente cu care puteți studia datele cu mai multă precizie.

Utilizări practice

Regresia liniară multiplă este utilizată în diverse domenii de studiu și, în multe cazuri, este necesară asistența programelor de calculator pentru a obține date mai precise.

Astfel, marja de eroare care rezultă din calcule manuale (având în vedere prezența multor variabile independente și dependente, nu este surprinzător faptul că acest tip de regresie liniară este prevăzută pentru greșeli sunt reduse, deoarece multe date și factori prelucrate).

În analiza tendințelor pieței, examinăm, de exemplu, dacă unele date, cum ar fi prețurile unui produs, au crescut și au scăzut, dar mai ales când și de ce.

Când este analizat doar când există variații importante ale numărului într-o anumită perioadă de timp, în special dacă schimbările sunt neașteptate. De ce căutați factorii precisi sau probabili prin care produsul a crescut, a scăzut sau a menținut prețul său de vânzare cu amănuntul?

În mod similar, științe ale sănătății (medicină, bioanaliză, farmacie, epidemiologie, etc.) beneficiază de studiu de regresie liniară multiplă, în care indicatorii de sănătate, cum ar fi mortalitatea, morbiditatea și nașterii.

În aceste cazuri, puteți dintr-un studiu care începe cu observația, deși după un model care se face pentru a determina dacă variația unora dintre acești indicatori se datorează unor specifice, atunci când cauza și de ce.

Finanțele utilizează de asemenea regresie liniară multiplă pentru a investiga avantajele și dezavantajele realizării anumitor investiții. Aici este întotdeauna necesar să se știe când se efectuează tranzacțiile financiare, cu cine și care erau beneficiile așteptate.

Nivelurile de risc vor fi mai mari sau mai mici în funcție de diferiții factori care sunt luați în considerare la evaluarea calității acestor investiții, luând în considerare și volumul schimbului monetar.

Cu toate acestea, este în economia în care acest instrument de calcul este cel mai folosit. Prin urmare, în această știință se utilizează mai multe regresii liniare pentru a prevedea cheltuielile de consum, cheltuielile de investiții, achizițiile, exporturile, importurile, activele, cererea de muncă, ofertele de muncă și multe alte elemente.

Toate acestea sunt legate de macroeconomie și microeconomie, fiind prima dintre ele în care variabilele de analiză a datelor sunt mai abundente deoarece sunt localizate la nivel global.

referințe

  1. Baldor, Aurelio (1967). Planeta și geometria spațiului, cu o introducere în trigonometrie. Caracas: Editorial Cultura Venezolana, S.A.
  2. Spitalul Universitar Ramón y Cajal (2017). Model de regresie liniară multiplă. Madrid, Spania: HRC, Comunitatea Madrid. Adus de la www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Regresie multiplă în cercetarea comportamentală: Explicație și predicție, ediția a 2-a. New York: Holt, Rinehart & Winston.
  4. Rojo Abuín, J.M. (2007). Regresie liniară multiplă Madrid, Spania: Centrul de Științe Umane și Sociale. Recuperat de la humanidades.cchs.csic.es.
  5. Universitatea Autonomă din Madrid (2008).Regresie liniară multiplă Madrid, Spania: UAM. Recuperat de la web.uam.es.
  6. Universitatea din A Coruña (2017). Model de regresie liniară multiplă; Corelația. La Coruña, Spania: UDC, Departamentul de Matematică. Recuperat de la dm.udc.es.
  7. Uriel, E. (2017). Regresie liniară multiplă: estimare și proprietăți. Valencia, Spania: Universitatea din Valencia. Adus de la www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel și Suriñach Caral, Jordi (2002). Model de regresie liniară multiplă: specificație, estimare și contrast. Catalonia: UOC Editorial.