Măsuri de tendință centrală pentru date grupate
măsurarea tendinței centrale a datelor grupate ele sunt folosite în statistici pentru a descrie anumite comportamente ale unui grup de date furnizate, cum ar fi valoarea la care sunt aproape, câtă medie a datelor colectate, printre altele.
Atunci când se efectuează o cantitate mare de date, este util să le grupăm pentru a avea o ordine mai bună a acestora și astfel să putem calcula anumite măsuri ale tendinței centrale.
Printre măsurile de tendință centrală cele mai utilizate sunt media aritmetică, mediana și modul. Aceste numere spun anumite calități cu privire la datele colectate într-un experiment dat.
Pentru a utiliza aceste măsuri, este necesar să cunoaștem mai întâi cum să grupăm un set de date.
Date grupate
Pentru a grupa mai întâi datele, trebuie să calculați intervalul de date, care este obținut prin scăderea celei mai mari valori minus cea mai mică valoare a datelor.
Apoi alegeți un număr "k", care este numărul de clase în care doriți să grupați datele.
Continuăm să împărțim intervalul dintre "k" pentru a obține amplitudinea claselor care urmează să fie grupate. Acest număr este C = R / k.
În cele din urmă, începe gruparea, pentru care este ales un număr mai mic decât cea mai mică valoare a datelor obținute.
Acest număr va fi limita inferioară a primei clase. La aceasta se adaugă C. Valoarea obținută va fi limita superioară a primei clase.
Apoi, se adaugă C la această valoare și se obține limita superioară a clasei a doua. În acest fel vom continua până când vom obține limita superioară a ultimei clase.
După ce datele sunt grupate, puteți trece la calcularea mediei, mediei și modului.
Pentru a ilustra modul în care se calculează media aritmetică, mediana și modul, vom proceda cu un exemplu.
exemplu
Grupați următoarele date în 4 clase.Atunci când calculați intervalul, obțineți că acesta este R = 9-1 = 8. Amplitudinea claselor este C = R / k = 8/4 = 2.
Prin urmare, atunci când grupați datele, veți obține un tabel ca:
Cele trei principale măsuri de tendință centrală
Acum vom proceda pentru a calcula media aritmetică, mediana și modul. Exemplul anterior va fi folosit pentru a ilustra această procedură.
1 - Media aritmetică
Media aritmetică constă în înmulțirea fiecărei frecvențe cu media intervalului. Apoi, toate aceste rezultate sunt adăugate, iar în final este împărțită între datele totale.
Folosind exemplul anterior, s-ar obține că media aritmetică este egală cu:
(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111
Aceasta indică faptul că valoarea medie a datelor din tabel este 5.11111.
2 - Mediu
Pentru a calcula mediana unui set de date, toate datele sunt ordonate mai întâi de la cel mai mic la cel mai mare. Se pot prezenta două cazuri:
- Dacă numărul de date este ciudat, atunci valoarea mediană este data exactă în centru.
- Dacă numărul de date este egal, atunci media este media celor două date care rămân în centru.
Când vine vorba de date grupate, calculul medianului se face în felul următor:
- se calculează N / 2, unde N reprezintă datele totale.
- primul interval în care frecvența cumulativă (frecvența sumă) este mai mare decât N / 2 este solicitată, și este selectat limita inferioară a acestui interval, numit Li.
Mediana este dată de următoarea formulă:
Me = Li + (Ls-Li) * (N / 2 - Frecventa acumulata inainte de Li) / Frecventa [Li, Ls)
Ls este limita superioară a domeniului menționat mai sus.
Dacă se utilizează tabelul de date de mai sus are la N / 2 = 18/2 = 9. Frecvențele cumulate sunt 4, 8, 14 și 18 (câte una pentru fiecare rând din tabel).
Prin urmare, trebuie selectat al treilea interval, deoarece frecvența acumulată este mai mare decât N / 2 = 9.
Deci Li = 5 și Ls = 7. Aplicând formula descrisă mai sus, trebuie să:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
Modă
Moda este valoarea care are cea mai mare frecventa intre toate datele grupate; adică este valoarea care se repetă de cele mai multe ori în setul de date inițial.
Când aveți o cantitate foarte mare de date, pentru calcularea modului de grupare a datelor se folosește următoarea formulă:
Mo = Li + (Ls-Li) * (frecvență Li - Frecvență L (i-1)) / ((frecvență Li - Frecvență L (i-1)) + (frecventa Li - Frecventa L ( i + 1)))
Intervalul [Li, Ls) este intervalul în care se găsește frecvența cea mai mare. Pentru exemplul făcut în acest articol, avem că moda este dată de:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
O altă formulă care este folosită pentru a obține o valoare aproximativă modului este următoarea:
Mo = Li + (Ls-Li) * (frecvența L (i + 1)) / (frecvența L (i-1) + frecvența L (i + 1)).
Cu această formulă, conturile sunt următoarele:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
referințe
- Bellhouse, D. R. (2011). Abraham De Moivre: stabilirea scenei pentru probabilitatea clasică și aplicațiile sale. CRC Press.
- Cifuentes, J. F. (2002). Introducere în teoria probabilităților. Universitatea Națională din Columbia.
- Daston, L. (1995). Probabilitatea clasică în iluminare. Princeton University Press.
- Larson, H. J. (1978). Introducere în teoria probabilităților și inferenței statistice. Editorial Limusa.
- Martel, P.J., & Vegas, F. J. (1996). Probabilitate și statistici matematice: aplicații în practica clinică și în managementul sănătății. Ediciones Díaz de Santos.
- Vázquez, A. L. și Ortiz, F. J. (2005). Metode statistice pentru măsurarea, descrierea și controlul variabilității. Universitatea Ed. Din Cantabria.
- Vázquez, S. G. (2009). Matematică Manual pentru acces la Universitate. Centrul de Studii Ramon Areces SA.