Grupinių duomenų centrinės tendencijos

Statistinių duomenų grupių duomenų centrinės tendencijos yra naudojamos apibūdinant tam tikrą pateiktų duomenų grupės elgesį, pvz., Kokią vertę jie yra artimi, koks yra surinktų duomenų vidurkis.

Kai gaunama daug duomenų, naudinga juos suskirstyti, kad jie būtų geriau tvarkomi ir galėtų apskaičiuoti tam tikras centrinės tendencijos priemones.

Tarp labiausiai naudojamų centrinės tendencijos matų yra aritmetinis vidurkis, mediana ir režimas. Šie skaičiai nurodo tam tikras savybes apie duomenis, surinktus konkrečiame eksperimente.

Norint naudoti šias priemones, pirmiausia reikia žinoti, kaip grupuoti duomenis.

Sugrupuoti duomenys

Norėdami grupuoti duomenis pirmiausia turite apskaičiuoti duomenų diapazoną, kuris gaunamas atimant didžiausią vertę, atėmus mažiausią duomenų vertę.

Tada pasirinkite numerį „k“, kuris yra klasių, kuriose norite grupuoti duomenis, skaičius.

Toliau skirstome intervalą tarp «k», kad gautume grupuojamų klasių amplitudę. Šis skaičius yra C = R / k.

Galiausiai pradėtas grupavimas, kuriam pasirinktas mažesnis skaičius, nei mažiausia gautų duomenų vertė.

Šis numeris bus apatinė pirmos klasės riba. Tam pridedama C. Gauta vertė bus viršutinė pirmos klasės riba.

Tada prie šios vertės pridedama C ir gaunama antrojo klasės viršutinė riba. Tokiu būdu mes tęsiame tol, kol gauname paskutinės klasės viršutinę ribą.

Po to, kai duomenys yra sugrupuoti, galėsite apskaičiuoti vidurkį, vidurkį ir režimą.

Norėdami parodyti, kaip apskaičiuojamas aritmetinis vidurkis, mediana ir režimas, mes tęsime pavyzdį.

Pavyzdys

Todėl grupuodami duomenis gausite tokią lentelę kaip:

Trys pagrindinės centrinės tendencijos priemonės

Dabar mes pradėsime apskaičiuoti aritmetinį vidurkį, medianą ir režimą. Ankstesnis pavyzdys bus naudojamas šiai procedūrai iliustruoti.

1 - aritmetinis vidurkis

Aritmetinis vidurkis yra kiekvieno dažnio padauginimas iš intervalo vidurkio. Tada pridedami visi šie rezultatai, ir galiausiai jis padalijamas iš visų duomenų.

Naudojant ankstesnį pavyzdį galėtume gauti, kad aritmetinis vidurkis yra lygus:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5, 11111

Tai rodo, kad lentelėje pateikta duomenų vidutinė vertė yra 5.11111.

2 - Vidutinis

Norėdami apskaičiuoti duomenų rinkinio mediana, pirmiausia visi duomenys yra užsakomi nuo mažiausiai iki didžiausių. Galima pateikti du atvejus:

- Jei duomenų skaičius yra nelyginis, tada mediana yra duomenys, kurie yra teisingi centre.

- Jei duomenų skaičius yra lygus, mediana yra dviejų duomenų, kurie lieka centre, vidurkis.

Kalbant apie sugrupuotus duomenis, mediana apskaičiuojama taip:

- apskaičiuojamas N / 2, kur N yra bendri duomenys.

- Pirmasis intervalas yra ieškomas, kai sukauptas dažnis (dažnių suma) yra didesnis nei N / 2, ir pasirinkta šios intervalo apatinė riba, vadinama Li.

Mediana apskaičiuojama pagal šią formulę:

Me = Li + (Ls-Li) * (N / 2 - susikaupęs dažnis prieš Li) / [Li, Ls] dažnis

Ls yra aukščiau nurodytos ribos viršutinė riba.

Jei naudojama aukščiau pateikta duomenų lentelė, turime N / 2 = 18/2 = 9. Surinkti dažniai yra 4, 8, 14 ir 18 (po vieną kiekvienai lentelės eilutei).

Todėl reikia pasirinkti trečiąjį intervalą, nes sukauptas dažnis yra didesnis nei N / 2 = 9.

Taigi Li = 5 ir Ls = 7. Taikant pirmiau aprašytą formulę turite:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5, 33333.

3 - Mada

Mada - tai vertybė, turinti dažniausiai tarp visų grupuotų duomenų; tai yra vertė, kuri daugiausiai kartojama pradiniame duomenų rinkinyje.

Kai turite labai daug duomenų, ši formulė naudojama grupuotų duomenų režimui apskaičiuoti:

Mo = Li + (Ls-Li) * (Li dažnis - L (i-1) dažnis) ((L (i-1)) dažnio dažnis (L (dažnio dažnis L ( i + 1)))

Intervalas [Li, Ls] yra intervalas, kuriame randamas didžiausias dažnis. Šiame straipsnyje pateiktame pavyzdyje mes turime tą madą:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Kita formulė, naudojama norint gauti apytikslę mados vertę, yra tokia:

Mo = Li + (Ls-Li) * (dažnis L (i + 1)) / (dažnis L (i-1) + dažnis L (i + 1)).

Pagal šią formulę sąskaitos yra tokios:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.