Szórás - Excel és Google Táblázatok

Ez a bemutató bemutatja, hogyan kell használni Excel standard eltérés funkció az Excelben a teljes populáció szórásának kiszámításához.

STANDARD DEVIATION Funkció áttekintés

A STANDARD DEVIATION függvény Kiszámítja a szórás kiszámítását egy egész populációra.

A STANDARD DEVIATION Excel munkalap funkció használatához válasszon ki egy cellát és írja be:

(Figyelje meg, hogyan jelennek meg a képletbemenetek)

STANDARD DEVIATION funkció Szintaxis és bemenetek:

1 = STDEV (szám1, [szám2],…)

számokat- Értékek a standard szóráshoz

Hogyan lehet kiszámítani a szórást az Excelben

Amikor adatokkal foglalkozik, érdemes néhány alapvető tesztet futtatni, hogy segítsen megérteni azokat. Általában az átlag kiszámításával kezdi az Excel ÁTLAG függvény <> használatával.

Így képet kaphat arról, hogy hol van az adatok „közepe”. Innentől kezdve meg kell vizsgálnia, hogy az adatok mennyire oszlanak meg ezen középső pont körül. Itt jön be a szórás.

Az Excel számos funkciót biztosít a szórás kiszámításához - STDEV, STDEV.P, STDEV.S és DSTDEV. Mindegyikhez eljutunk, de először tanuljuk meg, mi a szórás van, pontosan.

Mi az a szórás?

A szórás képet ad arról, hogy az adatpontok milyen messze vannak az átlagtól. Vegye ki a következő adathalmazt a 100 -ból:

1 48,49,50,51,52

Ennek az adathalmaznak az átlaga 50 (összesítse a számokat, és ossza el n -el, ahol n a tartomány értékeinek száma).

Most nézze meg ezt a következő adathalmazt:

1 10,25,50,75,90

Ennek az adathalmaznak az átlaga az is 50 - de a két tartomány egészen más történetet mesél el. Ha csak az átlagot használná, azt gondolhatná, hogy a két csoport alkalmassága megközelítőleg egyenlő - és átlagosan azok is.

De az első csoportban 5 emberünk van, akik nagyon hasonló, nagyon közepes pontszámokat kaptak. A második csoportban pedig néhány magasan repülõ ember kiegyensúlyozott pár gyenge gólszerzõvel, egy ember középen. Az terjedés a pontszámok nagyon eltérőek, így az adatok értelmezése is nagyon eltérő.

A szórás a szórás mértéke.

A standard szórás kiszámításának módja

Annak megértéséhez, hogy mi a szórás és hogyan működik, segíthet egy példa kézi feldolgozása. Így tudni fogja, hogy mi történik „a motorháztető alatt”, amint elérjük a használható Excel funkciókat.

A szórás kiszámításához végezze el ezt a folyamatot:

1) Számítsa ki az átlagot

Vegyük az első adathalmazunkat: 48,49,50,51,52

Már tudjuk az átlagot (50), amit itt megerősítettem az Excel ÁTLAG függvénnyel <>:

1 = ÁTLAG (C4: C8)

2) Vonja le az átlagot az adatkészlet minden értékéből

Ezt a következő képlettel csináltam:

1 = C4- $ H $ 4

Átlagunk a H4 -ben van, és a cellák hivatkozását "lezártam" azáltal, hogy a dollárjeleket az oszlop és a sor elé helyeztem (az F4 megnyomásával). Ez azt jelenti, hogy a cellahivatkozás frissítése nélkül le tudom másolni a képletet az oszlopba.

Az eredmény:

Most itt álljunk meg egy pillanatra. Ha megnézi az új oszlopot - látni fogja, hogy a számok itt nullát tesznek ki. Ezen számok átlaga szintén nulla.

Természetesen adataink terjedése nem lehet nulla - tudjuk, hogy van némi eltérés. Szükségünk van arra, hogy ezt az eltérést ábrázoljuk, anélkül, hogy az átlag nulla lenne.

3) Nézd meg a különbségeket!

Ezt úgy érhetjük el, ha a különbségeket négyzetbe vesszük. Tehát adjunk hozzá egy új oszlopot, és négyzeteljük a számokat a D oszlopban:

1 = D4*D4

Ez jobban néz ki. Most van némi eltérésünk, és az eltérés mértéke attól függ, hogy az egyes pontszámok milyen messze vannak az átlagtól.

4) Számítsa ki a szórást - a négyzeteltérések átlaga

A következő lépés az, hogy megkapjuk a négyzetes különbségek átlagát. Ennek valójában két módja van a szórás kiszámításakor.

  • Ha használja lakossági adatok, egyszerűen az átlagot veszi (összegzi az értékeket, és osztja n -vel)
  • Ha használja minta adat, összeadja az értékeket, és oszt n-1

A népességi adatok azt jelentik, hogy az adatok „teljes készlete” megvan, például az adott osztály minden tanulójáról adatai vannak.

A mintaadatok azt jelentik, hogy nincsenek meg az összes adatod, csak egy nagyobb populációból vett minta. A mintaadatokkal általában az a célunk, hogy megbecsüljük, mi az érték a nagyobb populációban.

A politikai közvélemény -kutatás jó példa a mintaadatokra - a kutatók mondjuk 1000 embert kérdeznek fel, hogy képet kapjanak arról, mit gondol egy egész ország vagy állam.

Itt nincs minta. Öt statisztikailag gondolkodó családtagunk van, akik ki akarják számítani egy teszt szórását, amelyet mindannyian elvégeztek. Minden adatpont megvan, és nem készítünk becslést az emberek nagyobb csoportjáról. Ezek a népességi adatok - tehát csak az átlagot vehetjük itt:

1 = ÁTLAG (E4: E8)

Rendben, tehát 2 -et kaptunk. Ezt a pontszámot „varianciának” nevezik, és ez sok statisztikai teszt alapja, beleértve a szórást is. A szórásról bővebben a főoldalán olvashat: hogyan kell kiszámítani az eltérést az Excelben <>.

5) Szerezd meg a szórás négyzetgyökét

Korábban négyzetbe tettük a számokat, ami nyilvánvalóan kicsit felfújja az értékeket. Tehát ahhoz, hogy a számot összhangba hozzuk a pontszámok tényleges eltéréseivel az átlagtól, négyzetgyökre kell állítanunk a 4. lépés eredményét:

1 = SQRT (H4)

És megvan az eredményünk: a szórás 1,414

Mivel a négyzet alakú számokat négyzetgyökereztük, az eredeti adatokkal megegyező mértékegységben megadott szórás. Tehát a szóráson kívül 1,414 tesztpont.

Szórás, ha az adatok jobban elterjedtek

Korábban volt egy második példa adattartományunk: 10,25,50,75,90

Csak szórakozásból lássuk, mi történik, ha kiszámítjuk ezen adatok szórását:

Minden képlet pontosan ugyanaz, mint korábban (vegye figyelembe, hogy a teljes átlag még mindig 50).

Az egyetlen dolog, ami változott, a C oszlopban elért pontszámok eloszlása ​​volt. Most azonban a szórásunk jóval magasabb, 29,832 tesztpont.

Természetesen, mivel csak 5 adatpontunk van, nagyon könnyen belátható, hogy a pontszámok eloszlása ​​eltérő a két halmaz között. De ha 100 vagy 1000 adatpontja van, ezt nem tudja megmondani az adatok gyors beolvasásával. És pontosan ezért használjuk a szórást.

Az Excel függvények a szórás kiszámításához

Most, hogy ismeri a szórás működését, nem kell végigcsinálnia az egész folyamatot a szórás eléréséhez. Csak az Excel egyik beépített funkcióját használhatja.

Az Excelnek több funkciója van erre a célra:

  • P kiszámítja a populációs adatok szórását (a fenti példában használt módszerrel)
  • S kiszámítja a mintaadatok szórását (a korábban érintett n-1 módszerrel)
  • STDEV pontosan ugyanaz, mint az STDEV.S. Ez egy régebbi funkció, amelyet az STDEV.S és az STDEV.P váltott fel.
  • STDEVA nagyon hasonlít az STDEV.S -hez, kivéve, hogy számításakor szöveges és logikai (IGAZ/HAMIS) cellákat tartalmaz.
  • STDEVPA nagyon hasonló az STDEV.P -hez, kivéve, hogy a számítás során szöveges és logikai (IGAZ/HAMIS) cellákat tartalmaz.

Hú, sok lehetőség van itt! Ne ijedjen meg - az esetek túlnyomó többségében az STDEV.P vagy az STDEV.S eszközt fogja használni.

Végezzük el mindegyiket sorban, kezdve az STDEV.P-vel, mivel ez az a módszer, amin most dolgoztunk.

Az Excel STDEV.P függvény

Az STDEV.P kiszámítja a populációs adatok szórását. Így használod:

1 = STDEV.P (C4: C8)

Az STDEV.P -ben definiálhat egy érvet: azt az adattartományt, amelyhez ki szeretné számítani a szórást.

Ugyanez a példa, amelyen lépésről lépésre haladtunk, amikor kézzel kiszámítottuk a szórást. És amint fent láthatja, pontosan ugyanazt az eredményt kapjuk - 1.414.

Megjegyzés Az STDEV.P figyelmen kívül hagy minden szöveget vagy logikai (IGAZ/HAMIS) értéket tartalmazó cellát. Ha ezeket fel kell vennie, használja az STDEVPA -t.

Az Excel STDEV.S függvény

Az STDEV.S kiszámítja a mintaadatok szórását. Használja így:

1 = STDEV.S (C4: C8)

Ismét egy érvre van szükség - az adattartományra vonatkozóan, amelyre vonatkozóan meg szeretné tudni a szórást.

Mielőtt belekezdenénk egy példába, beszéljük meg az STDEV.S és az STDEV.P közötti különbséget.

Amint azt már tárgyaltuk, az STDEV.S -t kell használni a mintaadatokon - ha az adatok egy nagyobb halmaz részei. Tegyük fel most, hogy a fenti példánkban többen vették át a tesztet. Mindenki, aki elvégezte a tesztet, szeretnénk megbecsülni a szórást, csak ezt az öt pontot használva. Most mintaadatokat használunk.

Most a számítás eltér a fenti (4) lépéstől, amikor kiszámítjuk a szórást - az egyes pontszámok négyzetes különbségének átlagát az átlagtól.

Ahelyett, hogy a normál módszert használnánk - összesítsük az összes értéket, és osszuk el n -vel, összesítjük az összes értéket, és osztjuk n-1:

1 = SUM (E4: E8) / (COUNT (E4: E8) -1)

Ebben a képletben:

  • A SUM megkapja a négyzeteltérések összegét
  • A COUNT az n értékét adja vissza, amelyből kivonunk 1 -et
  • Ezután egyszerűen elosztjuk összegünket az n-1-gyel

Ezúttal a négyzetes különbségek átlaga 2,5 (emlékezhet, hogy korábban 2 volt, tehát egy kicsit magasabb).

Tehát miért osztunk n helyett 1 helyett n, amikor mintaadatokat kezelünk?

A válasz meglehetősen összetett, és ha csak a számokat szeretné futtatni, hogy megértse az adatait, akkor nem igazán kell ezzel foglalkoznia. Csak győződjön meg arról, hogy az STDEV.S -t használja a mintaadatokhoz, és az STDEV.P -t a populációs adatokhoz, és minden rendben lesz.

Ha igazán kíváncsi rá, miért, akkor tekintse meg a főoldalt az Excel szórásának kiszámításáról <>.

Rendben, tehát megvan a minta szórása, így a minta szórásának kiszámításához csak a variancia négyzetgyökét kapjuk meg:

1 = SQRT (H4)

1.581 -et kapunk.

Az STDEV.S elvégzi helyettünk a fenti számításokat, és csak egy cellában adja vissza a minta szórást. Lássuk tehát, mit hoz ez…

1 = STDEV.S (C4: C8)

Igen, megint 1.581.

Az Excel STDEV függvény

Az Excel STDEV függvénye pontosan ugyanúgy működik, mint az STDEV.S - vagyis kiszámítja az adatminta szórását.

Hasonló módon használja:

1 = STDEV (C4: C8)

Ismét ugyanazt az eredményt kapjuk.

Fontos jegyzet: Az STDEV egy „kompatibilitási funkció”, ami alapvetően azt jelenti, hogy a Microsoft megszabadul tőle. Egyelőre még működik, így a régebbi táblázatok továbbra is a megszokott módon működnek. Az Excel későbbi verzióiban azonban a Microsoft teljesen elvetheti, ezért az STDEV.S helyett az STDEV helyett kell használni, ahol csak lehetséges.

Az Excel STDEVA függvény

Az STDEVA -t a minta szórásának kiszámítására is használják, de van néhány fontos különbség, amit tudnia kell:

  • Az IGAZ értékek 1 -nek számítanak
  • A HAMIS értékek 0 -nak számítanak
  • A szöveg karakterláncok 0 -nak számítanak

Használja a következőképpen:

1 = STDEVA (C4: C8)

További négy barát és családtag adta meg a teszt eredményeit. Ezek a C oszlopban láthatók, a D oszlop pedig azt jelzi, hogy az STDEVA hogyan értelmezi ezeket az adatokat.

Mivel ezeket a cellákat ilyen alacsony értékekként értelmezik, ez sokkal szélesebb elterjedést eredményez adataink között, mint korábban láttuk, ami nagymértékben megnövelte a szórást, most 26.246 -nál.

Az Excel STDEVPA függvénye

Az STDEVPA ugyanúgy kiszámítja a populáció szórását, mint az STDEV.P. Ez azonban a logikai értékeket és szöveges karakterláncokat is tartalmazza a számításban, amelyeket a következőképpen értelmezünk:

  • Az IGAZ értékek 1 -nek számítanak
  • A HAMIS értékek 0 -nak számítanak
  • A szöveg karakterláncok 0 -nak számítanak

Így használod:

1 = STDEVPA (C4: C12)

Adatok szűrése a szórás kiszámítása előtt

A való világban nem lesz mindig egy pontosan rendezett táblázatban a szükséges adatok. Gyakran előfordul, hogy egy nagy táblázat van tele adatokkal, amelyeket szűrni kell, mielőtt kiszámítja a szórást.

Ezt nagyon könnyen megteheti az Excel adatbázis -funkcióival: DSTDEV (mintákhoz) és DSTDEVP (populációkhoz).

Ezek a funkciók lehetővé teszik egy feltételtáblázat létrehozását, amelyben megadhatja az összes szükséges szűrőt. A funkciók ezeket a szűrőket a színfalak mögött alkalmazzák, mielőtt visszatérnek a szóráshoz. Így nem kell hozzáérnie egy automatikus szűrőhöz, vagy ki kell húznia az adatokat egy külön lapba - a DSTDEV és az SDTDEVP mindent megtehet Ön helyett.

További információ az Excel DSTDEV és DSTDEVP függvények főoldalán <>.

STANDARD DEVIATION Funkció a Google Táblázatokban

A STANDARD DEVIATION függvény pontosan ugyanúgy működik a Google Táblázatokban, mint az Excelben:

Segít a fejlesztés a helyszínen, megosztva az oldalt a barátaiddal

wave wave wave wave wave