Természet | Grafikus ábrázolás |
---|---|
Feltalálók | John Tukey , Mary Eleanor Spear ( in ) |
A feltalálás dátuma | 1970-es évek |
A grafikus ábrázolás a statisztikai adatok , a box-plot (más néven , mint egy doboz diagram , Tukey box vagy box-and-whisker grafikont , egyszerűbben box plot angolul) egy gyors módja annak, hogy képviselje az alapvető profilja sorozata. Mennyiségi statisztikákat. John Tukey találta ki 1977-ben , de a felhasználók szerint bizonyos módosítások tárgyát képezheti. Neve a Box and Whiskers Plot fordítása .
A boxplot csak néhány mutatót foglal össze a vizsgált tulajdonság helyzetéről ( medián , kvartilis , minimum, maximum vagy decilis ). Ezt a diagramot elsősorban ugyanazon tulajdonság összehasonlítására használják két különböző méretű populációban.
Ez egy olyan téglalap rajzolása, amely az első kvartilisből a harmadik kvartilisbe megy és amelyet a medián vág. Ez a téglalap elegendő a dobozdiagramhoz . Ezután hozzáadjuk a végén a szegmensek vezető szélső értékek, vagy az első és kilencedik decilisek ( ), illetve a 5 -én és 95 -én százalékosztályok. Ezt boxplot diagramnak vagy láb diagramnak nevezzük.
Két dobozdiagram összehasonlítása a következőkkel :
- a felső doboz: Q1 = 7, M = 9, Q3 = 12 ,, ;
- az alsó doboz esetében: Q1 = 3, M = 7, Q3 = 12 , .
A Tukey-féle parcellákon a "bajusz" hossza 1,5-szerese az interkvartilis tartománynak . Ezeket a Tukey-diagramokat olyan területeken használták, ahol az adatokat leggyakrabban normál eloszlás segítségével modellezhetik ; ebben az esetben az elmélet azt mutatja, hogy a végén a „bajusz” közel vannak az első és a 99 th percentil (0,022 és 0,978 pontosan): ezek a diagramokat elsősorban jelenlétének kimutatására rendkívüli adatokat.
Lábas dobozoknak vagy Box Plot-nek is nevezik őket .
Ez a példa a következő 20 adatponttal ellátott méréssorozaton alapul:
1 | 2 | 3 | 4 | 5. | 6. | 7 | 8. | 9. | 10. | 11. | 12. | 13. | 14 | 15 | 16. | 17. | 18. | 19. | 20 | |
(válogatás nélkül) | 9. | 6. | 7 | 7 | 3 | 9. | 10. | 1 | 8. | 7 | 9. | 9. | 8. | 10. | 5. | 10. | 10. | 9. | 10. | 8. |
(rendezve) | 1 | 3 | 5. | 6. | 7 | 7 | 7 | 8. | 8. | 8. | 9. | 9. | 9. | 9. | 9. | 10. | 10. | 10. | 10. | 10. |
A boxplot segít nagyon gyorsan áttekinteni ezeket az adatokat. Így láthatóvá teszi azt a tényt, hogy a medián pontosan egyenlő 8,5-vel (átlag = 7,75), és hogy az adatok 25% -ának mindegyike kevesebb, mint 7, és nagyobb, mint 9,5. Pontosan ezek a doboz méretei, amelyek a mért értékek 50% -át tartalmazzák. Ezért az interkvartilis tartomány, amely a doboz hossza, pontosan 2,5.
Ez a boxplot az interkvartilis tartomány 1,5-szeresének vagy legfeljebb 3,75 egység hosszúságú bajuszokkal készült. A bajusz azonban továbbra is csak az adatok egy értékét éri el, amely még mindig abban a 3,75 egységben van. Tehát a felső bajusz felmegy 10-re, mert nincs nagyobb érték az adatokban, az alsó bajusz pedig 5-ig, mert a közvetlenül az alsó érték több mint 3,75 a mező elejétől.
Az 1. és a 3. értéket a fiókdiagramban kiugró értékként jelölik, mert nem a dobozban vagy a bajuszban vannak. Ezeket az értékeket meg kell vizsgálni, hogy valóban outlierek vagy elgépelési hibák, vagy gyanúsak-e.
Mivel a terület mediánja kissé felfelé emelkedik, aszimmetriára is lehet következtetni a mért adatok mögöttes eloszlásából. Ez a megoszlás valószínűleg nem normális eloszlás, mert a dobozdiagram ferde és viszonylag sok kiugrást tartalmaz.