Громадянам України

Чи може зведення з 5 чисел визначити форму розподілу?

Підсумок із 5 чисел — це дослідницький інструмент аналізу даних, який дає уявлення про розподіл значень для однієї змінної. У сукупності цей набір статистичних даних описує, де зустрічаються значення даних, їх центральну тенденцію, мінливість і загальну форму їх розподілу.

Зведення з п’яти чисел особливо корисне в описовому аналізі або під час попереднього дослідження великого набору даних. Підсумок складається з п’яти значень: найбільш екстремальні значення в наборі даних (максимальне та мінімальне значення), нижній та верхній квартилі та медіана.

Форма розподілу Ми можемо охарактеризувати форму набору даних за допомогою дивлячись на його гістограму. По-перше, якщо здається, що значення даних накопичуються в один «курган», ми говоримо, що розподіл унімодальний. Якщо здається, що є два «кургани», ми говоримо, що розподіл є бімодальним.

Форма t-розподілу залежить від ступені свободи. Криві з більшою кількістю ступенів свободи вищі і мають тонші хвости. Усі три t-розподіли мають «важчі хвости», ніж z-розподіл.

Підсумок із п’яти чисел дає нам миттєвий знімок розподілу кількісної змінної. Коробчаті діаграми (також називаються діаграмами коробок і вусів) дають нам спосіб візуалізувати підсумок із п’яти чисел. Наприклад, ось коробковий графік, який зображує розподіл Wt із набору даних MindsetMatters.

Форма розподілу Підсумок із п’яти чисел може дати вам загальне уявлення про те, чи є розподіл симетричним чи перекошеним. Щоб зробити це визначення, порівняйте медіану з Q1 і Q3. Коли медіана становить: приблизно посередині між Q1 і Q3, ваші дані є симетричними.