При изучении некоторой дискретной случайной величины в результате 40 независимых наблюдений получена выборка 10, 13, 10, 9, 9, 12, 12, 6, 7, 9, 7, 8, 8, 9, 13, 14, 9, 11, 9, 8, 10, 10, 11, 11, 11, 12, 8, 7, 9, 10, 14, 13, 8, 8, 9, 10, 11, 11, 12, 12. Составьте статистический ряд, постройте полигон и кумуляту, вычислите статистические характеристики.
Проделаем следующие шаги:
1. Определим диапазон значений: наименьшее и наибольшее значение в выборке. В данном случае наименьшее значение равно 6, а наибольшее равно 14.
2. Вычислим шаг интервала. Для этого разницу между наибольшим и наименьшим значением поделим на количество интервалов. Количество интервалов можно выбирать самостоятельно, но рекомендуется использовать примерно от 5 до 20. В данном случае выберем 5 интервалов: (14-6)/5 = 1.6. Округлим эту величину до большего целого числа - шаг интервала равен 2.
3. Создадим интервалы, начиная с наименьшего значения и увеличивая его на шаг интервала. Первый интервал будет от 6 до 8, второй - от 8 до 10 и так далее. Последний интервал будет от 12 до 14. Всего у нас получится 5 интервалов.
4. Подсчитаем частоту попадания значений в каждый интервал. Для этого организуем подсчет следующим образом:
- В первом интервале (6-8) входят значения 6, 7, 7. Таким образом, частота этого интервала будет 3.
- Во втором интервале (8-10) входят значения 8, 8, 9, 9, 9, 8, 8. Частота второго интервала будет 7.
- В третьем интервале (10-12) входят значения 10, 10, 10, 10, 10, 11, 11, 11, 11, 12, 12. Частота третьего интервала будет 11.
- В четвертом интервале (12-14) входят значения 12, 12, 13, 13, 14. Частота четвертого интервала будет 5.
- В пятом интервале (14-16) входят значения 14. Частота пятого интервала будет 1.
Теперь, используя полученные значения, построим полигон и кумуляту.
Полигон - это график, на котором по оси абсцисс откладываются значения интервалов, а по оси ординат - соответствующие им частоты.
Кумулята - это сумма всех предыдущих частот, которая на графике откладывается по оси ординат.
Для удобства построения графиков составим таблицу со значениями интервалов и соответствующими им частотами:
Интервал | Частота
------------ | ------
6-8 | 3
8-10 | 7
10-12 | 11
12-14 | 5
14-16 | 1
Теперь построим графики.
Полигон:
^
| +---+
15 |-+ | |
| | | |
| | | |
| | | |
| | +---+ |
| +-|---| |
| | | |
| | | |
| | | |
+---|---|---|----->
6 8 10 12
Кумулята:
^
| +---+
35 |-+ | |
| | | |
| | | |
| | | |
| | | |
| +---+ | |
20 |-|---+ |
| | | |
| | | |
+---|---+----|----->
6 10 14
На графиках полигона и кумуляты откладываются значения интервалов по оси абсцисс, а соответствующие им частоты (или кумулятивные частоты) - по оси ординат.
Теперь вычислим статистические характеристики. Для данного случая рассмотрим следующие характеристики: моду, медиану, среднее арифметическое и дисперсию.
Мода - это значение, которое наиболее часто встречается в выборке. В данном случае значение моды будет 10, так как оно встречается чаще всего (7 раз).
Медиана - это значение, которое делит выборку на две равные части. Чтобы найти медиану, нужно упорядочить выборку по возрастанию и выбрать средний элемент. В данном случае, после упорядочивания, выбираем значение 10, так как оно находится посередине.
Среднее арифметическое - это сумма всех значений выборки, поделенная на их количество. В данном случае: (10+13+10+9+9+12+12+6+7+9+7+8+8+9+13+14+9+11+9+8+10+10+11+11+11+12+8+7+9+10+14+13+8+8+9+10+11+11+12+12) / 40 = 9.575.
Дисперсия - это мера разброса значений выборки относительно их среднего значения. Чтобы ее найти, нужно вычислить сумму квадратов разностей между каждым значением выборки и средним значением, а затем поделить эту сумму на количество значений в выборке минус 1. В данном случае:
((10-9.575)^2+(13-9.575)^2+...+(12-9.575)^2) / (40-1) = 3.167.
Итак, мы построили статистический ряд, полигон и кумуляту, а также вычислили статистические характеристики: моду, медиану, среднее арифметическое и дисперсию.