4. Основные понятия математической статистики. Генеральная совокупность и выборка. Статистическое распределение (вариационный ряд). Гистограмма. Полигон частот.
Математическая статистика – это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.
Генеральная совокупность – это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.
Выборка – это совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.
Статистическое распределение – это совокупность вариант xi и соответствующих им частот ni.
Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал ni или относительной частоте ni/n. Ширину интервала i можно определить по формуле Стерджеса:
I=(xmax-xmin)/(1+3,32lgn),
Где xmax – максимальное; xmin – минимальное значение вариант, а их разность носит название вариационный размах; n – объем выборки.
Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами xi, ni.
5. Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).
Мода (Мо) – это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.
Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.
Для определения моды интервальных рядов служит формула:
M0=xниж+i*((n2-n1)/(2n2-n1+n3)),
где хниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n2; n2 – частота модального класса; n1 – частота класса, предшествующего модальному; n3 – частота класса, следующего за модальным; i – ширина классового интервала.
Медиана (Ме)- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.
Выборочная средняя – это среднее арифметическое значение вариант статистического ряда
Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:
Среднее квадратическое отклонение – это квадратный корень из выборочной дисперсии:
Sв=√(Sв2)
6. Оценка параметров генеральной совокупности по ее выборке (точечная и интервальная). Доверительный интервал и доверительная вероятность.
Числовые значения, характеризующие генеральную совокупность, называются параметрами.
Статистическое оценивание может выполняться двумя :
1)точечная оценка – оценка, которая дается для некоторой определенной точки;
2)интервальная оценка – по данным выборки оценивается интервал, в котором лежит истинное значение с заданной вероятностью.
Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке.
Точечная оценка называется состоятельной, если при увеличении объема выборки выборочная характеристика стремится к соответствующей характеристике генеральной совокупности.
Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками.
Точечную оценку называют несмещенной, если ее математическое ожидание равно оценивающему параметру при любом объеме выборки.
Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя в:
в=ini,
где xi – варианты выборки; ni – частота встречаемости вариант xi; n – объем выборки.
Интервальная оценка – это числовой интервал, который определяется двумя числами – границами интервала, содержащий неизвестный параметр генеральной совокупности.
Доверительный интервал – это интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность p – это такая вероятность, что событие вероятности (1-р) можно считать невозможным. α=1-р – это уровень значимости. Обычно в качестве доверительных вероятностей используют вероятности, близкие к 1. Тогда событие, что интервал накроет характеристику, будет практически достоверным. Это р≥0,95, р≥0,99, р≥0,999.
Для выборки малого объема (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:
в-mt≤≤в+mt (р≥0,95),
+где – генеральное среднее;в – выборочное среднее; t – нормированный показатель распределения Стьюдента с(n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в данный интервал; m – ошибка выборочной средней.
4. Основные понятия математической статистики. Генеральная совокупность и выборка. Статистическое распределение (вариационный ряд). Гистограмма. Полигон частот.
Математическая статистика – это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.
Генеральная совокупность – это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.
Выборка – это совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.
Статистическое распределение – это совокупность вариант xi и соответствующих им частот ni.
Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал ni или относительной частоте ni/n. Ширину интервала i можно определить по формуле Стерджеса:
I=(xmax-xmin)/(1+3,32lgn),
Где xmax – максимальное; xmin – минимальное значение вариант, а их разность носит название вариационный размах; n – объем выборки.
Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами xi, ni.
5. Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).
Мода (Мо) – это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.
Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.
Для определения моды интервальных рядов служит формула:
M0=xниж+i*((n2-n1)/(2n2-n1+n3)),
где хниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n2; n2 – частота модального класса; n1 – частота класса, предшествующего модальному; n3 – частота класса, следующего за модальным; i – ширина классового интервала.
Медиана (Ме)- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.
Выборочная средняя – это среднее арифметическое значение вариант статистического ряда
Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:
Среднее квадратическое отклонение – это квадратный корень из выборочной дисперсии:
Sв=√(Sв2)
6. Оценка параметров генеральной совокупности по ее выборке (точечная и интервальная). Доверительный интервал и доверительная вероятность.
Числовые значения, характеризующие генеральную совокупность, называются параметрами.
Статистическое оценивание может выполняться двумя :
1)точечная оценка – оценка, которая дается для некоторой определенной точки;
2)интервальная оценка – по данным выборки оценивается интервал, в котором лежит истинное значение с заданной вероятностью.
Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке.
Точечная оценка называется состоятельной, если при увеличении объема выборки выборочная характеристика стремится к соответствующей характеристике генеральной совокупности.
Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками.
Точечную оценку называют несмещенной, если ее математическое ожидание равно оценивающему параметру при любом объеме выборки.
Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя в:
в=ini,
где xi – варианты выборки; ni – частота встречаемости вариант xi; n – объем выборки.
Интервальная оценка – это числовой интервал, который определяется двумя числами – границами интервала, содержащий неизвестный параметр генеральной совокупности.
Доверительный интервал – это интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность p – это такая вероятность, что событие вероятности (1-р) можно считать невозможным. α=1-р – это уровень значимости. Обычно в качестве доверительных вероятностей используют вероятности, близкие к 1. Тогда событие, что интервал накроет характеристику, будет практически достоверным. Это р≥0,95, р≥0,99, р≥0,999.
Для выборки малого объема (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:
в-mt≤≤в+mt (р≥0,95),
+где – генеральное среднее;в – выборочное среднее; t – нормированный показатель распределения Стьюдента с(n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в данный интервал; m – ошибка выборочной средней.
Объяснение:
1.
1)
38² - 64 = 38² - 8² = (38 - 8)(38 +8) = 30 * 46 = 1380,
2.
1)
2в² - 18 = 2 * (в² - 9) = 2 * (в - 3)(в + 3),
3)
81х² - 18ху + у² + 63х - 7у = (81х² - 18ху + у²) + (63х - 7у) =
= (9х - у)² + 7*(9х - у) = (9х - у)(9х - у + 7),
4)
m² + n² + 2mn = (m + n)².
3.
а)
(8 - 2n)(8 + 2n) + (9 + 2n)² - 64 = 64 - 4n² + 81 + 36n + 4n² - 64 =
= 36n + 81 = 9(4n + 9),
б)
(3х - 8)² + (4х - 8)(4х + 8) = 9х² - 48х + 64 + 16х² - 64 = 25х² - 48х,
при х=-2:
25 * (-2)² - 48 * (-2) = 100 + 96 = 196,
4.
1 число - х,
2 число - (х+2),
(х+2)² - х² = 188,
х² + 4х + 4 - х² = 188,
4х = 184,
х = 46 - 1 число,
х+2 = 46+2 = 48 - 2 число