Как сделать кривую гаусса
Как сделать кривую гаусса
В современном мире жизнь каждого учащегося во многом зависит от сдачи экзаменов, ведь именно этот способ проверки знаний ставят в приоритет большинство учебных заведений.
Актуальность. Многие ученики считают, что результаты, которые они получают в ходе этих тестов, недостоверно отражают уровень их интеллекта. Изучив эту проблему более глубоко, мы узнали, что составители общероссийских тестов пользуются кривой Гаусса, т.е. кривой нормального распределения, а это значит, что их результаты должны ей соответствовать. Поэтому, в своей научно-исследовательской работе мы решили определить соответствуют ли задания ОГЭ, ЕГЭ и ВПР гауссовой кривой.
Цель работы: изучить применение кривой Гаусса составителями контрольных тестов и выяснить, соответствуют ли общепринятые экзамены кривой нормального распределения
1)Анализ литературы и сбор информации по теме «Кривые линии. Кривая Гаусса»
2)Проведение общепринятых школами тестов для обучающихся экзаменуемых классов
3)Произведение статистического анализа результатов теста
4)Сравнение полученных графиков с кривой Гаусса
5)Обобщение и систематизация полученных результатов
1)Изучение литературы и интернет источников
7)Синтез полученной информации
Объект исследования: кривая Гаусса
Предмет исследования: тесты для учащихся 5, 9 и 11 классов
Глава 1. Теоретические аспекты исследования кривых линий
1.1. Понятие кривой линии
Кривую линию можно рассматривать как траекторию движения точки на плоскости или в пространстве, а также как совокупность точек, удовлетворяющих определенному уравнению. Кривая линия может являться результатом пересечения между собой кривых поверхностей или кривой поверхности и плоскости..
Каждая кривая включает в себя геометрические элементы, которые составляют её определитель, т.е. совокупность независимых условий, однозначно определяющих эту кривую.
Различны и способы задания кривых:
Уравнением кривой линии называется такое соотношение между переменными, которому удовлетворяют координаты точки, принадлежащей кривой.
В основу классификации кривых положена природа их уравнений.
1.2. Алгебраические и трансцендентные кривые линии
Кривые подразделяются на алгебраические и трансцендентные в зависимости от того, являются ли их уравнения алгебраическими или трансцендентными в прямоугольной системе координат.
Трансцендентные кривые в отличие от алгебраических могут иметь бесконечное количество точек пересечения с прямой, точек перегиба, вершин и т.п.
Кривая линия как траектория движущейся точки должна быть непрерывной.
Движущаяся точка в любом положении должна иметь определенное направление движения. Это направление указывает прямая (касательная), проходящая через рассматриваемую точку
Кривизна произвольной кривой линии в различных точках различна, в отдельных точках она может быть равна нулю. Такие точки называются точками спрямления.
Кривизна в каждой из точек плоской кривой а определяется с помощью соприкасающейся в этой точке окружности.
Распределением называется закономерность встречаемости признака и разных его значений. Форма распределения является некоторой обобщенной характеристикой выборки.
Распределение частоты полученных результатов в виде графиков и гистограмм дает важную предварительную информацию о форме распределения признака, а именно о том, какие значения встречаются реже, какие чаще, насколько выражена изменчивость признака. Выделяют следующие типичные формы эмпирического распределения.
Равномерное распределение — когда все значения встречаются с одинаковой частотой.
Симметричное распределение — когда с одинаковой частотой встречаются крайние значения признака.
Асимметричное распределение — может быть левосторонним (когда преобладает частота малых значений) или правосторонним (когда преобладает частота больших значений).
Нормальное распределение — идеальный стандарт распределения, когда крайние значения встречаются редко и частота встречаемости постепенно повышается от крайних к серединным значениям признака.
Нормальный закон распределения играет важнейшую роль в применении математико-статистических методов в психологии. Он лежит в основе измерений, разработки тестовых шкал, методов проверки гипотез.
Нормальное распределение — вид распределения переменных, характеризуемый тем, что крайние значения признака в нем появляются достаточно редко, а значения, близкие к средней величине, — достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественнонаучных исследованиях и казалось «нормой» всякого массового проявления признаков. Это распределение следует закону, открытому в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции.
Процентное распределение случаев под нормальной кривой
График нормального распределения представляет симметричную унимодальную колоколообразную кривую (верхняя часть колокола), осью которой является вертикаль (ордината), проведенная через точку 0.
Закон нормального распределения имеет следующую формулировку: «Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения» (Наследов А. Д., 2007, с. 51).
Чтобы установить, подчиняется ли эмпирическое распределение изучаемой величины нормальному закону, необходимо сопоставить сведения о свойствах этой величины и условиях ее изучения со свойствами функций нормального распределения. Это сопоставление вначале является качественным, а потом осуществляется специальными количественными методами (Сыромятников И. В., 2005).
Подтверждение нормального закона распределения будет означать, что полученная эмпирическая кривая не требует нормализации. Распределение можно рассматривать как репрезентативное по отношению к генеральной совокупности и на его основе определить репрезентативные оценочные нормы.
Если распределение отличается от нормального, то это означает, что либо выборка нерепрезентативна генеральной совокупности, либо измерения произведены не в шкале равных интервалов.
Наиболее важным общим свойством разных кривых нормального распределения является одинаковая доля площади под кривой между одними и теми же двумя значениями признака, выраженными в единицах стандартного отклонения.
М ± о соответствует 68 % (точно — 68,26 %) площади;
М ± 2о соответствует 95 % (точно — 95,44 %) площади;
М±3а соответствует 100 % (точно — 99,72 %) площади.
Полезно знать, что если распределение является нормальным, то:
90 % всех случаев располагается в диапазоне значений М ± 1,64 о;
95 % всех случаев располагается в диапазоне значений М± 1,96 а;
99 % всех случаев располагается в диапазоне значений М±2,58 о.
График функции y=ϕ(x) называют гауссовой кривой. Это «колоколообразная» кривая. Она имеет единственную точку максимума, симметрична относительно оси ординат, площадь под этой кривой равна единице. Она очень быстро асимптотически приближается к оси абсцисс.
Графики функций выравнивающих гистограммы похожи друг на друга. Все эти кривые распределения получаются из гауссовой кривой. Её часто называют кривой нормального распределения.
1.4. Правила построения кривой нормального распределения
Один из способов построения нормальной кривой по опытным данным наблюдений (либо экспериментов) заключается в следующем:
* находят и например, по методу произведений;
* находят ординаты (выравнивающие частоты) теоретической кривой по формуле где сумма наблюдаемых частот, разность между двумя соседними вариантами
* строят точки в прямоугольной системе координат и соединяют их плавной линией.
Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что обследуемый признак распределен нормально.
В качестве иллюстрации, рассмотрим следующий пример.
Exceltip
Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки
Как построить график с нормальным распределением в Excel
Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.
Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.
Характеристики нормального распределения
Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.
Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.
Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней – 100 грамм, но со стандартным отклонением всего 1,5 грамма
Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.
Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.
Создание массива с нормальным распределением
Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:
=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)
Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.
Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.
Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.
Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:
=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)
Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.
Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.
Построение графика нормального распределения
Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.
Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:
В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.
Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.
Осталось отформатировать диаграмму и наш график с нормальным распределением готов.
Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.
Вам также могут быть интересны следующие статьи
12 комментариев
Ренат, добрый день.
Все несколько проще:
Данные->Анализ данных->Генерация случайных чисел (Распределение=Нормальное)
+
Данные->Анализ данных->Гистограмма->Галка на «вывод графика» («Карманы» можно даже не задавать)
Примеры решений распределения с помощью функции ГАУСС в Excel
Функция ГАУСС, подлежащая применению в версиях Excel начиная от 2013 года или новее. Она позволяет вычислить такую вероятность, с которой элемент стандартной нормальной совокупности будет находиться в интервале между средними и стандартными отклонениями от среднего.
Примеры использования функции ГАУСС в Excel
Синтаксис рассматриваемой функции не представляет из себя ничего сложного, ведь функции ГАУСС присущ всего один обязательный аргумент – Z – возвращающий число.
Важно отметить, что существует определенная связь между функцией ГАУСС и такой статистической функцией, как стандартное нормальное распределение, иначе говоря – НОРМ.СТ.РАСП.
Итак, всегда функция НОРМ.СТ.РАСП (0; Истина) делает возврат 0,5, тогда как ГАУСС (z) имеет в результате значение меньше на 0,5, чем результат функции НОРМ.СТ.РАСП. На рисунке, расположенном ниже, приведен пример использования данных статистических функций для возвращения числа 1,5.
На графике четко прослеживается пропорциональная корреляция результатов вычислений функций ГАУСС и НОРМ.СТ.РАСП.
Решение системы вероятности методом ГАУССА в Excel
Задача представляет собой вычисление вероятности возможных значений при бросании двух костей.
Пример с игрой в кости является наиболее наглядным, так как мы имеем ограниченный набор данных, которые соответствуют вероятностям. Так, вероятность имеет значение от нуля до единицы, к которому стремится наблюдаемая частота при бесконечно большой выборке или повторении эксперимента.
Существует 36 возможных комбинаций. При этом, вероятность того, что при бросании двух костей выпадет 2 очка равна 1/36, а 7 очков – 1/6. Отобразим перечень возможных значений бросания двух игральных костей в таблице, приведя при этом все вероятности к общему знаменателю.
Однако, такой ряд данных не дает возможности для выявления полного распределения, поэтому следует отобразить данные об отдельных вероятностях в рассчитанную по функции распределения. Так необходимо, все вероятности просуммировать последовательно (1+2+3+4+5+6+5+4+3+2+1).
Теперь определяем коэффициент вероятности разделив по отдельности последовательную сумму вероятностей на максимально возможное количество комбинаций 36.
В первом случае нами были рассмотрены отдельные вероятности, во втором – сумма вероятностей от первого возможного значения до заданного.
Необходимо преобразовать диапазон ячеек D2:D13 в числовой формат данных, иначе при обращении на них функции ГАУСС будет иметь место ошибка.
В созданный рядом с первоначальной таблицей столбец E введем формулу, которая в качестве аргумента делает обращение к ячейке D2.
Далее, протянем формулу вниз по столбцу, и получим ряд вероятностей с использованием функции ГАУСС.
Для более наглядной визуализации, построим график вероятности:
Решение вероятности методом распределения кривой Гаусса в Excel
Теперь в качестве примера нормального распределения с помощью функции ГАУСС решим задачу о вероятностном соотношении результатов стрельбы по мишени.
Для этого построим базовую таблицу, которая отражает результаты стрельбы по мишени в девяти подходах.
Затем, выберем только уникальные результаты, для этого используем хитрую формулу:
Делаем сортировку формулой для результатов по возрастанию и выводим в отдельную табличку:
После чего определим частоту встречающихся только для уникальных результатов:
Далее применим функцию ГАУСС к значениям ячеек с частотой встречаемости. Отразим результаты вычислений на графике:
На графике красной линией определено нормальное распределение кривой Гаусса.