Как сделать стат обработку

Как сделать статистическую обработку данных в excel?

Как сделать стат обработку

Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.

Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.

Использование описательной статистики

Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.

В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:

Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.

Подключение «Пакета анализа»

Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.

Как сделать стат обработку

После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.

Применение инструмента «Описательная статистика»

Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.

В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.

Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:

В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».

Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.

Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.

После того, как все указанные данные внесены, жмем на кнопку «OK».

Как сделать стат обработку

Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.

Урок: Статистические функции в Excel

Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.

Мы рады, что смогли помочь Вам в решении проблемы.

Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.

Помогла ли вам эта статья?

Сортировка данных в Excel

Таблицы Excel можно использовать для создания баз данных, т.е. совокупности определенным образом организованной информации. В таблицах хранят информацию о сотрудниках, клиентах, поставщиках различной продукции, ценах, книгах, фильмах, фотографиях и т.д. Как правило, для таких баз данных используется табличный способ организации. Они содержат большое количество данных, а с большим количеством данных не всегда просто работать. Для этого и необходима обработка данных.

Как сделать фильтр в Excel

Базы данных очень удобны для хранения информации, но мы создаем их для того, чтобы получать нужную для нас справку, когда возникает подобная необходимость.

Например, нам нужно расписание железнодорожных поездов, которые отправляются в Москву в пятницу после четырех часов дня и т.п.

Поиск нужной информации осуществляется путем отбора строк, удовлетворяющих некоторому критерию. В большинстве случаев критерием отбора является равенство содержимого ячейки определенному значению.

Помимо сравнения на равенство, при отборе записей можно использовать и другие операции сравнения. Например, больше, меньше, больше или равно, меньше или равно. Использование этих операций позволяет сформулировать критерий запроса менее строго. Например, если требуется найти информацию о человеке, фамилия которого начинается с «Ку», то в качестве критерия можно использовать правило «содержимое ячейки Фамилия больше или равно Ку и содержимое ячейки Фамилия меньше Л».

Промежуточные итоги в Excel

Одним из методов обработки данных является подведение итогов. Пусть, например, есть таблица расходов. Для того чтобы узнать, сколько потрачено в каждом месяце, необходимо подвести итог за каждый месяц.

Сводные таблицы Excel 2010

Сводная таблица позволяет выполнить более тонкий анализ данных, чем простое подведение итога. Что такое сводная таблица и как ее построить, рассмотрим на примере.

Пусть есть таблица, в которой находится информация о расходах.

Как сделать стат обработку

Основными средствами анализа статистических данных в Excel являются статистические процедуры надстройки Пакет анализа (Analysis ToolРак) и статистические функции библиотеки встроенных функций. Основные сведения обо всех этих средствах имеются в электронной справочной системе Excel.

Однако качество описаний статистических процедур и функций, приведенных в этой системе, заставляет желать лучшего. Некоторые из этих описаний не очень понятны, в них имеются неточности, а подчас и просто ошибки (это относится как к англоязычному оригиналу, так и к русскому переводу). Эти недостатки с завидным постоянством повторяются и во многих пособиях по Excel. Найти необходимые пособия в интернете можно быстро если скачать бесплатно Амиго браузер с усовершенствованным поисковым алгоритмом.

Статистические процедуры Пакета анализа

Наиболее развитыми средствами анализа данных являются статистические процедуры Пакета анализа. Они обладают большими возможностями, чем статистические функции. С их помощью можно решать более сложные задачи обработки статистических данных и выполнять более тонкий анализ этих данных.

В Пакет анализа входят следующие статистические процедуры:

Для доступа к процедурам Пакета анализа необходимо в меню Сервис (Tools) щелкнуть указателем мыши на строке Анализ данных (Data Analysis). Откроется диалоговое окно с соответствующим названием, в котором перечислены процедуры статистического анализа данных (рис. 1).

Как сделать стат обработку

Рис.1. Диалоговое окно Анализ данных

Для того чтобы запустить в работу нужную статистическую процедуру, нужно выделить ее указателем мыши и щелкнуть на кнопке ОК. На экране появится диалоговое окно вызванной процедуры. На рис. 2 для примера показано диалоговое окно процедуры Описательная статистика (Descriptive statistics).

Как сделать стат обработку

Рис.2. Диалоговое окно процедуры Описательная статистика

Диалоговое окно каждой процедуры содержит элементы управления: поля ввода, раскрывающиеся списки, переключатели, флажки и т. п. Эти элементы позволяют задать нужные параметры используемой процедуры. Некоторые элементы управления имеют специфический характер, присущий одной процедуре или небольшой группе процедур. Назначение таких элементов управления будет рассмотрено при описании соответствующих процедур. Другие элементы управления присутствуют в диалоговых окнах почти всех статистических процедур.

Как сделать стат обработку Как сделать стат обработку Как сделать стат обработку

К числу общих для большинства процедур элементов управления относятся:

При выборе переключателя Выходной интервал таблица результатов решения выводится на тот же рабочий лист, на котором находятся исходные данные. Справа от переключателя открывается поле ввода, в которое надо ввести ссылку на левую верхнюю ячейку таблицы результатов. Если возникает опасность наложения таблицы результатов на уже заполненные ячейки, на экране появляется сообщение о такой опасности. В ответ на это сообщение пользователь должен разрешить удаление старых данных и вывод на их место новых.

В положении Новый рабочий лист открывается новый лист рабочей книги. На этот лист, начиная с ячейки А1, и выводится таблица результатов решения. Справа от переключателя имеется поле ввода, в которое в случае необходимости можно ввести имя нового рабочего листа. При выборе переключателя Новая рабочая книга открывается новая рабочая книга. На первый лист этой новой книги, начиная с ячейки А1, выводится таблица результатов решения.

Следует заметить, что результаты;, получаемые с помощью статистических процедур Пакета анализа, не имеют постоянной связи с исходными данными — в случае изменения исходных данных результаты решения автоматически не изменяются. В том случае, когда необходимо получить результаты, автоматически изменяющиеся вместе с исходными данными, нужно использовать подходящие статистические функции библиотеки встроенных функций.

Эффективным и очень удобным в использовании средством парного регрессионного анализа и анализа временных рядов является процедура Добавить линию тренда (Add Trendline), входящая в комплекс графических средств Excel.

Статистические функции библиотеки встроенных функций Excel

Табличный процессор Excel имеет библиотеку встроенных функции рабочего листа (Worksheet function). Одним из разделов этой библиотеки является раздел Статистические функции. В этот раздел входят 83 функции, предназначенные для решения некоторых наиболее востребованных задач теории вероятностей и математической статистики.

Аргументы статистических функций должны быть числами или ссылками на диапазоны, которые содержат числа Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются, однако ячейки с нулевыми значениями учитываются.

Когда в качестве какого-либо аргумента встроенной статистической функции введен текст, функция выдает сообщение об ошибке #ЗНАЧ! (#VALUE!). Если в качестве аргумента, который по определению должен быть целым числом, введено число не целое, Excel использует в качестве аргумента целую часть этот числа. Никакие сообщения об этом «несанкционированном округлении» на экран не выводятся.

Источник

Статистическая обработка данных и ее особенности

Статистическая обработка данных невозможна без их упорядочения, обобщения и анализа. Любые полученные результаты вначале необходимо привести в такой вид, чтобы из них можно было извлечь максимум полезной информации. Если полученных данных слишком много, тогда их необходимо сгруппировать или обобщить.

Так, для группировки необходимо определить нормы, в соответствии с которыми полученные данные будут распределяться. При этом от выбранного способа будет зависеть не только наглядность, но и потенциальная полезность полученной информации. Правильно сгруппированные результаты исследований гораздо удобнее изучать и подвергать анализу.

Как сделать стат обработку

Статистические методы обработки данных могут быть применимы во многих сферах деятельности человека. Их можно разделить на 3 основных вида:

1) универсальные методы, которые можно использовать, не учитывая область применения;

2) методы для определенных областей деятельности, занимающиеся исследованием реальных процессов или явлений;

3) методы для исследования определенных данных.

Понятно, чем точнее метод, с помощью которого проводится статистическая обработка данных, тем результативнее окажется проведение анализа конкретной ситуации. Если первый метод применим для научных результатов, значение которых будет оценено только по общенаучным критериям, то третий метод применяется только для решения определенных задач в конкретной области.

Помимо общих знаний о методах, с помощью которых обрабатываются данные, важно также знать, как лучше работать с полученными результатами. Статистическая обработка данных предполагает создание таблиц или графиков для наглядности полученной информации.

Как сделать стат обработку

На начальном этапе сведения можно свести в таблицу. Так, например, статистическая обработка данных эксперимента, записанная в табличном виде позволяет избавить исследователей от дополнительных ненужных записей показателей, величин измерения, дополнительных факторов, влияющих на ход проведения эксперимента. В таблицах удобно записывать не только данные проведенного исследования или эксперимента, но и подводить промежуточные и основные итоги. Правда, для правильного их построения необходимо заранее продумать необходимое количество строк и столбцов, записать все нужные параметры.

Таблицу можно делать просто на листе бумаги или сразу вводить данные в компьютер. Второй вариант позволит быстро отсортировать нужным способом полученные данные, найти самое большое или, наоборот, маленькое значение, подвести итог или найти среднее значение по выбранной группе результатов.

Не стоит забывать, что если грамотная статистическая обработка данных требует несколько таблиц, то их необходимо пронумеровать и для каждой придумать уникальное название.

Как сделать стат обработку

Более наглядным способом записи данных являются графики. Они визуально показывают зависимость между разными величинами, облегчая понимание результатов исследования.

Зная основные принципы построения таблиц и графиков, можно быстро и эффективно произвести обработку полученных данных.

Источник

Выбор методов статистической обработки результатов

Модуль 4. Информационные технологии в системе психолого-педагогического мониторинга детей и подростков

Тема 10 Компьютерный анализ данных в психологии и педагогике

Современные табличные процессоры. Выбор методов статистической обработки результатов. Количественная обработка статистических данных в MS Excel

Современные табличные процессоры.

На современном этапе развития технологий проведения исследования»» сложно представить себе исследователя, оперирующего логарифмической линейкой или вручную подсчитывающего различные показатели, характеризующие результаты исследования. Компьютерные технологии во многом оптимизировали проведение этапа математической обработки данных, предоставляя исследователям максимум средств для моделирования изучаемого феномена.

Наибольшую популярность в среде исследователей приобрели программы Excel, SPSS и Statistica. Они предоставляют большие возможности для самого разнообразного анализа, описания и моделирования данных, просчета статистических критериев, построения графиков и гистограмм, презентации полученных результатов.

Применение статистических методов играет существенную роль при проведении исследования в области педагогики и психологии, поскольку дает исследователю возможность:

• емко, компактно и информативно описывать результаты проведенного исследования;

• устанавливать степень достоверности сходства и различия исследуемых объектов на основании результатов измерений их показателей;

• анализировать наличие или отсутствие структурных связей между различными показателями (явлениями);

• количественно и качественно описывать эти структуры;

• выявлять наиболее информативные показатели;

• классифицировать изучаемые объекты;

• создавать вероятностные модели изучаемых явлений и прогнозировать значения их показателей и характеристик и др.

Остановимся кратко на характеристиках современных табличных процессоров.

• электронные таблицы, включающие обновляемые связи между ячейками данных, что обеспечивает автоматический пересчет данных в ячейках, связанных формульными отношениями с данными других ячеек;

• ячейки электронной таблицы, содержащие данные трех типов: текстовые, числовые и даты. Помимо этого, ячейки могут содержать формулы, в ходе вычисления которых будут представлены числовые результаты формул;

табличный процессор — программа для управления данными, представленными в форме электронных таблиц. Основное назначение табличного процессора — автоматизация ввода, редактирования и представления данных, а также выполнение вычислительных операций и анализ данных.

Бурное развитие информационных технологий способствовало развитию компьютерных сред, обеспечивающих работу с числовыми данными. Особенно эффективным оказалось использование электронных таблиц или табличных процессоров, позволивших автоматизировать обработку числовых данных и их сводное представление. Эволюция развития табличных процессоров связана с такими пакетами прикладных программ, как VisiCalc, Super Culc, Lotus 1-2-3, Quattro Pro, OpenOffice Calc, MS Excel. Табличные процессоры существенно облегчили работу с числовыми данными, сократили время на их обработку, предоставили новые инструменты визуализации числовых данных [1]. Среди табличных процессоров наибольшую популярность приобрел MS Excel, входящий в состав MS Office. К числу достоинств данного прикладного продукта Р. Н. Вадзинский относит [2]:

• относительную простоту освоения и практического использования (по сравнению с пакетами статистических программ);

• значительное число встроенных статистических функций;

• наличие надстройки Пакет анализа, содержащей процедуры для решения сложных задач статистического анализа;

• наличие надстройки Поиск решения, процедуры Подбор параметра и большого числа встроенных функций, формально не относящихся к статистическим, однако позволяющих решать сложные вероятностные и статистические задачи;

• возможность создания пользователем собственных программных модулей для анализа данных на языке Visual Basic for Applications (VBA);

• наглядность статистического анализа данных, выполненного в табличной форме;

Практически все табличные процессоры имеют интерфейс, подчиненный логике эргономичного использования данного типа прикладных программ. Пользователю представлены сведения как о самом рабочем файле, так и о его отдельных элементах. Условно можно обозначить следующую последовательность элементов рабочего окна табличного процессора.

1. Строка заголовка, включающая название файла и программы, в которой открыт файл.

2. Ленты команд (строки меню).

3. Строка ввода данных, включающая значок fx, позволяющий вызвать мастер функций.

4. Пространство рабочего листа, представляющее собой собственно электронную таблицу.

5. Линейка рабочих листов (рабочих файлов).

6. Строка сообщений.

Основные элементы табличного документа Excel :

• рабочая книга, которая представляет собой многостраничный документ, состоящий из рабочих листов (по умолчанию три рабочих листа). Имя рабочей книги обозначено в строке заголовка окна;

• рабочий лист, который представляет собой заготовку таблицы, разграфленную на строки и столбцы. Единичным элементом рабочего листа является ячейка, образованная пересечением строки и столбца. Имя рабочего листа отображается в нижнем левом углу окна;

• ячейки, которые могут включать конкретные данные или формулы. Каждая ячейка имеет уникальное имя, образованное номером строки и именем столбца (например, Е8). Наличие уникального имени позволяет оперировать им для составления формул.

Рассмотрим использование программы Excel на этапе подготовки эмпирических данных для последующей математической обработки.

Под матрицей исходных данных понимается таблица, состоящая из данных исследования и представляющая собой матрицу размером т х и, где т — число измеряемых показателей (показателями выступают, например, шкалы опросника, пол, возраст испытуемых и т. д.), а п — число испытуемых (рис. 1).

При сведении данных обследования в единую таблицу каждая строка представляет собой данные одного конкретного испытуемого по всем регистрируемым показателям. Нецелесообразно создавать несколько матриц результатов по отдельным методикам (например, отдельную матрицу по результатам теста Кеттелла, отдельную — по результатам методики исследования самоотношения, отдельную — по результатам рисуночной пробы). MS Excel предоставляет возможности для построения довольно больших матриц (размером 256 показателей на 65 536 испытуемых). К тому же при построении единой матрицы результатов не возникает ситуации, когда данные 1-й строки в разных матрицах относятся к разным испытуемым, что противоречит правильности построения матрицы исходных результатов.

Начиная создавать матрицу исходных результатов, рекомендуется подготовить заголовки, обозначающие названия методик и регистрируемые показатели. Заголовки будут очень полезны на этапе наглядного представления результатов, их создание помогает в целом отформатировать таблицу, придать ей тот вид, который окажется наиболее удобным

Рис. 1. Матрица исходных данных, где X. — это значение у’-го показателя у /-го испытуемого

Показатель 1Показатель 2Показатель 3Показатель уПоказатель т
Испытуемый 1х„х,2Х13X VХ
Испытуемый 2Х2,Х22х23X,Х
Испытуемый 3Хз,х32х33X*Хзт
Испытуемый /V,Х„’2х,А\Х,т
Испытуемый пХ,ЛХ„п2Х,,п3X,X пт

АВСDЕFGНIJК
1-ДаркиШк Спиг гер Ханала 1бер- а— ина
2Физическая агрессияКосвенная агрессияСклонность к раздражениюНегативизмОбидаПодозрительностьВербальная агрессияЧувство виныСТлт
3Исп. 1
4Исп. 2
5Исп. 3
6Исп. 4
7Исп. 5S,
8Исп. 6Ц»
9Исп. 7

Рис. 2. Заголовки матрицы исходных данных

для последующих операций. Фрагмент заголовков может выглядеть следующим образом (рис. 2).

АВСDЕFGНIJК
1
2Физическая агрессияКосвенная агрессияСклонность к раздражениюНегативизмОбидаПодозрительностьВербальная агрессияЧувство виныСТлт
3Исп. 1
4Исп. 2
5Исп. 3
6Исп. 4
7Исп. 5
8Исп. 6
9Исп. 7

Рис. 4.3. Выбор ячейки для закрепления областей матрицы исходных данных

Теперь таблица готова к заполнению данными испытуемых.

Иногда при заполнении таблицы исходными данными происходит автоматическое форматирование введенных значений. Тогда значение числа искажается. Например, при введении 10,05 вы видите в ячейке 10,май. Это означает, что Excel автоматически преобразовал введенное число в формат даты. Для того чтобы избежать такого преобразования, пользуйтесь правой частью клавиатуры при отжатой клавише Num Lock. В таком случае число будет введено правильно, то есть 10,05

В Microsoft Excel важно понимать назначение различных визуальных средств, к примеру изображения указателя. Каждый из видов указателя отражает набор конкретных функций и действий (табл. 1).

Таблица 1. Виды указателя и его функции в Microsoft Excel

Таблица 5.1. Виды указателя и его функции в Microsoft Excel

Изменение ширины столбца или высоты строки

Переместить ячейки, области (совокупности ячеек)

Вид указателяФункция
А 4* В
Выделить строку, столбец
ОВыделить ячейку, выделить область (совокупность ячеек)
г I
57
0Корректировать данные в ячейке или строке формул
=1Применить автозаполнение, в том числе автонумерацию и копирование содержимого ячеек Mi»

1. Методика Басса—Дарки

Шкала Спилбер- гера—Ха- нина

ТЕСТ КЕТТЕЛЛА в стенах

2ПодозрительностьВербальная агрессияЧувство виныСТЛТАВСDFG
10Исп. 8194332912741369
11Исп. 94955358137119710
12Исп. 102583953108991119
13Исп. 1116157311071051414
14Исп. 124743943111013151014
15Исп. 13111245341049567
16Исп. 143106413688129139
17Исп. 1568104052681210118
18Исп. 163103443316689614

Рис. 4.Фрагмент заполненной матрицы исходных данных

Матрица исходных данных создана, можно приступать к анализу данных и их графическому представлению.

Выбор методов статистической обработки результатов

Основной задачей исследователя при выборе методов статистической обработки является нахождение наиболее адекватных способов решения поставленных в исследовании научных целей и задач. В табл. 2 приводится классификация статистических методов в соответствии с этапами математической обработки результатов эмпирического исследования.

Таблица 2. Этапы математической обработки результатов эмпирического исследования и соответствующие им методы

ЭтапМетоды
Описательная статистикаТабулирование; упорядочивание (ранжирование); расчет первичных статистик: • меры центральной тенденции (среднее, мода, медиана и др.); • показатели вариативности (дисперсия, стандартное отклонение); • показатели формы распределения (показатели асимметрии и эксцесса); меры ошибок репрезентативности; группировка данных (построение гистограммы, полигона); построение среднегрупповых профилей; проверка нормальности распределения
Оценка взаимосвязи исследуемых признаковОценка связи между качественными признаками: • тетрахорический коэффициент корреляции; • коэффициент взаимной сопряженности Пирсона; • коэффициент взаимной сопряженности Чупрова; • коэффициент контингенции; оценка связи между порядковыми признаками (измерены методом ранжирования): • коэффициенты ранговой корреляции т Спирмена, Кендэлла; оценка согласованности мнений экспертов (метод экспертных оценок): • коэффициент согласованности Спирмена; • коэффициент конкордации Кендэлла; оценка связи между количественными признаками: коэффициент корреляции г Пирсона
Анализ структуры взаимосвязейМетод корреляционных плеяд
Выявление различий в уровне исследуемого признакаПараметрический критерий t Стьюдента; непараметрические критерии: • критерий Розенбаума; • критерий Манна — Уитни; ^ • критерий тенденций Крускала — Уоллиса; критерий тенденций Джонкира
Оценка достоверности сдвига в значениях исследуемого признакаПараметрический критерий t Стьюдента; непараметрические критерии: • критерий знаков; • критерий Вилкоксона; • критерий Фридмана; критерий тенденций Пейджа
Многофункциональные статистические критерииКритерий (р* — угловое преобразование Фишера; биномиальный критерий т

Таблица 2. Этапы математической обработки результатов эмпирического исследования и соответствующие им методы

этапметодыВыявление различий в распределенииКритерий Пирсона; критерий Колмогорова—Смирнова; биномиальный критерий тАнализ изменений признака под влиянием контролируемых условийОдин признак: • критерий тенденций Джонкира; • критерий тенденций Пейджа; • однофакторный дисперсионный анализ Фишера; два признака: двухфакторный дисперсионный анализ ФишераИсследование явлений, характеризующихся большим количеством признаковФакторный анализ — выявляет влияние скрытых латентных факторов, обусловливающих множественные корреляции; регрессионный анализ — прогнозирует развитие фактора, который имеет тенденцию изменяться через определенный промежуток времени; кластерный анализ — выявляет связь или степень подобия различных объектов по подобию их характеристик (переменных). По определенным статистическим критериям различные сходные объекты (например, испытуемые) объединяются в классы (группы, кластеры и т. д.)

Для выполнения необходимых операций над матрицей исходных данных пользователь может набирать формулы — инструкции, манипулирующие данными рабочего листа. Формулы всегда начинаются с символа = (равенство) и содержат математические, статистические или логические операции [3]. Например, можно ввести формулу, которая позволит автоматически высчитывать интегральные показатели теста (формула =F3+G3, набранная в свободной ячейке в третьей строке в приведенном ранее примере матрицы исходных данных, позволяет высчитать индекс враждебности первого испытуемого, который определяется как сумма показателей обиды и подозрительности). При этом формулу можно копировать для всего ряда испытуемых, что существенно сокращает время на обработку тестов. Можно проводить и более сложные вычисления, используя встроенные в табличный процессор функции. Для этого необходимо вызвать мастер функций рис. нажатием кнопки fx. Мастер функций позволяет выбрать необходимое математическое действие и диапазон данных, над которыми оно будет осуществляться

Как сделать стат обработку

Рис. 5. Вид диалогового окна мастера функций MS Excel

Продемонстрируем использование функций на примере определения одной из мер центральной тенденции. Среднее значение представляет собой некоторую центральную точку или типичное значение, вокруг которого концентрируются данные. Оно определяется как результат деления суммы всех значений ряда на их количество. Для начала работы необходимо выделить ячейку, в которую будет введена формула. Лучше всего, если эта ячейка расположена за последним значением ряда (рис. 6). Далее следует вызвать мастер функций и выбрать категорию Статистические. В перечне функций выбрать функцию Срзнач и нажать ОК. На следующем шаге необходимо выбрать аргументы функции, то есть

Как сделать стат обработку

Как сделать стат обработку

Рис. 6 Выбор диапазона аргументов функции

те значения, которые составляют ряд первичных данных по показателю, среднее значение которого определяется.

Аналогичным способом можно использовать другие статистические и логические функции. Однако расчет более сложной статистики в табличном процессоре Excel является довольно громоздким и трудоемким. К тому же обнаружено, что отдельные статистические функции программы содержат ошибки и могут дать некорректные результаты, особенно если объемы данных очень велики. Эти обстоятельства требуют перепроверки расчетов или использования специализированных статистических пакетов программ

4.10.3 Количественная обработка данных в программах Statistica, SPSS

Специализированные статистические пакеты обладают широкими возможностями обработки данных и позволяют применять самые современные методы математической статистики. Наиболее известны, имеют долгую историю и отличную репутацию такие программы, как Statistica и Statistical Package for the Social Sciences (SPSS).

Отличительными чертами данных статистических пакетов являются:

• высокая скорость и точность вычислений;

широкий набор статистических функций (факторный, регрессионный, кластерный, частотный, дискриминантный

• многомерный анализ, критерии согласия, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, t-тесты, большое количество непараметрических критериев и многое другое);

• привычные для пользователей Microsoft Office способы работы с таблицами (ввод и корректировка данных и т. п.);

• легкость конвертации данных в различные электронные таблицы и базы данных и наоборот (импорт и экспорт данных);

• возможность выполнения операций как с числовыми, так и с текстовыми данными;

• широкие графические возможности, позволяющие строить 2D- и ЗО-графики, большое количество разнообразных видов и типов диаграмм.

Для освоения названных статистических пакетов требуется минимум времени, поскольку пользователю не требуется применять знания в области программирования, необходимые при использовании статистических программ с открытым кодом. Для того чтобы работать с данными приложениями, достаточно понимания стратегий статистической обработки данных и общих навыков работы с электронными таблицами.

Оба статистических пакета имеют много общего, в том числе панели инструментов, способы организации и хранения данных и т. п. SPSS и Statistica являются примерами «закрытых» продуктов. Среди статистических пакетов, позволяющих продвинутому пользователю запрограммировать любую произвольно сложную последовательность операций статистического анализа, можно отметить приложения MatLab и R. Эти продукты обеспечивают как язык программирования, так и среду для статистических и графических операций и являются программами с открытым кодом.

В настоящее время существует множество учебников, посвященных работе с различными статистическими пакетами, поэтому мы ограничимся описанием основных принципов работы с данными в программах Statistica и SPSS [4]. Далее приведена табл. 3, содержащая основные сведения о работе с указанными программами.

Таблица 3. Основные характеристики работы со специализированными статистическими пакетами Statistica и SPSS

Файлы

Способ ввода данных

Окно файла данных. В последних версиях программы могут быть открыты несколько файлов данных, операции анализа могут осуществляться только с одним активным файлом данных. Окно вывода таблиц результатов (Scrollsheets). Окно вывода графиков. Текстовые окна (окна для редактирования программ Statistica Basic или SCL, окна для вывода информации процедурами анализа, отчеты, текстовые файлы)Окно редактора данных. Содержит две вкладки: окно данных и окно переменных, позволяющие редактировать как числовые данные, так и спецификации переменных. Редактор просмотра результатов. Позволяет отображать на дисплее или скрывать таблицы и рисунки, содержащие результаты статистических вычислений. Окно редактора синтаксиса. Позволяет сохранять все шаги по преобразованию и трансформации данных. Окно редактора скриптов (сценариев) позволяет осуществлять операции по программированию в среде SPSSИмпорт данных из других программных источников (Microsoft Access, Microsoft Excel, текстовых файлов и др.). Ввод данных непосредственно в Statistica при помощи специализированного программного обеспечения (Data Miner). Ручной ввод данных в StatisticaИмпорт данных из других программных источников (Microsoft Access, Microsoft Excel, текстовых файлов и др.). Ввод данных непосредственно в SPSS при помощи специализированного программного обеспечения (SPSS Data Entry). Ручной ввод данных в SPSS

Корретировка и дополнение данных

Возможен как автоматический пересчет данных, так и ручной ввод исправленийВозможен как автоматический пересчет данных, так и ручной ввод исправлений

Алгоритмы анализа данных

Статистический анализ начинается с активизации в строке меню раздела Анализ, содержащего список выполняемых статистических методов. Выбор метода активизирует окно диалога, предлагающее пользователю выбрать переменные для анализа и условия его осуществленияСтатистический анализ начинается с активизации в строке меню раздела Анализ, содержащего список выполняемых статистических методов. Выбор метода активизирует окно диалога, предлагающее пользователю выбрать переменные для анализа. После выбора переменных пользователь переходит к выбору условий осуществления анализа, используя командные кнопки Statistics. (Статистика), Charts. (Диаграммы или Графики) и Format. (Формат)Экспорт результатов обработкиВозможно сохранение результатов обработки данных в файле отчета (Report) как для каждого отдельного вида анализа, так и для всей совокупности статистических процедур. Файл отчета может быть сохранен в формате RTF или PDF. Любой результат статистического анализа может быть экспортирован в офисные приложения MS Word и MS Excel с помощью буфера обменаЭкспорт результатов обработки данных может быть осуществлен в редакторе просмотра результатов. Пользователь может выбрать как фрагмент представленных результатов, так и все содержимое отчета и скопировать их в офисные приложения MS Word и MS ExcelГрафические возможностиШирокие возможности построения гистограмм, диаграмм рассеяния, графиков средних с ошибками, графиков поверхностей. Построение 2М-графиков, ЗМ-последовательных графиков, ЗМ XYZ-графиков, категоризованных графиков, графиков пользователя, графиков блоковых данных и многих другихОбширные возможности построения диаграмм различного типа. В программу встроены конструктор диаграмм и панель выбора диаграмм. Эти инструменты позволяют строить диаграммы в интерактивном режиме (изменять выбор переменных, добавлять переменные, задавать новые категории данных и т. д.)

Вопросы для самоконтроля :

1. Опишите основные преимущества использования компьютерных программ для анализа данных педагогического/психологи- ческого исследования.

2. Определите отличительные черты табличного процессора MS Excel.

3. Создайте матрицу исходных данных в MS Excel. Для этого проведите небольшое исследование на выборке из 10 человек.

4. Просчитайте основные статистические функции (среднее, стандартное отклонение, мода, медиана, дисперсия и т. д.).

5. Используйте логические функции для того, чтобы определить испытуемых с показателями выше среднего по первым двум исследуемым показателям.

Дата добавления: 2019-01-14 ; просмотров: 371 ;

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *