Как анализировать статистическую значимость: 15 шагов

Оглавление:

Как анализировать статистическую значимость: 15 шагов
Как анализировать статистическую значимость: 15 шагов

Видео: Как анализировать статистическую значимость: 15 шагов

Видео: Как анализировать статистическую значимость: 15 шагов
Видео: Зачем нужна СТАТИСТИКА для анализа данных? Что я использую в работе продуктовым аналитиком 2024, Декабрь
Anonim

Проверка гипотез проводится с помощью статистического анализа. Статистическая значимость была рассчитана с использованием p-значения, которое указывает величину вероятности результатов исследования при условии, что определенные утверждения (нулевая гипотеза) верны. Если значение p меньше заданного уровня значимости (обычно 0,05), исследователь может сделать вывод, что нулевая гипотеза неверна, и принять альтернативную гипотезу. Используя простой t-критерий, вы можете вычислить p-значение и определить значимость между двумя разными наборами данных.

Шаг

Часть 1 из 3. Настройка экспериментов

Оценка статистической значимости, шаг 1
Оценка статистической значимости, шаг 1

Шаг 1. Установите гипотезу

Первый шаг в анализе статистической значимости - это определить исследовательский вопрос, на который вы хотите ответить, и сформулировать свою гипотезу. Гипотеза - это утверждение о ваших экспериментальных данных, объясняющее возможные различия в исследуемой популяции. Для каждого эксперимента должны быть установлены нулевая гипотеза и альтернативная гипотеза. Как правило, вы сравниваете две группы, чтобы увидеть, одинаковые они или разные.

  • Нулевая гипотеза (H0) обычно заявляет, что между двумя наборами данных нет никакой разницы. Пример: группа студентов, прочитавших материал до начала урока, не получила лучших оценок, чем группа, не прочитавшая материал.
  • Альтернативная гипотеза (Hа) - это утверждение, которое противоречит нулевой гипотезе и которое вы пытаетесь подтвердить экспериментальными данными. Пример: группа студентов, прочитавших материал перед уроком, получила лучшие оценки, чем группа, не прочитавшая материал.
Оценка статистической значимости, шаг 2
Оценка статистической значимости, шаг 2

Шаг 2. Ограничьте уровень значимости, чтобы определить, насколько уникальными должны быть ваши данные, чтобы они считались значимыми

Уровень значимости (альфа) - это порог, используемый для определения значимости. Если значение p меньше или равно уровню значимости, данные считаются статистически значимыми.

  • Как правило, уровень значимости (альфа) устанавливается на 0,05, что означает, что вероятность того, что обе группы данных будут равны, составляет всего 5%.
  • Использование более высокого уровня достоверности (более низкое значение p) означает, что экспериментальные результаты будут считаться более значимыми.
  • Если вы хотите повысить уровень достоверности ваших данных, уменьшите значение p до 0,01. Более низкие значения p обычно используются на производстве при обнаружении дефектов продукта. Чтобы гарантировать, что каждая изготовленная деталь выполняет свою функцию, необходима высокая степень уверенности.
  • Для экспериментов по проверке гипотез приемлем уровень значимости 0,05.
Оценка статистической значимости, шаг 3
Оценка статистической значимости, шаг 3

Шаг 3. Решите использовать односторонний или двусторонний тест

Одно из предположений, используемых при выполнении t-теста, заключается в том, что ваши данные нормально распределены. Данные, которые обычно распределяются, образуют колоколообразную кривую, причем большая часть данных находится в середине кривой. T-тест - это математический тест, используемый для проверки того, находятся ли ваши данные за пределами нормального распределения, ниже или выше «хвоста» кривой.

  • Если вы не уверены, что ваши данные ниже или выше контрольной группы, используйте двусторонний тест. Этот тест проверит значимость обоих направлений.
  • Если вы знаете направление тренда ваших данных, используйте односторонний тест. Используя предыдущий пример, вы ожидали, что оценка ученика повысится. Следовательно, вам следует использовать односторонний тест.
Оценка статистической значимости, шаг 4
Оценка статистической значимости, шаг 4

Шаг 4. Определите размер выборки с помощью тест-статистического анализа мощности

Сила теста-статистики - это вероятность того, что определенный статистический тест может дать правильный результат при определенном размере выборки. Порог тестовой мощности (или) составляет 80%. Анализ силы статистического теста может быть затруднен без предварительных данных, потому что вам понадобится информация об оценочном среднем для каждого набора данных и его стандартном отклонении. Используйте онлайн-калькулятор анализа мощности статистических тестов, чтобы определить оптимальный размер выборки для ваших данных.

  • Исследователи обычно проводят пилотные исследования в качестве материала для статистического анализа прочности и в качестве основы для определения размера выборки, необходимой для более крупных и всесторонних исследований.
  • Если у вас нет ресурсов для проведения пилотного исследования, оцените среднее значение на основе литературы и других проведенных исследований. Этот метод предоставит информацию для определения размера выборки.

Часть 2 из 3: Расчет стандартного отклонения

Оценка статистической значимости, шаг 5
Оценка статистической значимости, шаг 5

Шаг 1. Используйте формулу стандартного отклонения

Стандартное отклонение (также известное как стандартное отклонение) - это мера распределения ваших данных. Стандартное отклонение предоставляет информацию о сходстве каждой точки данных в вашей выборке. Поначалу уравнение стандартного отклонения может показаться сложным, но приведенные ниже шаги помогут в процессе расчета. Формула стандартного отклонения s = ((xя -)2/ (N - 1)).

  • s - стандартное отклонение.
  • означает, что вам необходимо сложить все собранные вами выборочные значения.
  • Икся представляет все индивидуальные значения ваших точек данных.
  • - среднее значение данных для каждой группы.
  • N - количество ваших образцов.
Шаг 6: оценка статистической значимости
Шаг 6: оценка статистической значимости

Шаг 2. Рассчитайте выборочное среднее в каждой группе

Чтобы вычислить стандартное отклонение, вы должны сначала рассчитать выборочное среднее в каждом наборе данных. Среднее значение обозначается греческой буквой мю или. Для этого сложите все значения точек данных выборки и разделите их на количество ваших выборок.

  • Например, чтобы получить средний балл для группы студентов, прочитавших материал перед уроком, давайте посмотрим на выборочные данные. Для простоты мы будем использовать 5 точек данных: 90, 91, 85, 83 и 94.
  • Сложите все значения выборки: 90 + 91 + 85 + 83 + 94 = 443.
  • Разделите на количество образцов, N = 5: 443/5 = 88, 6.
  • Средний балл для этой группы составил 88,6.
Оценка статистической значимости, шаг 7
Оценка статистической значимости, шаг 7

Шаг 3. Вычтите значение каждой выборки данных на среднее значение

Второй шаг - завершить часть (xя -) уравнение. Вычтите значение каждой точки данных выборки из предварительно рассчитанного среднего. Продолжая предыдущий пример, вам нужно сделать пять вычитаний.

  • (90–88, 6), (91–88, 6), (85–88, 6), (83–88, 6) и (94–88, 6).
  • Полученные значения: 1, 4, 2, 4, -3, 6, -5, 6 и 5, 4.
Оценка статистической значимости. Шаг 8
Оценка статистической значимости. Шаг 8

Шаг 4. Возвести в квадрат каждое полученное значение и сложить их все

Возведите каждое вычисленное значение в квадрат. Этот шаг удалит все отрицательные числа. Если после выполнения этого шага есть отрицательное значение или время после того, как все вычисления были выполнены, возможно, вы забыли этот шаг.

  • Используя предыдущий пример, мы получаем значения 1, 96, 5, 76, 12, 96, 31, 36 и 29,16.
  • Сложите все значения: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Оценка статистической значимости, шаг 9
Оценка статистической значимости, шаг 9

Шаг 5. Разделите на количество отсчетов минус 1

Формула выражает N - 1 как корректировку, потому что вы не учитываете всю совокупность; Вы берете только выборку населения, чтобы сделать оценку.

  • Вычтите: N - 1 = 5 - 1 = 4
  • Разделить: 81, 2/4 = 20, 3
Оценка статистической значимости Шаг 10
Оценка статистической значимости Шаг 10

Шаг 6. Вычислите квадратный корень

После деления на количество отсчетов минус один, вычислите квадратный корень из окончательного значения. Это последний шаг для расчета стандартного отклонения. Существует несколько статистических программ, которые могут вычислить стандартное отклонение после ввода необработанных данных.

Например, стандартное отклонение оценок для группы студентов, прочитавших материал перед началом урока, составляет: s = √20, 3 = 4, 51

Часть 3 из 3: Определение значимости

Оценка статистической значимости, шаг 11
Оценка статистической значимости, шаг 11

Шаг 1. Рассчитайте разницу между двумя группами образцов

В предыдущем примере мы рассчитали стандартное отклонение только для одной группы. Если вы хотите сравнить две группы, у вас должны быть данные из двух групп. Рассчитайте стандартное отклонение для второй группы и используйте результаты, чтобы вычислить дисперсию между двумя группами в эксперименте. Формула дисперсии sd = ((s1/ N1) + (s2/ N2)).

  • sd - межгрупповая дисперсия.
  • s1 стандартное отклонение группы 1 и N1 - количество образцов в группе 1.
  • s2 стандартное отклонение группы 2 и N2 - количество образцов в группе 2.
  • Например, данные из группы 2 (студенты, которые не читают материал до начала занятий) имеют размер выборки 5 со стандартным отклонением 5,81. Тогда вариант:

    • sd = ((s1)2/ N1) + ((s2)2/ N2))
    • sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Оценка статистической значимости, шаг 12
Оценка статистической значимости, шаг 12

Шаг 2. Рассчитайте значение t-критерия ваших данных

Значение t-критерия позволит вам сравнить одну группу данных с другой группой данных. Значение t позволяет выполнить t-тест, чтобы определить, насколько велика вероятность того, что две сравниваемые группы данных существенно различаются. Формула для значения t: t = (µ1 -2) / сd.

  • 1 среднее значение первой группы.
  • 2 - среднее значение второй группы.
  • sd - это разница между двумя выборками.
  • Используйте большее среднее значение как1 так что вы не получите отрицательных значений.
  • Например, средний балл в группе 2 (студенты, которые не читают) составляет 80. Значение t: t = (µ1 -2) / сd = (88, 6 – 80)/3, 29 = 2, 61.
Оценка статистической значимости, шаг 13
Оценка статистической значимости, шаг 13

Шаг 3. Определите степени свободы образца

При использовании t-значения степени свободы определяются размером образца. Сложите количество образцов из каждой группы, затем вычтите два. Например, степени свободы (d.f.) равны 8, потому что есть пять образцов в первой группе и пять образцов во второй группе ((5 + 5) - 2 = 8).

Оценка статистической значимости, шаг 14
Оценка статистической значимости, шаг 14

Шаг 4. Используйте Таблицу t, чтобы определить значимость

Таблицы t-значений и степеней свободы можно найти в стандартных сборниках статистики или в Интернете. Посмотрите на строку, показывающую степени свободы, которые вы выбрали для своих данных, и найдите соответствующее p-значение для t-значения, полученного в результате ваших вычислений.

Со степенями свободы 8 степеней свободы. и t-значение 2,61, p-значение для одностороннего теста находится между 0,01 и 0,025. Поскольку мы использовали уровень значимости меньше или равный 0,05, данные, которые мы используем, доказывают, что две группы данных являются значимыми. разные. Имея эти данные, мы можем отклонить нулевую гипотезу и принять альтернативную гипотезу: группа студентов, прочитавших материал до начала занятий, набрала больше баллов, чем группа студентов, которые не прочитали материал

Оценка статистической значимости Шаг 15
Оценка статистической значимости Шаг 15

Шаг 5. Рассмотрите возможность проведения дополнительного исследования

Многие исследователи проводят небольшие экспериментальные исследования, чтобы помочь им понять, как проводить более масштабные исследования. Дальнейшее исследование с большим количеством измерений повысит вашу уверенность в своих выводах.

подсказки

Статистика - обширная и сложная область. Пройдите курс по статистике логических выводов в средней школе или университете, чтобы понять статистическую значимость

Рекомендуемые: