Содержание 

Статистика+
Лицензионное соглашение
Приступая к работе
Загрузка программы
Использование клавиатуры
Ввод информации
Редактирование информации
Выход из Статистики+
Статистика
Проведение анализа
Библиография
Элементарные понятия статистики
Основные статистики
Описательные статистики
Сравнение средних
Одновыборочный T-Тест
F-Тест для дисперсии
Линейная корреляция (Пирсона)
Корреляция Фехнера
Ковариация
Проверка нормальности
Дисперсионный анализ
Однофакторный дисперсионный анализ
Двух(Трёх-)факторный дисперсионный анализ
Непараметрическая статистика
Таблицы сопряженности 2x2
Ранговые корреляции
Сравнение двух независимых выборок
Сравнение нескольких независимых выборок
Сравнение двух зависимых выборок
Сравнение нескольких зависимых выборок
Q-Критерий Кокрена
Временные ряды/Прогнозирование
Автокорреляция и частная автокорреляция
Скользящее среднее
Анализ выживаемости
Регрессия Кокса
Пробит-анализ
Встроенные функции
Все функции
Математические
Общие
Статистические
Финансовые
Описание пунктов меню
Настройка программы
Общие
Вид
Сохранение
Надстройки
Прочее

Справка StatPlus

Назад Вперед
Однофакторный дисперсионный анализ

Домой

 

www.statplus.net.ua

Однофакторный дисперсионный анализ

Назначение

    Это средство служит для анализа дисперсии по данным двух или нескольких выборок. При анализе сравнивается гипотеза о том, что каждый пример извлечен из одного и того же базового распределения вероятности, с альтернативной гипотезой, предполагающей, что базовые распределения вероятности во всех выборках разные. Если имеется всего две выборки, применяют функцию ТТЕСТ. Для более двух выборок не существует обобщения функции ТТЕСТ, и вместо этого можно воспользоваться моделью однофакторного дисперсионного анализа.

Подготовка

    Для проведения данной процедуры необходимо вызвать команду СтатистикаДисперсионный анализ→Однофакторный дисперсионный анализ....
 

Результаты

    Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (от английского Sum of Squares - Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Рассмотрим следующий набор данных:

  Группа 1 Группа 2
Наблюдение 1
Наблюдение 2
Наблюдение 3
2
3
1
6
7
5
Среднее
Сумма квадратов (СК)
2
2
6
2
Общее среднее
Общая сумма квадратов
 4


Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2. Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислить SS исходя из общего среднего этих двух выборок, то получим величину 28. Иными словами, дисперсия (сумма квадратов), основанная на внутригрупповой изменчивости, приводит к гораздо меньшим значениям, чем при вычислении на основе общей изменчивости (относительно общего среднего). Причина этого, очевидно, заключается в существенной разнице между средними значениями, и это различие между средними и объясняет существующее различие между суммами квадратов. В самом деле будет получена следующая таблица, называемая таблицей дисперсионного анализа:
 

  ГЛАВНЫЙ ЭФФЕКТ
SS ст.св. (df)  MS F Уровень значимости
Эффект (Между группами)
Ошибка (Внутри групп)
24.0
4.0
1
4
24.0
1.0
24.0
 
.008
 

    Как видно из таблицы, общая сумма квадратов SS = 28 разбита на компоненты: сумму квадратов, обусловленную внутригрупповой изменчивостью (2+2=4; см. вторую строку таблицы) и сумму квадратов, обусловленную различием средних значений между группами (28-(2+2)=24; см первую строку таблицы). Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (df).
    Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

Проверка значимости. Основные идеи проверки статистической значимости обсуждаются в разделе Элементарные понятия статистики. В этом же разделе объясняются причины, по которым многие критерии используют отношение объясненной и необъясненной дисперсии. Примером такого использования является сам дисперсионный анализ. Проверка значимости в дисперсионном анализе основана на сравнении компоненты дисперсии, обусловленной межгрупповым разбросом (называемой средним квадратом эффекта или MSэффект) и компоненты дисперсии, обусловленной внутригрупповым разбросом (называемой средним квадратом ошибки или MSошибка; эти термины были впервые использованы в работе Edgeworth, 1885). Если верна нулевая гипотеза (равенство средних в двух популяциях), то можно ожидать сравнительно небольшое различие выборочных средних из-за чисто случайной изменчивости. Поэтому, при нулевой гипотезе, внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета групповой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F-критерия, проверяющего, действительно ли отношение дисперсий значимо больше 1. В рассмотренном выше примере F-критерий показывает, что различие между средними статистически значимо (значимо на уровне 0.008).

Основная логика дисперсионного анализа. Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.


Copyright ©Alexey Simachov, 2001-2005

   
The CHM file was converted to HTML by chm2web software.