Содержание 

Статистика+
Лицензионное соглашение
Приступая к работе
Загрузка программы
Использование клавиатуры
Ввод информации
Редактирование информации
Выход из Статистики+
Статистика
Проведение анализа
Библиография
Элементарные понятия статистики
Основные статистики
Описательные статистики
Сравнение средних
Одновыборочный T-Тест
F-Тест для дисперсии
Линейная корреляция (Пирсона)
Корреляция Фехнера
Ковариация
Проверка нормальности
Дисперсионный анализ
Однофакторный дисперсионный анализ
Двух(Трёх-)факторный дисперсионный анализ
Непараметрическая статистика
Таблицы сопряженности 2x2
Ранговые корреляции
Сравнение двух независимых выборок
Сравнение нескольких независимых выборок
Сравнение двух зависимых выборок
Сравнение нескольких зависимых выборок
Q-Критерий Кокрена
Временные ряды/Прогнозирование
Автокорреляция и частная автокорреляция
Скользящее среднее
Анализ выживаемости
Регрессия Кокса
Пробит-анализ
Встроенные функции
Все функции
Математические
Общие
Статистические
Финансовые
Описание пунктов меню
Настройка программы
Общие
Вид
Сохранение
Надстройки
Прочее

Справка StatPlus

Назад Вперед
Описательные статистики

Домой

 

www.statplus.net.ua

Описательные статистики

Подготовка

    Для проведения данной процедуры необходимо выделить диапазон ячеек и вызвать команду Статистика→Основная статистика/Таблицы→Описательные статистики или нажмите Control+D.

Результаты

Число элементов ряда - размер выборки используемой в данной процедуре.
Среднее - среднее значение элементов ряда. Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Исследователю нужны такие статистики, которые позволяют сделать вывод относительно популяции в целом. Одной из таких статистик является среднее. Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия (см. Элементарные понятия статистики), находится "истинное" (неизвестное) среднее популяции. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки (см. также Элементарные понятия статистики). Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.
 Стандартное отклонение (термин был впервые введен Пирсоном, 1894) - это широко используемая мера разброса или вариабельности (изменчивости) данных. Стандартное отклонение популяции определяется формулой:
= [(xi-µ)2/N]1/2
где
µ    - среднее выборки
N   -  размер выборки.

Стандартная ошибка (среднего). Термин стандартная ошибка среднего был впервые введен Юлом (Yule, 1897). Эта величина характеризует стандартное отклонение выборочного среднего, рассчитанное по выборке размера  n из генеральной совокупности, и зависит от дисперсии генеральной совокупности (сигма) и объема выборки (n):
= (2/n)1/2
где
2 - дисперсия генеральной совокупности и
n - число наблюдений в выборке.
Поскольку дисперсия генеральной совокупности, как правило, неизвестна, то оценка стандартной ошибки вычисляется по формуле:
= (s2/n)1/2
где
s  - выборочная дисперсия (наилучшая оценка дисперсии популяции) и
n  - объем выборки.

Минимум - наименшее значение выборки.
Максимум
- наибольшее значение выборки.
Диапазон (максимальное расстояние) - разница между наибольшим и наименшим значениями выборки.
Сумма - сумма элементов выборки.
Стандартная ошибка суммы - среднеквадратичное отклонение распределения сумм.
Сумма квадратов -  сумма квадратов элементов выборки. Иногда называется нескорректированная сумма квадратов:
 xi2.
Скорректированная сумма квадратов - сумма квадратов разниц элементов выборки от среднего выборки:
 (xi-µ)2
где
µ    - среднее выборки.

Дисперсия (Несмещенная оценка дисперсии) вычисляется по формуле:
2=(xi-µ)2/(N-1)
где
xi - выборочное среднее
µ    - среднее выборки
N   -  размер выборки

Среднее геометрическое - альтернативное  среднее, используется для деловых, экономических, и биологических приложений. Только неотрицательные величины используются в вычислении. Если одна из величин - нуль, среднее геометрическое  нулевое.

G = (Π xi )1/N
где
Π - произведение всех элементов выборки

Среднее гармоническое - среднее гармоническое среднее выборки.
Мода -  (термин был впервые введен Пирсоном, 1894) наиболее часто встречающаяся величина в выборке.
Нижняя граница доверительного интервала (LCL), Верхняя граница доверительного интервала (UCL) - верхние и нижние значения 100 (1-a) интервальных оценок для среднего основанного на t распределении с n-1 степенями свободы. Эта интервальная оценка предполагает, что среднеквадратичное отклонение совокупности не известно и что данные для этой переменной нормально распределены.
Aсимметрия -  или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является мерой несимметричности распределения.Например, если асимметрия (показывающая отклонение распределения от симметричного) существенно отличается от 0, то распределение несимметрично, в то время как нормальное распределение абсолютно симметрично. Итак, у симметричного распределения асимметрия равна 0. Асимметрия распределения с длинным правым хвостом положительна. Если распределение имеет длинный левый хвост, то его асимметрия отрицательна.
Эксцесс -  (термин был впервые введен Пирсоном, 1905) или точнее, коэффициент эксцесса измеряет "пикообразность" распределения. Если эксцесс (показывающий "остроту пика" распределения) существенно отличен от 0, то распределение имеет или более закругленный пик, чем нормальное, или, напротив, имеет более острый пик (возможно, имеется несколько пиков). Обычно, если эксцесс положителен, то пик заострен, если отрицательный, то пик закруглен. Эксцесс нормального распределения равен 0.
Альтернативная асимметрия (Фишера), Альтернативный эксцесс (Фишера) -  альтернативные меры асимметрии и эксцесса (по Фишеру). Обычно вычисляются в Microsoft* Excel* как асимметрия и эксцесс.
Коэффициент вариации - относительная мера дисперсии. Наиболее часто используется, чтобы сравнить количество вариаций в двух выборках. Может использоваться для тех же самых данных более чем два периода времени или для того же самого периода времени, но для двух различных мест. Это - среднеквадратичное отклонение, разделенное на среднее.
Cреднее отклонение - мера дисперсии, названной средним отклонением или средним абсолютным отклонением. Это не затрагивают выбросы столько, сколько среднеквадратичное отклонение, так как различия от среднего не возведены в квадрат. Если распределение для переменной, представляющей интерес нормально, среднее отклонение приблизительно равно 0.8*среднеквадратичное отклонение.
Второй момент (относительно среднего) (m2),Третий момент (относительно среднего) (m3),Четвёртый момент (относительно среднего) (m4) - моменты относительно среднего.
Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.

Ошибка медианы - вычисляется как me= (π/ 2N)1/2
Уровень значимости - см. Элементарные понятия статистики


Copyright ©Alexey Simachov, 2001-2005

   
The CHM file was converted to HTML by chm2web software.