Онлайн переводчик http://translate.meta.ua
поменять
По-русски

Для выборки находят основные её характеристики:

1. Выборочное (эмпирическое) среднее.

Формула Excel =СРЗНАЧ(<диапазон выборки>)

2. Дисперсия.

Формула Excel =ДИСП.В(<диапазон выборки>)

3. Среднеквадратическое отклонение.

Формула Excel =КОРЕНЬ(Дисперсии)

4. Объем выборки –

Формула Exсel =СЧЁТ(<диапазон выборки>)

Получили значения

x_cp 2,01

Дисперсия 0,63270486

Ср. кв. отклон 0,79542747

n 80

Использование критерия Пирсона для определения вида распределения требует разделения всего размаха выборки на n-частичных интервалов. Размахом выборки является расстояние между максимальным и минимальным членом вариационного ряда (массива данных).

Для нахождения минимального и максимально элемента выборки используем формулы Excel:

=МИН(<диапазон выборки>)

=МАКС(<диапазон выборки>).

Количество частичных интервалов берут 7-10. Для определения шага для разбиения размаха выборки используется формула:

=(МАКС(<…>)-МИН(<…>))/k,

где k – выбранное количество интервалов.

x_min 0,09

x_max 3,81

h 0,53142857

Для получения начальной гипотезы построим гистограмму, отложив по горизонтали карманы выборки, по вертикали – частоты.

Построение гистограммы можно выполнить при помощи настройки Excel «Анализ Данных» или «ручного» построения.

Расчеты для «ручного» построения гистограммы:

Карман Частота

минимальное элемент выборки –

предыдущий карман h ЧАСТОТА(…)

предыдущий карман h ЧАСТОТА(…)

предыдущий карман h ЧАСТОТА(…)

предыдущий карман h ЧАСТОТА(…)

предыдущий карман h ЧАСТОТА(…)

предыдущий карман h ЧАСТОТА(…)

максимальный элемент выборки ЧАСТОТА(…)

Формула Excel = ЧАСТОТА(…) имеет 2 обязательных аргумента:

1) массив_данных —массив или ссылка на множество значений, для которых вычисляются частоты. Если аргумент "массив_данных" не содержит значений, функция ЧАСТОТА возвращает массив нулей.

2) массив_интервалов —массив или ссылка на множество интервалов, в которые группируются значения аргумента "массив_данных". Если аргумент "массив_интервалов" не содержит значений, функция ЧАСТОТА возвращает количество элементов в аргументе "массив_данных".

Формула в ячейке является формулой массива. Чтобы эта функция возвращала значение в ячейках, которые находятся ниже, выделите диапазон вместе с ячейкой, в которой получен результат, нажмите клавишу F2, а затем — клавиши CTRL SHIFT Enter. В противном случае будет возвращено только значение в ячейке, которая выделена.

Получаем

карман частота

0,09

0,62 4

1,15 7

1,68 14

2,22 22

2,75 19

3,28 9

3,81 5

Полученные значения используем при построении гистограммы при помощи Диаграмма –> Гистограмма.

Построение гистограммы можно выполнить при помощи настройки Excel «Анализ Данных».

Для получения гистограммы переходим в пункт верхнего меню «Данные» – Анализ Данных – Гистограмма. В диалоговом окне (рис. Д.1) нужно заполнить поля:

Рисунок Д.1 – Диалоговое окно «Гистограмма»

• Входной интервал является интервалом, в котором расположения выборка;

• Интервал карманов – выбираем ячейки, в которых мы заранее посчитали карманы;

• Выходной интервал – место на листе, где будет размещена таблица с карманами и частотами и сама гистограмма;

• Выбираем Вывод графика, так как без этого мы получим только карманы и частоты.

Оба варианта дадут нужную гистограмму (рис. Д.2), по которой можно выдвинуть гипотезу о виде распределения.

Рисунок Д.2 – Построенная гистограмма

Использование критерия Пирсона. Для расчета построим следующую таблицу:

Кармани Эмпирические Частоты Теор. Частоты X^2_набл

Карманы, которые мы нашли ранее, переносим в первый столик. Эмпирические частоты – количество попаданий в і-й интервал. Эти частоты мы получили при помощи функции = ЧАСТОТА(…) или после использования пакета Анализ Данных – Гистограмма.

Теоретические частоты – это вероятность попадания в і-й интервал, умноженная на объем выборки

Если выдвинуто предположение, что выборка имеет нормальное распределение, то теоретические частоты вычисляется следующим образом: =(НОРМРАСП(X;среднее; старндартное_отклоние;1)-НОРМРАСП(X-1;среднее; стандартное_отклонение;1))*СЧЁТ(<диапазон выборки>), где Х-1 и Х – концы интервала [Х-1; Х].

Если выдвинуто предположение, что выборка имеет экспоненциальное распределение, то теоретические частоты вычисляется следующим образом: =(EXP(-Х/среднее) - EXP(-(X-1)/ среднее))*СЧЁТ(<диапазон выборки>), где Х-1 и Х – концы интервала [Х-1; Х].

Если выдвинуто предположение, что выборка имеет равномерное распределение, то теоретические частоты вычисляется следующим образом: = СЧЁТ(<диапазон выборки>) *(X-(X-1))/( МАКС(<диапазон выборки>)-МИН(<диапазон выборки>))*, где Х-1 и Х – концы интервала [Х-1; Х].

После нахождения теоретических и эмпирических частот находим X^2_набл= ((Эмп.част-Теор.част.)^2/Теор.част.) на і-ом интервале.

После того, как заполнена вся таблицу, строим гистограмму теоретических и эмпирических частот, чтобы оценить выборку (рис. Д.3 – Д.5).

Рисунок Д.3 – Гистограмма теоретических и эмпирических частот (нормальное распределение)

Рисунок Д.4 – Гистограмма теоретических и эмпирических частот (экспоненциальное распределение)

Рисунок Д.3 – Гистограмма теоретических и эмпирических частот (равномерное распределение)

Выполняем оценку. Найдем X^2 как сумму X^2_набл на всех і-х интервалах. Критическое значение X^2_кр является табличным. Его значение получаем при помощи функции Excel =ХИ2.ОБР(уровень значимости; количество степеней свободы). Уровнем значимости является вероятность откинуть правильную гипотезу. В основном, уровень значимости принимает значения 0.05 и 0.1.

Количество степеней свободны определяется следующим образом:

Нормальное распределение N-1-2

Экспоненциальное распределение N-1-1

Равномерное распределение N-1-0

где N – объем выборки, параметр 0,1 или 2 показывает количество характеристик, от которых зависит распределение.

Если X^2 < X^2_кр – гипотезу принимаем, в другом случае гипотезу отклоняем. Если гипотеза оказалась не верной, проверяем выборку для другого вида распределения.

Если ни одна гипотеза не потвердилась при использовании критерия Пирсона, то можна увеличить уровень значимости или же выполнить рассчет по критерию Колмогорова-Смирнова.

Для проверки критерия Колмогорова-Смирнова заполним следующую таблицу:

Карманы Кол-во попаданий Эмпирические Частоты Теор. Частоты Модуль разности частот

Карманы, которые найдены ранее, переносим в первый столик. Эмпирические частоты – вероятность попадания в і-й интервал. Эти частоты получены при помощи функции = ЧАСТОТА(…)/СЧЁТ(<…>).

Теоретические частоты – это вероятность попадания в і-й интервал:

Если выдвинуто предположение, что выборка имеет нормальное распределение, то теоретические частоты вычисляется следующим образом: =(НОРМРАСП(X;среднее; старндартное_отклоние;1)-НОРМРАСП(X-1;среднее; старндартное_отклоние;1)), где Х-1 и Х – концы интервала [Х-1; Х].

Если выдвинуто предположение, что выборка имеет

По-украински

Для вибірки знаходять основні її характеристики:

1. Вибіркове (емпіричне) середнє.

Формула Excel =СРЗНАЧ (<діапазон вибірки>)

2. Дисперсія.

Формула Excel =ДИСП.У (<діапазон вибірки>)

3. Середньоквадратичне відхилення.

Формула Excel =КОРІНЬ (Дисперсії)

4. Об'єм вибірки -

Формула Exсel =РАХУНОК (<діапазон вибірки>)

Отримали значення

x _ cp 2,01

Дисперсія 0,63270486

Ср. кв. відхилення 0,79542747

n 80

Використання критерію Пірсону для визначення виду розподілу вимагає розділення усього розмаху вибірки на n- часткових інтервалів. Розмахом вибірки є відстань між максимальним і мінімальним членом варіаційного ряду (масиву даних).

Для знаходження мінімального і максимально елементу вибірки використовуємо формули Excel :

=МІН (<діапазон вибірки>)

=МАКС (<діапазон вибірки>).

Кількість часткових інтервалів бере 7-10. Для визначення кроку для розбиття розмаху вибірки використовується формула:

=(МАКС (<.>) -МИН (<.>))/k

де k - вибрана кількість інтервалів.

x _ min 0,09

x _ max 3,81

h 0,53142857

Для отримання початкової гіпотези побудуємо гістограму, відклавши по горизонталі кишені вибірки, по вертикалі - частоти.

Побудову гістограми можна виконати за допомогою налаштування Excel "Аналіз Даних" або "ручної" побудови.

Розрахунки для "ручної" побудови гістограми :

Кишеня Частота

мінімальне елемент вибірки -

попередня кишеня h ЧАСТОТА (.)

попередня кишеня h ЧАСТОТА (.)

попередня кишеня h ЧАСТОТА (.)

попередня кишеня h ЧАСТОТА (.)

попередня кишеня h ЧАСТОТА (.)

попередня кишеня h ЧАСТОТА (.)

максимальний елемент вибірки ЧАСТОТА (.)

Формула Excel = ЧАСТОТА (.) має 2 обов'язкові аргументи:

1) массив_данных -массив або посилання на безліч значень, для яких обчислюються частоти. Якщо аргумент "масив _ даних" не містить значень, функція ЧАСТОТА повертає масив нулів.

2) массив_интервалов -массив або посилання на безліч інтервалів, в які групуються значення аргументу "масив _ даних". Якщо аргумент "масив _ інтервалів" не містить значень, функція ЧАСТОТА повертає кількість елементів в аргументі "масив _ даних".

Формула в осередку є формулою масиву. Щоб ця функція повертала значення в осередках, які знаходяться нижче, виділіть діапазон разом з осередком, в якому отриманий результат, натисніть клавішу F2, а потім - клавіші CTRL SHIFT Enter. Інакше буде повернено тільки значення в осередку, який виділений.

Отримуємо

кишеня частота

0,09

0,62 4

1,15 7

1,68 14

2,22 22

2,75 19

3,28 9

3,81 5

Отримані значення використовуємо при побудові гістограми при допомозі Діаграма -> Гістограма.

Побудову гістограми можна виконати за допомогою налаштування Excel "Аналіз Даних".

Для отримання гістограми переходимо в пункт верхнього меню "Дані" - Аналіз Даних - Гістограма. У діалоговому вікні (мал. Д.1) треба заповнити поля:

Малюнок Д.1 - Діалогове вікно "Гістограма"

- Вхідний інтервал є інтервалом, в якому розташування вибірка;

- Інтервал кишень - вибираємо осередки, в яких ми заздалегідь порахували кишені;

- Вихідний інтервал - місце на листі, де буде розміщена таблиця з кишенями і частотами і сама гістограма;

- Вибираємо Виведення графіку, оскільки без цього ми отримаємо тільки кишені і частоти.

Обидва варіанти дадуть потрібну гістограму (мал. Д.2), по якій можна висунути гіпотезу про вид розподілу.

Малюнок Д.2 - Побудована гістограма

Використання критерію Пірсону. Для розрахунку побудуємо наступну таблицю:

Кармани Емпіричні Частоти Теор. Частоти X^2 набл

Кишені, які ми знайшли раніше, переносимо в перший столик. Емпіричні частоти - кількість попадань в і- й інтервал. Ці частоти ми отримали за допомогою функції = ЧАСТОТА (.) або після використання пакету Аналіз Даних - Гістограма.

Теоретичні частоти - це вірогідність попадання в і- й інтервал, помножена на об'єм вибірки

Якщо висунено припущення, що вибірка має нормальний розподіл, то теоретичні частоти обчислюється таким чином: = (НОРМРАСП (X;середнє; старндартное_отклоние;1) -НОРМРАСП (X - 1;середнє; стандартное_отклонение;1)) *РАХУНОК (<діапазон вибірки>), де Х- 1 і Х - кінці інтервалу [Х- 1; Х].

Якщо висунено припущення, що вибірка має експоненціальний розподіл, то теоретичні частоти обчислюється таким чином: = (EXP (-Х/середнє) - EXP (- (X - 1) / середнє)) *РАХУНОК (<діапазон вибірки>), де Х- 1 і Х - кінці інтервалу [Х- 1; Х].

Якщо висунено припущення, що вибірка має рівномірний розподіл, то теоретичні частоти обчислюється таким чином: = РАХУНОК (<діапазон вибірки>) * (X - (X - 1)) / ( МАКС (<діапазон вибірки>) -МИН (<діапазон вибірки>)) *, де Х- 1 і Х - кінці інтервалу [Х- 1; Х].

Після знаходження теоретичних і емпіричних частот знаходимо X^2 набл= ((Эмп.част-Теор.част.)^2/Теор.част.) на і- ом інтервалі.

Після того, як заповнена уся таблицю, будуємо гістограму теоретичних і емпіричних частот, щоб оцінити вибірку (мал. Д.3 - Д.5).

Малюнок Д.3 - Гістограма теоретичних і емпіричних частот (нормальний розподіл)

Малюнок Д.4 - Гістограма теоретичних і емпіричних частот (експоненціальний розподіл)

Малюнок Д.3 - Гістограма теоретичних і емпіричних частот (рівномірний розподіл)

Виконуємо оцінку. Знайдемо X^2 як суму X^2 набл на усіх і- х інтервалах. Критичне значення X^2 кр є табличним. Його значення набуваємо за допомогою функції Excel =ХИ2.ОБР (рівень значущості; кількість ступенів свободи). Рівнем значущості є вірогідність відкинути правильну гіпотезу. В основному, рівень значущості набуває значень 0.05 і 0.1.

Кількість мір вільна визначається таким чином:

Нормальний розподіл N - 1-2

Експоненціальний розподіл N - 1-1

Рівномірний розподіл N - 1-0

де N - об'єм вибірки, параметр 0,1 або 2 показує кількість характеристик, від яких залежить розподіл.

Якщо X^2 < X^2 кр - гіпотезу приймаємо, в іншому випадку гіпотезу відхиляємо. Якщо гіпотеза виявилася не вірною, перевіряємо вибірку для іншого виду розподілу.

Якщо жодна гіпотеза не потвердилась при використанні критерію Пірсону, то можна збільшити рівень значущості або ж виконати рассчет за критерієм Колмогорова-Смирнова.

Для перевірки критерію Колмогорова-Смирнова заповнимо наступну таблицю:

Кишені К-ть попадань Емпіричні Частоти Теор. Частоти Модуль різниці частот

Кишені, які знайдені раніше, переносимо в перший столик. Емпіричні частоти - вірогідність попадання в і- й інтервал. Ці частоти отримані за допомогою функції = ЧАСТОТА (.) /РАХУНОК (<.>).

Теоретичні частоти - це вірогідність попадання в і- й інтервал:

Якщо висунено припущення, що вибірка має нормальний розподіл, то теоретичні частоти обчислюється таким чином: = (НОРМРАСП (X;середнє; старндартное_отклоние;1) -НОРМРАСП (X - 1;середнє; старндартное_отклоние;1)), де Х- 1 і Х - кінці інтервалу [Х- 1; Х].

Якщо висунено припущення, що вибірка має експоненціальний розподіл, то теоретичні частоти обчислюється таким чином: