ЛАБОРАТОРНЕ ЗАНЯТТЯ № 6kukh.ho.ua/kurs/NIT_P/LAB1/Lab_15.pdf ·...

12
ЛАБОРАТОРНЕ ЗАНЯТТЯ № 15 Тема: Обробка статистичних даних засобами електронних таблиць. Мета: Уміти використовувати функції Excel для організації обробки статистичних даних. План 1. Основи математичної статистики 2. Використання статистичних функцій Теоретична частина 1. Основи математичної статистики Математична статистика - наука, що розвиває методи, які дають можливість та результатами експериментів робити певні висновки імовірнісного характеру. Іншими словами, математична статистика розробляє методи, які дають можливість на підставі статистичних (експериментальних) даних будувати відповідні теоретико-ймовірнісні моделі й на основі аналізу цих даних робити прогнози. Випадкова величина X – це величина, яка в результаті досліду може приймати те чи інше значення, невідомо заздалегідь – яке саме (кидання 2 монет: Г-Р, Р-Р, Г-Г, Р-Г). Математичне сподівання випадкової величини – сума всіх можливих значень випадкової величини на вірогідність цих значень або просто середнє значення випадкової величини. M X = i=1 n x i p i , p i - імовірність появи значення випадкової величини (імовірність появи «герб–решка» складає 1/4) M X = X Дисперсія – це відхилення від математичного сподівання. D X = i= 1 n x i M X 2 p i Сукупність однорідних об'єктів, що об'єднані якою-небудь загальною ознакою кількісного або якісного характеру, називається статистичною сукупністю. Об'єкти, що її утворюють, називають елементами (або одиницями) сукупності.

Transcript of ЛАБОРАТОРНЕ ЗАНЯТТЯ № 6kukh.ho.ua/kurs/NIT_P/LAB1/Lab_15.pdf ·...

ЛАБОРАТОРНЕ ЗАНЯТТЯ № 15

Тема: Обробка статистичних даних засобами електронних таблиць.

Мета: Уміти використовувати функції Excel для організації обробки статистичних даних.

План

1. Основи математичної статистики

2. Використання статистичних функцій

Теоретична частина

1. Основи математичної статистики

Математична статистика - наука, що розвиває методи, які дають можливість та результатами експериментів робити певні висновки імовірнісного характеру. Іншими словами, математична статистика розробляє методи, які дають можливість на підставі статистичних (експериментальних) даних будувати відповідні теоретико-ймовірнісні моделі й на основі аналізу цих даних робити прогнози.

Випадкова величина X – це величина, яка в результаті досліду може приймати те чи інше значення, невідомо заздалегідь – яке саме (кидання 2 монет: Г-Р, Р-Р, Г-Г, Р-Г).

Математичне сподівання випадкової величини – сума всіх можливих значень випадкової величини на вірогідність цих значень або просто середнє значення випадкової величини.

M X =∑i=1

n

xi pi , pi - імовірність появи значення випадкової величини

(імовірність появи «герб–решка» складає 1/4)

M X =X

Дисперсія – це відхилення від математичного сподівання.

D X =∑i=1

n

x i−MX 2pi

Сукупність однорідних об'єктів, що об'єднані якою-небудь загальною ознакою кількісного або якісного характеру, називається статистичною сукупністю. Об'єкти, що її утворюють, називають елементами (або одиницями) сукупності.

© 2005-2009, Слободянюк О.В.

Сукупність елементів S' називається вибірковою сукупністю, або вибіркою, а кількість елементів вибірки – її об'ємом. Уся сукупність елементів S називається загальною або генеральною сукупністю

Суть вибіркового методу полягає в тому, що за знайденими значеннями характеристик вибіркової сукупності роблять певні висновки про значення відповідних характеристик генеральної сукупності

Найважливішим принципом вибіркового методу є забезпечення однакової можливості всім елементам, що входять в генеральну сукупність, бути вибраними. За такою вибору елементів, коли жодний елемент не має переваги потрапити у вибірку порівняно з іншими елементами.

Вибірка називається випадковою, якщо із сукупності S відбираються навмання, тобто в сукупність S' може з однаковою ймовірністю потрапити будь-який елемент S .

Для того, щоб за даними вибірки можна було б робити правильні висновки про генеральну сукупність, необхідно, щоб елементи вибірки правильно її представляли. Коротко цю вимогу формулюють так: вибірка повинна бути репрезентативною.

2. Використання статистичних функцій

Однією з основних цілей розробки програми електронних таблиць була автоматизація статистичної обробки даних. Розглянемо деякі із статистичних функцій редактора електронних таблиць OpenOffice.org Calc.

Всі функції обробки статистичних даних розташовані в категорії «Статистичний» асистента функцій.

Функція СЕРЕДНЄ()

СЕРЕДНЄ(число1;число2;...)

Функція обчислення середнього арифметичного значення чисел або діапазону чисел.

Приклади:

1. СЕРЕДНЄ(A1;A2;A3;B3;B4)

2. СЕРЕДНЄ(E1:E20)

2

© 2005-2009, Слободянюк О.В.

Функції МАКС() та МІН()

МАКС(число1;число2;...) та МІН(число1;число2;...)

Функції знаходження максимального та мінімального елементів. Аргументи можна задавати як числами, так і адресами комірок. Але в одній функції не можна задавати частину аргументів числами, а частину — адресами. Calcl видасть повідомлення про помилку.

Якщо в блоку попадаються пусті комірки, функції MAKC() та МIН() їх ігнорують.

Приклади:

1. МАКС(A1;A2;A3;B3;B4)

2. МІН(E1:E20)

Функція ПОЗ.ЗНАЧ( )

ПОЗ.ЗНАЧ(значення; дані; тип)

Якщо потрібно не тільки обчислити найбільше та/або найменше значення прибутку, але й розташувати числа в порядку зростання (спадання), то використовують функцію ранжування.

Функція ПОЗ.ЗНАЧ() має такі параметри:

«Значення» — число, для якого визначається ранг.

«Дані» — масив або посилання на список чисел. Нечислові значення в посиланні ігноруються.

«Тип» — число, що визначає спосіб впорядкування (0 — зростання, 1 — спадання).

Якщо порядок рівний 0 (нулю) або відсутній, то Excel визначає ранг числа так, як якби посилання була списком, відсортованим в порядку спадання.

Якщо порядок — довільне ненульове число, то Excel визначає ранг числа так, як якби посилання була списком, відсортованим в порядку зростання.

3

© 2005-2009, Слободянюк О.В.

Функція ПОЗ.ЗНАЧ присвоює числам, що повторюються однаковий ранг. Однак наявність таких чисел впливає на ранги наступних чисел. Наприклад, якщо в списку цілих чисел, відсортованих по зростанню, двічі зустрічається число 10, що має ранг 5, число 11 буде мати ранг 7 (жодне з цих чисел не буде мати ранг 6).

Функція РАХ()

РАХ(значення1; значення2;...)

Функція знаходження кількості чисел, заданих в списку аргументів. Список не повинен містити більше 30 аргументів. Аргументи можуть являти собою числа, тексти, адреси комірок але на підрахунок впливають лише числа. РАХ(12;«hhh»;3)=2

Дану функцію використовують для підрахунку числа комірок, в яких введені які-небудь числові значення.

Функція РАХ.А()

РАХ.А(значення1; значення2; ...)

Функція знаходження кількості «непустих» значень в списку аргументів, що не перевищує 30 елементів.

Дану функцію використовують для підрахунку числа заповнених комірок в заданій області. Якщо в якості аргументів задаються пусті поля, наприклад

4

© 2005-2009, Слободянюк О.В.

=РАХ.А( ; ; ), то в цьому випадку буде показано число 3, що позначає наявність трьох пустих аргументів.

Функція РАХ.ЯКЩО()

РАХ.ЯКЩО(діапазон; критерій)

Функція знаходження кількості комірок всередині діапазону, що задовольняє заданому критерію.

Діапазон — діапазон, в якому потрібно підрахувати комірки.

Критерій — критерій у формі числа, виразу чи тексту, який визначає, які комірки потрібно підраховувати. Наприклад, критерій може бути виражений наступним чином: 32, «32», «>32», «діти».

Функція ПОРОЖ.КОМІРКИ( )

ПОРОЖ.КОМІРКИ(діапазон)

Функція знаходження кількості «пустих» значень в заданому діапазоні.

Комірки з формулами, які повертають значення «» (пустий текст), враховуються при підрахунку. Комірки з нульовими значеннями не враховуються.

5

© 2005-2009, Слободянюк О.В.

Функція СУММ.ЯКЩО()

СУММ.ЯКЩО(діапазон; критерій)

Функція знаходження суми значень комірок всередині діапазону, що задовольняє заданому критерію.

Діапазон — діапазон, в якому потрібно підрахувати комірки.

Критерій — критерій у формі числа, який визначає, які комірки потрібно підраховувати. Наприклад, критерій може бути виражений наступним чином: 4, «<=5», «>4», «=2».

Функція ДИСП()

ДИСП(число1; число2; ...)

Функція обчислення дисперсії випадково вибраних n чисел на базі зразку, причому їх число не повинно перевищувати 30. Функція ДИСП() передбачає, що аргументами є тільки вибірка з генеральної сукупності. Якщо дані представляють всю генеральну сукупність, то слід обчислити дисперсію, використовуючи функцію ДИСПР().

ДИСП() використовує наступну формулу: ∑ x−x 2

n−1, де x — вибіркове

середнє СЕРЕДНЄ(число1,число2,…), а n — розмір вибірки.

6

© 2005-2009, Слободянюк О.В.

Функція СТ.ДЕВ()

СТ.ДЕВ(число1;число2;...)

Функція оцінки стандартного відхилення по виборці. Стандартне відхилення — це міра того, наскільки широко розкидані точки даних відносно їх середнього.

Число1, число2,... — від 1 до 30 числовых аргументов, що відповідають вибірці з генеральної сукупності.

СТ.ДЕВ() використовує наступну формулу: ∑ x−x 2

n−1

Припустимо, що з інструментів, відштампованих однією і тією ж машиною, вибрані навмання 10 штук і випробувані на міцність.

Функція КОРРЕЛ()

КОРРЕЛ(массив1;массив2)

Обчислює коефіцієнт кореляції між інтервалами комірок Масив1 та Масив2. Коефіцієнт кореляції використовується для визначення наявності взаємозв’язку між двома властивостями. Наприклад, можна встановити залежність між середньою температурою в приміщенні і використанням кондиціонера.

Массив1 — це комірка інтервалу значень.

Массив2 — це другий інтервал комірок із значеннями.

7

© 2005-2009, Слободянюк О.В.

8

© 2005-2009, Слободянюк О.В.

9

© 2005-2009, Слободянюк О.В.

1

© 2005-2009, Слободянюк О.В.

Практичне завдання

1. Запустіть редактор електронних таблиць OpenOffice.org Calc.

2. Збережіть файл із завданнями у теку «Електронні таблиці».

3. Виконайте всі запропоновані завдання.

4. Збережіть внесені вами в документ зміни (швидко - <Ctrl+S>).

5. Закінчіть роботу. Подайте на перевірку отриманий файл. Після перевірки

видаліть файл.

1

© 2005-2009, Слободянюк О.В.

Контрольні запитання

1. Що таке математичне сподівання?

2. Для чого використовуються статистичні функції?

3. Що таке дисперсія?

4. Що таке випадкова величина?

5. Для чого використовується коефіцієнт кореляції?

6. Для чого використовується функція РАНГ()?

7. Як можна підрахувати непусті комірки, що відповідають заданій умові?

8. Як порахувати комірки з числами?

Література

1. Альбрехт Р., Николь Н. Электронные таблицы Excel 5.0. М.: «ЭКОМ». – 1994. 343 с.

2. Бородкіна І.Л., Матвієнко О.В. Практичний курс з комп’ютерних технологій підготовки даних. – Київ: Центр навчальної літератури. – 2004. – 448 с.

3. Дьяконов В. и др. Комп’ютер для студента. Самоучитель. – СПб.: Питер. – 2001. – 592 с.

4. Шестопалов Є.А. Інформатика, базовий курс (варіант Windows). Посібник з інформатики, книга 1. – 2003. – 224 с.

1