Тестирование гипотез о нелинейных связях с...

31
Тестирование гипотез о нелинейных связях с использованием языка программирования R д.ф.-м.н., проф. Бахрушин В.Є . Бахрушин А.В. Класичний приватний університет, Запоріжжя [email protected] 2013

description

Презентация доклада на конференции "Информационные технологии в металлургии и машиностроении", Днепропетровск, 27 марта 2013 г.

Transcript of Тестирование гипотез о нелинейных связях с...

Page 1: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Тестирование гипотез о нелинейных связях с

использованием языка программирования R

д.ф.-м.н., проф. Бахрушин В.Є.Бахрушин А.В.

Класичний приватний університет, Запоріжжя[email protected]

2013

Page 2: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

Прежде, чем использовать формальные критерии и методы проверки гипотезы о наличии статистических связей, целесообразно провести предварительный анализ с помощью различных методов графического изображения данных.

Это позволяет выбрать методы, адекватные анализируемым данным.

Page 3: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

R = -0.000995R = 0.997 R = 0.181

Page 4: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

ЗНО

Page 5: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

ЗНО

Page 6: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

R = 0,191

Times Top-200

Page 7: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

Индекс SJR

Page 8: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

Citations Citations per Document

1 США Внешние малые острова США

2 Великобритания Токелау

3 Германия Бермуды

4 Япония Панама

5 Франция Кокосовые острова (Киллинг)

6 Канада Фарерские острова

7 Италия Гамбия

8 Китай Исландия

9 Нидерланды Швейцария

10 Австралия Гвинея-Биссау

Page 9: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Предварительный анализ данных

R = 0.96 – 0.99

R = 0.16

R = 0.80

R = 0.31

Page 10: Тестирование гипотез о нелинейных связях с использованием языка программирования R

1) - в этом случае необходимо задать уравнение связи в явном виде; обычно эту форму используют при проверке адекватности регрессионных моделей.

2) - необходимо предварительно упорядочить данные по возрастанию х и разбить их по интервалам.

( )2

d 2y

sK y; 1

sε= −X ( )

n 22y k

k 1

1s y y

n == −∑

( )( )n 22

i ii 1

1 ˆs y fnε

== −∑ X

( )jm 22

ij j*jj 1 i 1

1 1s y y

m

ν

ε= =

= −ν∑ ∑

Коэффициент детерминации

Page 11: Тестирование гипотез о нелинейных связях с использованием языка программирования R

( )( )n 22

i ii 1

1 ˆs y fnε

== −∑ X

( )jm 22

ij j*jj 1 i 1

1 1s y y

m

ν

ε= =

= −ν∑ ∑

Коэффициент детерминации

Page 12: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Нами был предложен альтернативный подход к расчету выборочного коэффициента детерминации. Он основан на использовании метода скользящих средних для оценивания неизвестных значений функции связи:

( )

i p

jj i p

i

y

f̂2p 1

+

= −=+

∑X

где d 2p 1= + – длина интервала сглаживания .

Коэффициент детерминации

Page 13: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

Page 14: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

R2 = 0.224

Kd1 = 0.917

Kd2 = 0.945

Page 15: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

R2 = 0.0002

Kd1 = 0.987

Kd2 = 0.987

Page 16: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

R2 = 0.027

Kd1 = 0.651

Kd2 = 0.976

Page 17: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

R2 = 0.007

Kd1 = 0.027

Kd2 = 0. 008

Случайная функция:

Page 18: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Коэффициент детерминации

R2 = 0.001

Kd1 = 0.008

Kd2 = 0. 025

Логистическое отображение:

Page 19: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Для анализа нелинейных связей между параметрами временных рядов предложено использовать выборочный коэффициент детерминации (рассчитываемый по традиционной методике) в качестве меры связи.

Коэффициент детерминации

Page 20: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Y = Aexp(|Bx|)sin(x) + Cx + ε

Коэффициент детерминации

Page 21: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Показники R2max Kd max Лаг

Нафта – Сталь 0,59 0,88 0

Нафта – Кокс 0,38 0,90 1

Нафта – Індекс ПФТС 0,42 0,84 – 2

Сталь – Кокс 0,55 0,91 1

Сталь – Індекс ПФТС 0,37 0,82 – 3

Кокс – Індекс ПФТС 0,01 0,71 – 6

Коэффициент детерминации

Page 22: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

( ) ( )'1 2f x kf x c= +

( )1i 1 2 i 1y a f x b= +

( )

( ) ( )( ) ( )

11 2 1

1j 1 j 1 1 j 1 1 j j j 1

y f x ;

y y f x f x x x / 2; j 2,...,n,− − −

=

= + + − =

1 2R(y , f ) Kd (y1, f2)

Page 23: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Kd = 0.9999; R2 = 0.9995

( ) 22 2f x x 5x 2= + − + ε( )1 1f x 2x 5= + + ε

Page 24: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Kd = 0.936; R2 = 0.926

( ) 22 2f x x 5x 2= + − + ε( )1 1f x 2x 5= + + ε

Page 25: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Kd = 0.963; R2 = 0.146

( ) 22 2f x x 5x 2= + − + εf1(x) = 2x + 15 + ε1

Page 26: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Page 27: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Page 28: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дифференциальные связи

Page 29: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Публикации

1. Бахрушин В.Є. Методи аналізу даних / В.Є. Бахрушин. – Запоріжжя: КПУ, 2011. – 268 с.

2. Бахрушин В.Є. Статистичний аналіз університетських рейтингів // Освіта і управління. – 2011. – № 1. – С. 7 – 12.

3. Бахрушин В.Є. Статистичний аналіз рейтингів українських університетів // Освіта і управління. – 2011. – № 2 – 3. – С. 30 – 37.

4. Бахрушин В.Є. Статистичний аналiзЗНО 2009 - 2011 // Higher Education in Ukraine: Internationalization, Reform, Innovation. International Conference. April 20-21, 2012. Kyiv, Ukraine, http://educationconferenceua2012.org.ua/doc/Bakhrushin_UA_Paper.doc.

5. Бахрушин В.Е. Методы оценивания характеристик нелинейных статистических связей / В.Е. Бахрушин // Системні технології: Регіональний міжвузівський збірник наукових праць. Дніпропетровськ, 2011. - № 2(73). – С. 9 – 14.

Page 30: Тестирование гипотез о нелинейных связях с использованием языка программирования R

6. Бахрушин В.Є., Павленко В.Є., Петрова С.В. Застосування показників нелінійної кореляції для побудови й аналізу крос-кореляційних функцій // Складні системи і процеси. – 2009, № 2. – С. 78 – 85.

7. Бахрушин В.Е., Павленко В.Е., Петрова С.В. Применение выборочного коэффициента детерминации для построения и анализа кросс-корреляционных функций // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем / Под ред. Ю.М. Соломенцева, Б.Н. Четверушкина, А.В. Боголюбова и др. – М.: МГТУ "СТАНКИН", Янус-К, 2010. – Вып. 13. – С. 4 – 12.

8. Бахрушин В.Є. Критерій для перевірки гіпотези про наявність зв'язку типу // Складні системи і процеси. – 2010, № 1. – С. 3 – 5.

9. Бахрушин В.Е. Статистический анализ дифференциальных связей в колебательных системах // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем: Ежегодный сборник научных трудов, вып. 14. Труды второй международной конференции Моделирование нелинейных процессов и систем / Под ред. Л.А. Уваровой. – М.: Янус-К, 2011. – С. 57 – 62.

( ) ( )'1 2f x kf x=

Page 31: Тестирование гипотез о нелинейных связях с использованием языка программирования R

Дякую за увагу