مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

42
مید متلب در شیبر آموزش های کارجموعه م مدرس: می سلطان دکتر سمیرا بیراق فرا دکترا محقتیتو پاستور انس ایران مجموعه آموزش هایمیرد متلب در شی کاربfaradars.org/fvch9304

Transcript of مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

Page 1: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

مجموعه آموزش های کاربرد متلب در شیمی

:مدرس

دکتر سمیرا بیرامی سلطان

ایرانانستیتو پاستور –محقق فرا دکترا

کاربرد متلب در شیمیهایمجموعه آموزش

faradars.org/fvch9304

Page 2: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

Linear and nonlinear regression

فرادرسرگرسیون خطی و غیرخطی

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 3: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

روابط بین متغیرها

دارد؟وجودمتغیرچندیادوبینارتباطیآیا

کرد؟بینیپیشدیگرمتغیرهاییامتغیرطریقازرامتغیریکتغییراتوان تمیآیا

.استپذیرامکانرگرسیونتحلیلروشطریقازدومسؤالوهمبستگیطریقازاولسؤالپاسخ

همبستگی و رگرسیونبینتفاوت

کهاستایندرهمبستگیضریببارگرسیونتفاوت،استبینیپیشبدنبالرگرسیون.کندمیبررسیهمبارامتغیردووابستگیمیزانهمبستگیضریب

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 4: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

کالیبراسیونCalibration

رگرسیون خطی با یک متغیر مستقل

رسم خط رگرسیون

جذب در یک طول موج خاص

نمونه های کالیبراسیونCalibration set

a= c ɛb+a0

فرادرس

مجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 5: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

خط رگرسیون

Σ((xiβ+α) – yi)2 => min

کمترین مجموع مربعات اختالف ها»روش تعیین بهترین خط با مینیمم کردن»

|(xiβ+α) – yi|

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 6: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

کالیبراسیون چند متغیره

Multivariate Calibration

مکدان امروزه به دلیل رشدد دسدتگاه های الکترونیکدی، ا. اندازه گیری جذب در یک دامنه طول موجی وجود دارد

A

n

m

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 7: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

CLS

LeastSquares

Classical

حداقل مربعات کالسیک

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 8: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

حداقل مربعات کالسیک

Classical Least Squares (CLS)

A= C S

=A

n

m

C

n

p

S

p

m

ɛb

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 9: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

p>n اگرa1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13

a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23

a1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13

a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23

a3 = ɛ1 c31 + ɛ2 c32 + ɛ3 c33

p=n اگر

.، می توان یافت که معادالت را برازش کندɛتعداد بیشماری جواب،

.، می توان یافت که معادالت را برازش کندɛجواب منحصر به فرد برای

حل معادله

فرضp=3

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 10: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

a1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13

a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23

a3 = ɛ1 c31 + ɛ2 c32 + ɛ3 c33

a4= ɛ1 c41 + ɛ2 c42 + ɛ3 c43

p<n اگر

حل معادله

، توسط مینیمم کردن طول بردار باقیماندهɛحل دقیق برای .حاصل می شود

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 11: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

[Xb – y]=0

[XTXb –XT y]=0XTXb = XT y

b = (XTX)-1 XT y

b = X+ y

X + = (XTX)-1 XT

حداقل مربعات اختالف

Least Square

S = (CTC)-1 CT A

Xb = y

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 12: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

S = (CTC)-1 CT A

aTun= cT

un S cun= (SST)-1 S aun

.تعداد استانداردهای کالیبراسیون باید حداقل برابر با تعداد آنالیت ها باشد.تعداد طول موج ها باید برابر یا بزرگتر از تعداد اجزا باشد

:مرحله ی کالیبراسیون

:مرحله ی پیش بینی

حداقل مربعات کالسیک

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 13: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

:مزیتبرای تخمین غلظت ها اطالعات حاصل از یک رنج طول موجی اسدتفاده می شدود کده هدم ارز بدا تکدرار انددازه گیری ها و

.از این رو دقت در تخمین غلظت ها باال می رود. میانگین گیری سیگنال است

:عیب.شناخته شده باشد( کالیبراسیون)غلظت همه ی گونه ها در مجموعه ی استانداردها

حداقل مربعات کالسیک

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 14: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

ILS

LeastSquares

Inverse

حداقل مربعات معکوس

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 15: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

= c

n

1

A

n

p 1

p

b

حداقل مربعات معکوس

Inverse Least Squares (ILS)

c= A b

ضریب رگرسیونرگرسیون چندگانهمحاسبه

Multiple Linear Regression

(MLR)

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 16: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

تدوان همبسدتگی اگر ب. به معادله ای که رابطه بین دو متغیر مستقل و وابسته را نشان می دهد، معادله رگرسیون می گویند.را به صورت یک معادله خط نوشت، به آن معادله رگرسیون خطی می گویند

رگرسیونRegression

Y: مدل سازی متغیر وابسته

ویژگی شیمیایی•فعالیت بیولوژیکی•

X: توسط متغیرهای پیشگویی کننده

ترکیب شیمیایی•ساختار شیمیایی•

غیدر یدا مت. نامیدده مدی شدود( متغیر وابسدته) از سایر متغیرهاست متغیر پاسخ ( Y)در رگرسیون یک متغیر که تاثیر پذیر.نامیده می شود( متغیر مستقل) متغیر توضیحی ( X)متغیرهایی که بر متغیر پاسخ اثر می گذارند

Y =α+βX+ɛ

خطای تصادفی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 17: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

رگرسیون خطی و غیرخطی

بودن از نظر متغیرهاخطی•

بودن از نظر پارامترهاخطی•

121 χββy

12121 χβχββy

3

121 χββy

خطی

غیر خطی

غیر خطیخطی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 18: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

رگرسیون خطی چندگانه

y = b1 x1 + b2 x2 + … + bp xp

x11

x21

xn1

x12

x22

xn2

……

x1p

x2p

xnp

b1

b2

bp

y1

y2

yn

= y = X b

= y

n

1

X

n

pb

1

p

y

b = X+ y

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 19: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

= y1

n

1

X

n

p 1

p

b1y3

n

1

y2

n

1 1

p

b2

1

p

b3

=Y

n

m

X

n

p

B

p

m

Y= X B B= (XTX) -1XT Y

رگرسیون خطی چندگانه با چند متغیر وابسته

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 20: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

b = (ATA)-1 AT c

cTun= aT

un b

= c

n

1

A

n

p 1

p

b

حداقل مربعات معکوس

.تعداد استانداردهای کالیبراسیون باید حداقل برابر با تعداد طول موج ها باشد

:مرحله ی کالیبراسیون

:مرحله ی پیش بینی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 21: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

:مزیتراسدیون حودور الزم نیست که تمام گونه های شیمیایی شناخته شده باشند، اما باید گونده های مدزاحم در نمونده های کالیب

.داشته باشند

:عیبنمونه های کالیبراسیون باید به بزرگی تعداد طول موج ها باشند.

حداقل مربعات معکوس

استفاده از روش های انتخابمتغیر

(variable selection)

همبستگی خطی بین اندازه گیری های ثبت شده در طول موج های مختلف.منجر به نتایجی با صحت کمتر می شود

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 22: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

رگرسیون اجزای اصلی

Principal Component Regression

(PCR)

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 23: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

PCR

ComponentRegression

Principal

رگرسیون اجزای اصلی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 24: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

تفکیک مقادیر منفرد ُSingular Value Decomposition (SVD)

:انجام تفکیک مقادیر منفرد بر روی یک ماتریس سه ماتریس را نتیجه میدهد Sماتریس قطری مقادیر منفرد

Vو Uماتریسهای حاوی بردارهای ارتونرمال

X = U S VT UTU = VTV =I

=A

m

n

U

m

n

S

n

n

VT

n

n

Sc (Score)

L (loading)

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 25: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

A= C S = Sc L

CS

=L

=

= c

n

1

A

n

p 1

p

b= c

n

1 1

p

bScL

رگرسیون اجزای اصلی

Principal Component Regression (PCR)

A Sc

n

pn.pc

n.pc

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 26: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

b = VTS-1 UT c

cx = ax b

رگرسیون اجزای اصلی

:مرحله ی کالیبراسیون

:مرحله ی پیش بینی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 27: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

σP=∑ lii=1

p

∑ lii=1

n × 100

ارزیابی

Validation

چه تعداد اجزای اصلی(PC )باید حفظ شود؟

درصد واریانس توصیف شده* (Percentage of explained variance)

واریانس توصیف خواهد % 100در مدل استفاده شود، ( PC)اگر تمام اجزای اصلی .شد

واریانس توصیف شده ←σ

مقدار منفرد←λ

تعداد اجزای اصلی(PC )انتخاب شده←P=2,3,…,n

تعداد اجزای اصلی(PC )←n

s11

s22…

1e-3

1e-8

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 28: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

تعیین تعداد اجزا

s11

s22

1e-3

نویزدار

1e-8

n. PC2

پایین برازشUnder fit

باال برازشOverfit

فرادرسخطای سیستماتیکبرازش نویز

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 29: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

A

ارزیابی متقاطعCross Validation

کالیبراسیون

(PC)تعداد اجزای اصلی

2

3

ssq1

ssq2

C

CCalibc.

Pred.

محاسبهضریب کالیبراسیون

“b”

cx = apred. b

r=cx - cpred.

b

b

b

b

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 30: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

ارزیابی متقاطع

PRESS

n. PC2

باال برازشOverfit

Predictive

REsidual

Sum of

SquaresPRESS1

2

3

2

3

ssq’’1

ssq’’2

ssq’1

ssq’2

PRESSnPRESS2

2 3 … n

ssq1

ssq’1

ssq”1

ssq2

ssq’2

ssq’’2

… …

ssq’n

ssqn

ssq’’n

PRESS

CCPred.

Pred.

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 31: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

:مزایا

داده های نویز دار

داده هایی که دارای بستگی خطی(colinearity )بین متغیرهایشان هستند

داده هایی که تعداد نمونه ها کمتر از متغیرهای ستون ها است

کامل نبودن داده هایA وC

A

m

nm < n

A

m

nبین متغیرها colinearity

رگرسیون اجزای اصلی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 32: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

PLS

LeastSquares

Partial

حداقل مربعات جزئی

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 33: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

A = T P’ + E

C = T Q’ + E’

C = AWT(WTP’)-1 Q’ + E’ ضرایب رگرسیون((b

تئوری حداقل مربعات جزئی

1

2

رابطه بینCو Aدو ماتریس

ساختار از هر Cو Aدو ماتریس

PLS یک تعمیم ازMLRاست!

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 34: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

b = AWT(WTP’)-1 Q’

cx = ax b

:مرحله ی کالیبراسیون

:مرحله ی پیش بینی

حداقل مربعات جزئی

[XL,YL,XS,YS,BETA,PCTVAR,MSE,stats] = plsregress (X,Y,ncomp,...)

:دستور متلب

اسبهالگوریتم تکرارپذیر منجر به محW, P’, Q’, T

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 35: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

!!PLSتعداد اجزای

:اگر مناسب باشد•باال برازش

Overfitting

پایین برازشUnderfitting

توان پیش بینی خوبPrediction

ارزیابی متقاطعCross Validation

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 36: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

RR

RegressionRidge

ریدج رگرسیون

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 37: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

b = X+y

yTun= xT

un b

= y

n

1

X

n

p 1

p

b

:مرحله ی کالیبراسیون

:مرحله ی پیش بینی

b = ridge(y,X,k,scaled)

:دستور متلب

ریدج رگرسیون

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 38: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

:ارائه شده( ill-conditioned)که برای آنالیز داده های نامناسب MLRروش تغییر یافته از

ریدج رگرسیون

Ridge Regression (RR)

ضرایب رگرسیون محاسبه شده از این روش صحیح تر از ضرایب محاسبه شده توسط روشMLRاست .

در این الگوریتمRR مقدار بهینهϴمی تواند از روش ارزیابی متقاطع حاصل شود.

X + = (XTX)-1 XTفرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 40: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

پیش پردازش داده ها

Data preprocessing

(Auto scaling)خود مقیاس گذاری

(Mean centering)میانگین مرکزی

(xi /SD)

(xi – xaver)

وزن بیشتر برای متغیرهای با اطالعات مفیدتر: مقیاس گذاری

اطالعاتی در مورد اهمیت متغیرها وجود ندارد.

وزن های یکسانی برای متغیرهایX

.در نظر گرفته شده است

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 41: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

دل را برای مقایسه توانایی پیش بینی مدل های حاصل از روش های مختلف می تدوان انحدراف از بدرازش مد.توسط پارامترهای زیر محاسبه کرد

مقایسه روش های کالیبراسیون

Root-

Mean-

Square

Error of

Calibration

یا

RMSEP خطددا بددرای نموندده هایی محاسددبهی می شود که در ساخت مدل یا ارزیاب

.متقاطع به کار نمی روندPrediction

فرادرس

FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی

faradars.org/fvch9304

Page 42: مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم

ر مجموعه آموزش های کاربرد متلب د»این اسالید ها بر مبنای نکات مطرح شده در مجموعه فرادرس های

.تهیه شده است« شیمی

.برای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایید

faradars.org/fvch9304