مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم
Transcript of مجموعه آموزش های کاربرد متلب در شیمی - درس پنجم
مجموعه آموزش های کاربرد متلب در شیمی
:مدرس
دکتر سمیرا بیرامی سلطان
ایرانانستیتو پاستور –محقق فرا دکترا
کاربرد متلب در شیمیهایمجموعه آموزش
faradars.org/fvch9304
Linear and nonlinear regression
فرادرسرگرسیون خطی و غیرخطی
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
روابط بین متغیرها
دارد؟وجودمتغیرچندیادوبینارتباطیآیا
کرد؟بینیپیشدیگرمتغیرهاییامتغیرطریقازرامتغیریکتغییراتوان تمیآیا
.استپذیرامکانرگرسیونتحلیلروشطریقازدومسؤالوهمبستگیطریقازاولسؤالپاسخ
همبستگی و رگرسیونبینتفاوت
کهاستایندرهمبستگیضریببارگرسیونتفاوت،استبینیپیشبدنبالرگرسیون.کندمیبررسیهمبارامتغیردووابستگیمیزانهمبستگیضریب
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
کالیبراسیونCalibration
رگرسیون خطی با یک متغیر مستقل
رسم خط رگرسیون
جذب در یک طول موج خاص
نمونه های کالیبراسیونCalibration set
a= c ɛb+a0
فرادرس
مجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
خط رگرسیون
Σ((xiβ+α) – yi)2 => min
کمترین مجموع مربعات اختالف ها»روش تعیین بهترین خط با مینیمم کردن»
|(xiβ+α) – yi|
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
کالیبراسیون چند متغیره
Multivariate Calibration
مکدان امروزه به دلیل رشدد دسدتگاه های الکترونیکدی، ا. اندازه گیری جذب در یک دامنه طول موجی وجود دارد
A
n
m
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
CLS
LeastSquares
Classical
حداقل مربعات کالسیک
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
حداقل مربعات کالسیک
Classical Least Squares (CLS)
A= C S
=A
n
m
C
n
p
S
p
m
ɛb
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
p>n اگرa1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13
a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23
a1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13
a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23
a3 = ɛ1 c31 + ɛ2 c32 + ɛ3 c33
p=n اگر
.، می توان یافت که معادالت را برازش کندɛتعداد بیشماری جواب،
.، می توان یافت که معادالت را برازش کندɛجواب منحصر به فرد برای
حل معادله
فرضp=3
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
a1 = ɛ1 c11 + ɛ2 c12 + ɛ3 c13
a2 = ɛ1 c21 + ɛ2 c22 + ɛ3 c23
a3 = ɛ1 c31 + ɛ2 c32 + ɛ3 c33
a4= ɛ1 c41 + ɛ2 c42 + ɛ3 c43
p<n اگر
حل معادله
، توسط مینیمم کردن طول بردار باقیماندهɛحل دقیق برای .حاصل می شود
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
[Xb – y]=0
[XTXb –XT y]=0XTXb = XT y
b = (XTX)-1 XT y
b = X+ y
X + = (XTX)-1 XT
حداقل مربعات اختالف
Least Square
S = (CTC)-1 CT A
Xb = y
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
S = (CTC)-1 CT A
aTun= cT
un S cun= (SST)-1 S aun
.تعداد استانداردهای کالیبراسیون باید حداقل برابر با تعداد آنالیت ها باشد.تعداد طول موج ها باید برابر یا بزرگتر از تعداد اجزا باشد
:مرحله ی کالیبراسیون
:مرحله ی پیش بینی
حداقل مربعات کالسیک
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
:مزیتبرای تخمین غلظت ها اطالعات حاصل از یک رنج طول موجی اسدتفاده می شدود کده هدم ارز بدا تکدرار انددازه گیری ها و
.از این رو دقت در تخمین غلظت ها باال می رود. میانگین گیری سیگنال است
:عیب.شناخته شده باشد( کالیبراسیون)غلظت همه ی گونه ها در مجموعه ی استانداردها
حداقل مربعات کالسیک
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
ILS
LeastSquares
Inverse
حداقل مربعات معکوس
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
= c
n
1
A
n
p 1
p
b
حداقل مربعات معکوس
Inverse Least Squares (ILS)
c= A b
ضریب رگرسیونرگرسیون چندگانهمحاسبه
Multiple Linear Regression
(MLR)
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
تدوان همبسدتگی اگر ب. به معادله ای که رابطه بین دو متغیر مستقل و وابسته را نشان می دهد، معادله رگرسیون می گویند.را به صورت یک معادله خط نوشت، به آن معادله رگرسیون خطی می گویند
رگرسیونRegression
Y: مدل سازی متغیر وابسته
ویژگی شیمیایی•فعالیت بیولوژیکی•
X: توسط متغیرهای پیشگویی کننده
ترکیب شیمیایی•ساختار شیمیایی•
غیدر یدا مت. نامیدده مدی شدود( متغیر وابسدته) از سایر متغیرهاست متغیر پاسخ ( Y)در رگرسیون یک متغیر که تاثیر پذیر.نامیده می شود( متغیر مستقل) متغیر توضیحی ( X)متغیرهایی که بر متغیر پاسخ اثر می گذارند
Y =α+βX+ɛ
خطای تصادفی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
رگرسیون خطی و غیرخطی
بودن از نظر متغیرهاخطی•
بودن از نظر پارامترهاخطی•
121 χββy
12121 χβχββy
3
121 χββy
خطی
غیر خطی
غیر خطیخطی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
رگرسیون خطی چندگانه
y = b1 x1 + b2 x2 + … + bp xp
x11
…
x21
xn1
x12
x22
xn2
…
……
…
…
x1p
x2p
xnp
…
b1
b2
bp
…
y1
y2
yn
…
= y = X b
= y
n
1
X
n
pb
1
p
y
b = X+ y
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
= y1
n
1
X
n
p 1
p
b1y3
n
1
y2
n
1 1
p
b2
1
p
b3
=Y
n
m
X
n
p
B
p
m
Y= X B B= (XTX) -1XT Y
رگرسیون خطی چندگانه با چند متغیر وابسته
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
b = (ATA)-1 AT c
cTun= aT
un b
= c
n
1
A
n
p 1
p
b
حداقل مربعات معکوس
.تعداد استانداردهای کالیبراسیون باید حداقل برابر با تعداد طول موج ها باشد
:مرحله ی کالیبراسیون
:مرحله ی پیش بینی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
:مزیتراسدیون حودور الزم نیست که تمام گونه های شیمیایی شناخته شده باشند، اما باید گونده های مدزاحم در نمونده های کالیب
.داشته باشند
:عیبنمونه های کالیبراسیون باید به بزرگی تعداد طول موج ها باشند.
حداقل مربعات معکوس
استفاده از روش های انتخابمتغیر
(variable selection)
همبستگی خطی بین اندازه گیری های ثبت شده در طول موج های مختلف.منجر به نتایجی با صحت کمتر می شود
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
رگرسیون اجزای اصلی
Principal Component Regression
(PCR)
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
PCR
ComponentRegression
Principal
رگرسیون اجزای اصلی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
تفکیک مقادیر منفرد ُSingular Value Decomposition (SVD)
:انجام تفکیک مقادیر منفرد بر روی یک ماتریس سه ماتریس را نتیجه میدهد Sماتریس قطری مقادیر منفرد
Vو Uماتریسهای حاوی بردارهای ارتونرمال
X = U S VT UTU = VTV =I
=A
m
n
U
m
n
S
n
n
VT
n
n
Sc (Score)
L (loading)
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
A= C S = Sc L
CS
=L
=
= c
n
1
A
n
p 1
p
b= c
n
1 1
p
bScL
رگرسیون اجزای اصلی
Principal Component Regression (PCR)
A Sc
n
pn.pc
n.pc
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
b = VTS-1 UT c
cx = ax b
رگرسیون اجزای اصلی
:مرحله ی کالیبراسیون
:مرحله ی پیش بینی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
σP=∑ lii=1
p
∑ lii=1
n × 100
ارزیابی
Validation
چه تعداد اجزای اصلی(PC )باید حفظ شود؟
درصد واریانس توصیف شده* (Percentage of explained variance)
واریانس توصیف خواهد % 100در مدل استفاده شود، ( PC)اگر تمام اجزای اصلی .شد
واریانس توصیف شده ←σ
مقدار منفرد←λ
تعداد اجزای اصلی(PC )انتخاب شده←P=2,3,…,n
تعداد اجزای اصلی(PC )←n
s11
s22…
1e-3
1e-8
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
تعیین تعداد اجزا
s11
s22
…
1e-3
نویزدار
1e-8
n. PC2
پایین برازشUnder fit
باال برازشOverfit
فرادرسخطای سیستماتیکبرازش نویز
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
A
ارزیابی متقاطعCross Validation
کالیبراسیون
(PC)تعداد اجزای اصلی
2
3
…
ssq1
ssq2
C
CCalibc.
Pred.
محاسبهضریب کالیبراسیون
“b”
cx = apred. b
r=cx - cpred.
b
b
b
b
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
ارزیابی متقاطع
PRESS
n. PC2
باال برازشOverfit
Predictive
REsidual
Sum of
SquaresPRESS1
2
3
…
2
3
…
ssq’’1
ssq’’2
ssq’1
ssq’2
PRESSnPRESS2
2 3 … n
ssq1
ssq’1
ssq”1
…
ssq2
ssq’2
ssq’’2
… …
…
…
…
ssq’n
ssqn
ssq’’n
…
…
PRESS
CCPred.
Pred.
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
:مزایا
داده های نویز دار
داده هایی که دارای بستگی خطی(colinearity )بین متغیرهایشان هستند
داده هایی که تعداد نمونه ها کمتر از متغیرهای ستون ها است
کامل نبودن داده هایA وC
A
m
nm < n
A
m
nبین متغیرها colinearity
رگرسیون اجزای اصلی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
PLS
LeastSquares
Partial
حداقل مربعات جزئی
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
A = T P’ + E
C = T Q’ + E’
C = AWT(WTP’)-1 Q’ + E’ ضرایب رگرسیون((b
تئوری حداقل مربعات جزئی
1
2
رابطه بینCو Aدو ماتریس
ساختار از هر Cو Aدو ماتریس
PLS یک تعمیم ازMLRاست!
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
b = AWT(WTP’)-1 Q’
cx = ax b
:مرحله ی کالیبراسیون
:مرحله ی پیش بینی
حداقل مربعات جزئی
[XL,YL,XS,YS,BETA,PCTVAR,MSE,stats] = plsregress (X,Y,ncomp,...)
:دستور متلب
اسبهالگوریتم تکرارپذیر منجر به محW, P’, Q’, T
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
!!PLSتعداد اجزای
:اگر مناسب باشد•باال برازش
Overfitting
پایین برازشUnderfitting
توان پیش بینی خوبPrediction
ارزیابی متقاطعCross Validation
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
RR
RegressionRidge
ریدج رگرسیون
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
b = X+y
yTun= xT
un b
= y
n
1
X
n
p 1
p
b
:مرحله ی کالیبراسیون
:مرحله ی پیش بینی
b = ridge(y,X,k,scaled)
:دستور متلب
ریدج رگرسیون
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
:ارائه شده( ill-conditioned)که برای آنالیز داده های نامناسب MLRروش تغییر یافته از
ریدج رگرسیون
Ridge Regression (RR)
ضرایب رگرسیون محاسبه شده از این روش صحیح تر از ضرایب محاسبه شده توسط روشMLRاست .
در این الگوریتمRR مقدار بهینهϴمی تواند از روش ارزیابی متقاطع حاصل شود.
X + = (XTX)-1 XTفرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
نمونه ها
Samples
نمونه های کالیبراسیونCalibration set
نمونه های ارزیابیValidation set
نمونه های ارزیابی داخلی(ی شوداز نمونه های کالیبراسیون استفاده م)فرادرسنمونه های ارزیابی خارجی
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
پیش پردازش داده ها
Data preprocessing
(Auto scaling)خود مقیاس گذاری
(Mean centering)میانگین مرکزی
(xi /SD)
(xi – xaver)
وزن بیشتر برای متغیرهای با اطالعات مفیدتر: مقیاس گذاری
اطالعاتی در مورد اهمیت متغیرها وجود ندارد.
وزن های یکسانی برای متغیرهایX
.در نظر گرفته شده است
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
دل را برای مقایسه توانایی پیش بینی مدل های حاصل از روش های مختلف می تدوان انحدراف از بدرازش مد.توسط پارامترهای زیر محاسبه کرد
مقایسه روش های کالیبراسیون
Root-
Mean-
Square
Error of
Calibration
یا
RMSEP خطددا بددرای نموندده هایی محاسددبهی می شود که در ساخت مدل یا ارزیاب
.متقاطع به کار نمی روندPrediction
فرادرس
FaraDars.orgمجموعه آموزش های کاربرد متلب در شیمی
faradars.org/fvch9304
ر مجموعه آموزش های کاربرد متلب د»این اسالید ها بر مبنای نکات مطرح شده در مجموعه فرادرس های
.تهیه شده است« شیمی
.برای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایید
faradars.org/fvch9304