HA thAng phát hiAn khuôn mAt dAa trên mAng neural và phuong pháp vân vùng màu da
Transcript of HA thAng phát hiAn khuôn mAt dAa trên mAng neural và phuong pháp vân vùng màu da
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
1/122
TM TT
Pht hin khun mt l mt vn c bn trong ngnh hc quan st bng
my tnh. L mt trong nhng giai on ca h thng nhn dng mt ngi cng
vi nhiu ng dng rng ri v ph bin khc nh ch s ha ni dung trong
nh, h thng gim st, hi tho truyn hnh, pht hin khun mt v ang
dnh c s quan tm nghin cu ca nhiu ngi trong sut hai thp k qua.
Tuy nhin, vi nhng thch thc rt ln gy ra do tnh bin ng ca mi trng
cng nh tnh bin i cao ca khun mt, pht hin mt ngi vn ang l mt
trong nhng vn m i vi cc nh nghin cu. V cho n nay vn cha c
mt phng php no thc s gii quyt ht cc thch thc ca pht hin khunmt. Nhiu ci tin, nhiu xut c a ra nhm ci thin cht lng pht
hin khun mt. V mt trong nhng ci tin l da trn nhng c im bt
bin hoc c s bin ng c th phn vng c ca khun mt m mu da ca
con ngi chnh l mt trong nhng c im .
Xut pht t tng kt hp gia mu da v mt phng php pht hin
khun mt hiu qu, n tp trung xy dng mt h thng kt hp gia hthng pht hin khun mt da trn mng neural v phng php phn vng
mu da da trn m hnh mu da c tham s s dng phn ph Gaussian.
H thng pht hin c xy dng v c bn c nguyn tc hot ng
theo m hnh mng neural kinh in. l m hnh mng neural Perceptron a
lp, s dng thut ton lan truyn nguc v phng php gim gradient hc
mng. V c bn kin trc mng neural xy dng khng c g thay i, tuy
nhin, y chng ta s ci tin kin trc mt im vi vic s dng thm m
hnh xc sut da trn l thuyt Bayes c th c s mm do hn trong vic
nh gi kt qu cui cng ca mng. Ngoi ra, n cng nu ra mt chin
thut hun luyn hp l, cho php hun luyn nhanh m vn m bo c tnh
1
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
2/122
tng qut v hiu qu ca mng. l chin thut hun luyn mng ch ng c
hc.
Phng php phn vng mu da c kt hp vo h thng nh l mt
gii hn cho php gim khng gian tm kim, tc l khun mt s ch c tm
kim trn cc vng mu da. Vic phn vng ny gip cho thi gian pht hin
ca h thng ci thin ng k, hn na n cn gip cho h thng hot ng hiu
qu hn.
gip cho kt qu pht hin c r rng v cht lng, n cng
nu ra cc heuristic c th ph hp cho h thng, Nhng heursitic ny da trn
kt qu thc t cng nh thng k ca qu trnh hun luyn v kim th h
thng. n vi tn gi l H thng pht hin khun mt da trn mng
neural v phng php vn vng mu dac b cc lm nm mc chnh.
Chng I: Gii thiu L chng gii thiu, bao gm ba phn nh.
Phn u l tng quan cc hng tip cn, cc phng php pht hin mt ngi
c xut. Phn hai l tng quan cc phng php phn vng mu da datrn tnh cht im nh. Qua phn ny vi nhng nh gi cc phng php s
gip chng ta chn c phng php phn vng ph hp cho h thng. Phn
ba s l c s l thuyt c bn nht v mng neural MPL v thut ton lan truyn
ngc. y l kin trc mng v thut ton s c s dng cho h thng mng
neural ca n.
Chng II:Tng th hot ng ca h thng v vn chun b c s
d liu y l chng miu t m hnh thut ton hot ng tng th nht ca
h thng s c xy dng. ng thi s cp vn chun b v tin x l
cho cc tp c s d liu oc dng hun luyn mng neural cng nh luyn
tp phn vng mu da. y l mt trong nhng cng vic quan trng quyt nh
n cht lng ca h thng.
2
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
3/122
Chng III: Pht hin khun mt da trn mng neural v phng
php phn vng mu da y l chng quan trng nht ca n. N s
miu t y kin trc h thng c xy dng. Thut ton v phng php
hun luyn mng neural. Thut ton v phng php hun luyn phn vng mu
da. V s xut ra nhng heuristic gip ci thin cht lng pht hin v thi
gian chy ca h thng.
Chng IV: Phn tch thit k v ci t chng trnh
Chong V:Kho st thc nghim v nh gi chng trnh y l
chng s miu t kt qu vic kim th chng trnh da trn b test chun v
b test t to. ng thi s c nhng nh gi v nhn xt v kt qu ca
chng trnh.Kt lun v hng pht trin
Trong phm vi bi n, vi vic h thng c xy dng trn mt mng
neural n l, v vy em tin hnh hun luyn cho mng nhn bit nhng
khun mt vi t th nhn thng (frontal), c nghing v gc quay khng
ng k. Cc khun mt c th c nhiu trng thi khc nhau. Cc nh cdng kim th bao gm c nh chn dung v nh tp th. nh khng v c
nhiu (t thm) kim tra thm v tnh hiu qu ca h thng. Cc nh c
kim th c kch thc bao gm 240 x 180, 320 x 240, 480 x 360 im nh.
Vi b test bao gm 300 nh chn dung kch thc 320 x 240; 320 nh
ny oc thm nhiu, 320 nh ny c thu nh li kch thc 240 x 180
kim tra h thng c th pht hin cc khun mt c kch thc khc nhau, 320
nh ny c thm nhiu.
Ngoi tp nh chn dung chun ra, chng trnh cn test vi 100 nh tp
th t to vi nhiu mc ch khc nhau. 100 nh ny cng c thm nhiu
tin hnh kim th.
3
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
4/122
CHNG I: GII THIU
1. Tng quan v cc phng php pht hin mt ngi
1.1 Pht hin mt ngi v ng dng
Nhn bit i tng ni chung v nhn bit mt ngi ni ring l bi
ton c bn v quan trng trong lnh vc quan st bng my tnh. Nhn bit mt
ngui thu ht s tp trung nghin cu ca nhiu nh nghin cu trong sut nhiu
thp k qua. Tuy nhin vn cha c mt hng tip cn no thc s trn vn
mang li hiu qu v gii quyt ht cc thch thc v tnh hung trong vn pht hin mt ngi, nguyn nhn l do tnh bin i cao ca khun mt con
ngi. Chnh v vy, y vn l vn m v tip tc thu ht s nghin cu su
hn vi cc k thut mi c xut. Cc k thut c p dng c th chia
thnh mt trong hai tip cn: so snh s ph hp vi cc m hnh hnh hc hai,
ba chiu vo nh, hay phng php so snh s ph hp cc m hnh khung nhn
vo nh c cha khun mt cn nhn bit. Cc nghin cu trc y cho thyrng cc hng php da trn khung nhn c th nhn bit cc khun mt thng
trong nn phc tp mt cch hiu qu.
Vi mc ch tn dng nhng u im ca cc k thut uc xut,
kt hp chng li c th xy dng uc mt h thng pht hin mt ngi
mt cch hiu qu. n tp trung vo vn pht hin mt ngi trong nh
mu tnh, nhm kt hp nhng c trng ca mt ngi trong nh mu c th l
s dng k thut phn vng mu da ngi trong nh mu kt hp vi hng tip
cn da trn khung nhn vi mc ch s dng mng neural nhn to - mt
phng php tuy kinh in nhng vn rt m v cha ng nhiu u im trong
vn nhn dng, xy dng h thng pht hin mt ngi.
4
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
5/122
K thut phn vng da ngui trong nh mu c p dng trong h thng
nhn bit mt ngi vi mc ch cui cng l gim khng gian tm kim mt
ngi trong nh, gip cho hiu nng hot ng ca h thng c nng cao hn.
Cn u im ni bt ca mng neural nhn to ni ring v phng tip cn da
trn my hc ni chung trong vic pht hin mt ngui l c th miu t v
pht hin khun mt trong nhiu tnh hung khc nhau. Nhng tnh hung gp
phi khi pht hin khun mt bao gm:
T th ca khun mt (Pose): Khun mt l nghn thng (frontal),
nghing mt phn (partial profile) hay nghing hon ton (full profile).
Khun mt hng thng ng (upright) hay l khun mt xoay mt gc
no (rotate) Ni dung khun mt: Khun mt cha y cc c trng nh mt,
mi, ming, tai hay thiu mt vi c trng no .
Trng thi ca khun mt: chnh l trng thi tnh cm ca khun
mt nh cui, khc, tc gin
y l nhng tnh hung m cc hng tip cn khc phi mt nhiu cng
sc v phc tp c th miu t c. Nhng vi mng neural, thng qua tpmu v qu trnh hun luyn mng hiu qu, kt qu mang li l c th rt kh
quan.
ng dng
Cng ngh nhn bit mt ngi c s ng dng rng ri trong thc t.
Trong nhn dng sinh trc hc, trong hi tho truyn hnh, trong ch s ho nh
v c s d liu video, trong tng tc ngi my. Nhn bit mt ngi l giai
on u trong h thng nhn dng mt ngi.
Hai bi ton nhn bit v nhn dng i tng c lin quan mt thit. H
thng nhn dng i tng c th xy dng m khng c tp b nhn bit i
tng, mi b nhn bit pht hin mt i tng quan tm. Tng t, b nhn
5
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
6/122
bit i tng c th c xy dng m khng c h thng nhn dng i tng;
b nhn dng i tng ny cn phn bit i tng mong mun vi mi i
tng khc c th xut hin hay l lp i tng cha bit. Do hai bi ton l
nh nhau, d trong thc hnh hu ht cc h thng nhn dng i tng t khi
gii quyt nn tu , v cc h thng nhn bit i tng t khi c hun luyn
trn loi i tng xy dng h thng nhn dng. im ch trng khc
nhau ca cc bi ton ny dn n cc trnh by v thut ton khc nhau.
Thng thng, cc h thng nhn dng khun mt lm vic bng cch
trc ht p dng b nhn bit khun mt nh v khun mt, sau p dng
thut ton nhn dng nhn din khun mt.
1.2 Cc thch thc trong vn pht hin mt ngi
Vic nhn bit i tng l bi ton xc nh ca s con ca nh c thuc
v tp cc nh ca i tng quan tm hay khng. Do , ng bin quyt nh
ca tp nh i tng phc tp s lm tng kh ca bi ton v c th tng s
li nhn bit. Gi s ta mun pht hin khun mt nghing trong mt phng nh,
ngoi cc khun mt thng. Vic thm cc khun mt nghing vo tp cc nh tamun nhn bit lm tng bin thin ca tp, v c th lm tng phc tp
ca ng bin quyt nh ca tp nh. phc tp ny lm bi ton nhn bit
kh hn. Vic thm nh mi vo tp nh i tng c th lm ng bin quyt
nh n gin hn v d hc hn. C th tng tng iu ny l ng bin
quyt nh c lm trn bng vic thm cc nh vo tp. C nhiu ngun bin
i trong bi ton nhn bit i tng, v c th trong bi ton nhn bit khun
mt. C cc ngun bin i sau [6]:
Bin i trong mt phng nh: loi bin i nh khun mt n gin
nht c th c biu din c lp vi khun mt, bng cch quay, dch
chuyn, bin i t l v ly i xng nh.
6
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
7/122
Bin i sng v ng cnh: bin i do i tng v mi trng gy
ra, c th cc thuc tnh b mt ca i tng v cc ngun sng. Cc thay
i v ngun sng ni ring c th bin i hon ton v b ngoi ca
khun mt.
Bin i nn: Nhiu nh nghin cu cho rng vi k thut nhn dng mu
hin nay, tip cn da trn khung nhn nhn bit i tng ch thch
hp cho cc i tng c ng bin nh c th d on c. Khi i
tng c hnh dng d on c, ta c th trch ra window ch cha cc
pixel bn trong i tng, v b qua nn.
Bin i hnh dng: vi khun mt, loi bin i ny bao gm biu l
tnh cm khun mt, ming v mt m hay ng, v hnh dng khun mtca tng ngi.
1.3 Cc vn lin quan n pht hin mt ngi
Bn cnh vn pht hin mt ngi, c nhiu vn khc c quan hmt thit vi pht hin mt ngi m nhiu khi gy ra nhm ln nu khng c
tm hiu mt cch k cng.
Nhng vn bao gm [7]
nh v khun mt hay xc nh v tr khun mt: y l vn rt
gn vi vn pht hin mt ngi. Nu nh pht hin mt ngi trong
nh l phi tr li cc cu hi c tn ti khun mt trong nh hay khng ?
Nu tn ti th tn ti bao nhiu khun mt? V tr ca khun mt u ?
Th vn nh v mt ngi ch tr li cho cu hi v tr mt ngi u
trong mt nh bit trc l c mt mt ngi . Nh vy c th thy,
nh v khun mt l mt phn cng vic ca pht hin mt ngi.
7
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
8/122
Pht hin cc c trng ca khun mt: y l vn cng rt gn vi
vn nh v khun mt. N cng gi thit rng ch c mt khun mt
trong nh. V vic pht hin c trng khun mt l tm ra v tr ca cc
c trng nh i mt, mi, ming, mi, tai
Bm st khun mt: Mc ch ca vn ny l c lng lin tc s
thay i v v tr v hung ca khun mt trong mt chui nh thi gian
thc.
Nhn bit trng thi khun mt: Mc tiu ca vn ny l nhn bit
trng thi ca khun mt con ngi (hnh phc, tc gin, au kh). y
l vn rt kh v th v v trng thi khun mt ca tng ngi c th l
rt khc nhau trong cng mt trng thi tm l. Nhn dng khun mt: Trong vn ny, chng ta phi i snh khun
mt cn nhn dng vi cc khun mt c sn trong th vin v tm ra
nhng thng tin cn thit v khun mt cn nhn dng nu n c c trng
tng ng vi khun mt no trong th vin.
Thm tra v xc minh khun mt: y l vn nm trong vn nhn
dng khun mt. Thng thng sau khi nhn dng khun mt, ngi taphi tin hnh mt giai on na gi l thm tra v xc minh tnh ng
n ca khun mt c nhn dng. N cho php tng s ng n ca
vn nhn dng khun mt.
Trong nhng vn nu trn, c th thy nhn bit khun mt v nhn
dng khun mt l hai vn c bn v c th cha ng cc vn cn li. V
thng thng, nhn bit khun mt s l giai on u ca h thng nhn dng
khun mt. S khc nhau c bn gia pht hin khun mt vi nhn dng khun
mt l: Nu nh nhn dng khun mt l phn bit nhng khun mt khc
nhau trong tp danh mc cc khun mt, cn nhn bit khun mt l phn lp
uc u l danh mc cc khun mt v u l danh mc cc nh khng phi
khun mt.
8
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
9/122
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
10/122
10
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
11/122
Hnh 1: S cc hng tip cn v phng php pht hin mt
ngi
1.4.1 Hng tip cn da trn c trng ca nh (Feature-based
approaches)
Phng php tip cn da trn c trng ca khun mt c chia thnh
ba vn . Gi s cn phi pht hin mt khun mt trong mt nn nh ln xn,
phn tch mc thp (low-level analysis) thc hin phn on cc c trng ca
nh da trn nhng thuc tnh ca im nh nh xm hay mu sc. S phn
on lc ny cn mp m v cha r rng. Vn th hai l phn tch c trng,
cc c trng ca nh c t chc thnh cc c trng khun mt c tnh tng
qut hn da trn c tnh hnh hc ca khun mt. Sau giai on ny, tnh mpm ca cc c trng ca nh c gim bt, ng thi, v tr khun mt
cng vi cc c trng khun mt c xc nh. Tip theo s l vic s dng
m hnh hnh dng (active shape models). Nhng m hnh ny bao gm t m
hnh dng rn (snakes - c xut vo nhng nm 80) cho ti m hnh phn
tn im (PDM Point Distributed Model) c xut vo nhng nm gn
y trch chn c trng c s bin ng phc tp nh mt, mi,
1.4.1.1 Phn tch mc thp (Low-level analysis)
Ngi ta gi l phn tch mc thp v vic phn tch y l phn tch da
trn cc c trng rt c bn v mang tnh trc quan, nhng c trng bao
gm bin nh, thng tin a mc xm, mu sc, chuyn ng, tnh i xng ca
khun mt.
1.4.1.1.1 Bin nh (Edges)
y l mt c trng c bn nht trong cc ng dng v x l nh, s
dng bin pht hin khun mt c thc hin u tin bi Sakai. Da trn
vic phn tch cc ng nh ca khun mt, vi mc ch l nh v nhng c
11
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
12/122
im trn khun mt. Mt m hnh c xut tm ra nhng ng nt ca
mt ngi. Cng vic tm ra hnh dng ca mt ngi c trin khai bao gm
mt ng cong bm st vo khun mt vi mt cong xc nh v rng buc
trnh s nh hng ca cc nhiu bin. Nhng c tnh ca ng trong hnh
dng ca u ngi sau c a ra phn tch c trng s dng nt v
v tr ca khun mt. K thut d tm da vo ng bin ny cn c p dng
pht hin cp knh trn khun mt.
Trong hng tip cn pht hin mt ngi da vo ng bin, nhng
ng bin cn c gn nhn v c ph hp vi m hnh khun mt c
sp xp c th gip chng ta xc minh s ng n ca vic pht hin .
Ngi ta c th thit lp s gn nhn bin bng cc s dng mt tri, ngtc hoc mt phi ca khun mt. Vic gn nhn ny lm cho kh nng pht hin
chnh xc khun mt trong mt bc nh vi khng gian phc tp v c nhiu
khun mt.
Mt trong nhng phng php c bit n l phng php gn nhn
ca Govindaraju, phng php ny s dng h s vng ca khun mt l tng ,
l h s gia di v rng ca khun mt:
(I.1)
S dng phng php ny, ngi ta kim th 60 nh c nn phc tp
bao gm 90 khun mt th thy kh nng h thng c th pht hin chnh xc l
76% vi mc trung bnh l sai 2 mt li / nh.
1.4.1.1.2 Thng tin a mc xm (Grayscale Information)
Bn cnh ng bin, th thng tin v mc xm trong khun mt cng c
th c xem nh l mt c trng. Nhng c trng khun mt nh l lng
my, ng t hay, mi thng xut hin vi mc xm ln hn nhng thnh phn
12
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
13/122
ph cn bao quanh chng. Tnh cht ny c th c khai thc phn bit cc
thnh phn khc nhau ca khun mt. Nhng thut ton trch chn c trng
khun mt gn y thng da vo mc xm nh nht trong mt vng khun
mt. Trong nhng thut ton ny, bc nh u vo u tin c ci thin bng
vic lm tng tng phn v bin hnh mc xm (gray-scale morphological)
c th tng ti ca nhng vng ni trn, t vic nhn bit s d dng
hn. Nhng vng ti ny c trch chn bng php ly ngng di. Bn cnh
, ngi ta tin hnh xy dng h thng t ng tm kim cc vng ti thuc
mt thng qua s phn tch v mu sc. H thng s dng mt mu mt gn
trng s xc nh cac v tr c th c ca cp mt.
1.4.1.1.3 Mu (color)
Trong khi thng tin v mc xm c xem l mt c trng c bn ca
nh, mu sc c ngha nhiu trong vic nhn bit s xut hin ca i tng.
Mt trong nhng khng gian mu c bit n rng ri nht l khng gian
RGB, l khng gian m mi mu c nh ngha bi s kt hp ca ba
thnh phn mu l Red, Green v Blue. Do s thanh i ch yu trong musc ca da l do s thay i v chi, thng thng cc mu RGB c coi
trng hn, do , nh hng ca chi c th c lc b. Ngi ta c th
chun ha cc thnh phn mu t RGB thnh rgb nh sau:
(I.2)
13
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
14/122
T h thc trn chng ta c th thy rng r+g+b = 1. Vic chun ha mu
ny c ngha l, ch cn vit hai trong s ba gi tr trn l chng ta c th tm ra
gi tr cn li. Trong vic phn tch mu sc ca da, mt biu mu da vo r
v g ch ra rng mu ca khun mt tp trung thnh mt cm nh trong biu
mc xm. so snh thng tin mu ca mt pixel vi gi tr ca r v g trong
cm trn, v t to ra kh nng cc pixel thuc vng da ca mt c th c
tm ra.
Bn cnh m hnh RGB, chng ta cn c mt vi m hnh mu khc c
s dng trong vic nghin cu vn nhn dng mt ngi. M hnh HIS l mt
v d, m hnh ny c nhng u im so vi cc m hnh khc trong vic mang
li s phn bit r rng gia cc cm mu ca cc c trng khun mt. Do m hnh ny thng c s dng cho cng vic trch chn c trng ca khun
mt nh mi, mt, lng my. Do vic ny c quan h cht ch vi vic cm th
mu sc con ngi, n cng c s dng ph bin trong cc s phn vng
khun mt.
Mt m hnh khc c bit n trong vic p dng nhn dng khun
mt l m hnh YIQ. chuyn i t khng gian mu RGB sang khng gianYIQ, chng ta thy c thnh phn I, l khong mu t cam (orange) -> xanh
l (Cyan), ging nh khong mu ca da ngi chu . Vic chuyn i ny
cng nh hng ti vic trit tiu nn cc mu khc v cho php nhn bit nhng
khun mt nh trong mt mi trng t nhin. Cc m hnh mu khc cng
c p dng cho vic nhn bit mt ngi cn c HSV, YES, YCrCb, YUV,
CIE-xyz, L*u*v, CSN v UCS(Farnsworth).
Vic phn vng mu c th c thc hin bng vic s dng cc ngng
xp x mu khi mu da c m hnh ha thng qua biu mc xm. Phng
php phc tp hn l s dng phng php tnh ton thng k, s thay i
khun mt ca m hnh l trong mt ph rng. Ngi ta tin hnh s dng
phn phi Gaussian tp hp hng ngn mu mu ca da t cc loi khc nhau.
14
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
15/122
Phn phi Gaussian c c trng bi vector trung bnh v ma trn hip
phng sai . Mu ca im nh t nh u vo c th c so snh vi mu
da ca m hnh bng cch tnh h s khong cch Mahalanobis. H s ny s cho
bit tng ng ca mu pixel vi mu da ca m hnh.
Mt u im ca m hnh mu da vo phng php thng k l s sai
khc v mu ca nhng i tng mi c th c ph hp vo m hnh bng
phng php hun luyn. S dng phng php ny, s nhn bit mu c th s
hiu qu hn, chng li s thay i ca cc nhn t mi trng nh l iu kin
chiu sng v c tnh ring ca my nh.
1.4.1.1.4 Chuyn ngNu nh chng ta pht hin khun mt cho video, khi thng tin v s
chuyn ng, c ch, dng iu c ngha rt ln trong vic xc nh i tng
chuyn ng. Cc chuyn ng lin tc k nhau c phn chia bng vic phn
tch cc frame khc nhau. Hng tip cn ny, ni chng l kh n gin, c
h tr phn bit mt chuyn ng cn cnh v c hiu qu khng ph thuc
iu kin ni dung bi cnh. Bn cnh vng mt, ngi ta cn tin hnh thchin trn nhiu frame khc nhau nh v cc c trng ca khun mt. Nh l
trng thi ca i mt bng cch tnh ton ln v chiu ngang v chiu dc
gia nhng vng lin tip nhn c trong cc frame khc nhau.
Mt cch khc c th tnh ton cc chuyn ng trc quan l thng
qua vic c lng s chuyn ng ca cc ng vin ca nh. So snh cc
frame khc nhau, kt qu c c t s chuyn ng ca cc ng vin l c
th tin cy, c bit l khi chuyn ng l khng quan trng. Mt b lc
Gaussian c tnh khng gian v thi gian c s dng bi h thng McKenna
pht hin chuyn ng ca vng bao khun mt cng nh vng bao ton b
c th con ngi. Tin trnh ny yu cu gi tr mc xm ca nh I(x,y) vi mt
15
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
16/122
ton t bin ph thc thi gian m(x,y,t) c nh ngha t b lc Gaussian
G(x,y,t) nh sau:
(I.3)
Trong u l h s thi gian, a l rng b lc. Ton t bin ph thuc
thi gian sau c nhn chp vi cc frame ca nh theo bi cng thc:
(I.4)
Kt qu ca tin trnh x l min thi gian ny S(x,y,t) s cho ta mt ch
s trc tip ca s chuyn ng bin trong I(x,y,t).
Mc d phng php ny miu t vic nhn bit bin v vng chuyn
ng, nhng chng cng cho php chng ta tin vo s chnh xc ca vic clng tc ca chuyn ng lung sng hay cn gi l lung quang (optical
flow). Bi v vic c lg ny da trn cc mu chuyn ng trong mt khong
ngn, v c cm gic nh chuyn ng l rt trn v mn. Da vo thng tin
ca chuyn ng, khun mt chuyn ng trong nh tun t c phn vng.
Lung quang c m hnh bi lung nh vi phng trnh rng buc sau y:
(I.5)
Trong , Ix, Iy v It l cc o hm min thi gian ca cng nh v
Vx v Vy l tc chuyn nh. gii phng trnh trn cho Vx, Vy, mt vng
bao gm cc im nh chuyn ng theo mt qu o c ghi nhn. Nhng
16
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
17/122
vng p ng ti nhng qu o chuyn ng khc nhau c phn lp trong
vng chuyn ng v vng khng chuyn ng.
1.4.1.1.5 Tiu chun suy rng (Generalized Measure)
Nhng c trng trc quan nh ng bin, mu sc hay chuyn ng l
giai on u tin trong h thng quan trc con ngi. Qu trnh ny cho php
nhng thng tin trc quan c t chc li thnh nhng nhm hot ng mc
cao. Da vo vic quan st, Reisfeld xut rng mt h thng quan st bng
my nn c bt u vi vic tnh ton mc thp giai on tin tp trng cc
tnh cht nh c tng hp. Ban u, Reisfeld v Yeshurun gii thiu mt
ton t i xng tng qut da v ton t im bin. Do nhng c trng cakhun mt c tnh i xng mt cch t nhin. Khi thc hin, ton t i xng
ny s tnh ton v gn cho mi im nh mt cng gi l cng im
nh da trn mc nh hng ca vng bao im d. Cng i xng ,
M(p), cho mi im nh c xc nh bng:
(I.6)
Trong , C(i,j) l mc nh hng ca vng bin im i,j (ca pixel)
trong tp cc pixel c nh ngha bi (p). N c xc nh theo cng thc:
(I.7)
Trong , D(i,j) l hm h s di, P(i,j) l hm h s phase, ri v rj c
xc nh theo cng thc di y:
17
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
18/122
(I.8)
Trong pk ch im (xk, yk) vi k = 1K, l gradient ca cng ti im pk,ij l gc theo chiu ngc kim ng h gia ng thng qua pi v
pj so vi mt ngang. Hnh di y miu t mt v d v cch tnh M (p) t
gradient ca mtj trc nh mt ngi. Cng i xng c tham chiu mt
cch r rng th hin s nh v cc c trng ca khun mt nh l mt v
ming.
1.4.1.2 Phn tch c trng (Feature analysis)
Nhng c trng c to ra t qu trnh phn tch mc thp thc ra l
khng r rng. Qu vy, trong vic nh v vng mt s dng m hnh mu da,
cc i tng c cng mu nn tng t nh mu da c th cng c nhn bit.
iu ny c th c gii quyt bng vic phn tch mc cao. Trong nhiu k
thut nhn bit khun mt, nhng tch ly hiu bit hnh thi v khun mt s
c p dng c th c tnh ha v xc minh li nhng c trng t
nhng trng thi mp m. C hai hng tip cn trong ng dng v hnh thi
khunn mt. Hng tip cn u tin lin quan n chin lc truy tm c trng
da vo mi quan h v v tr da cc c trng. Nhng c trng c nhn
bit nh cc c trng tn ti. K thut th hai s dng k thut nhm c
18
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
19/122
trng thnh cc chm sao bng cch s dng mt s m hnh khun mt khc
nhau.
14.1.2.1 Tm kim c trng
Vic truy tm cc c trng ca khun mt l truy tm cc c trng ni
bt ca khun mt bng cch da vo hnh thi ca chng. Vic truy tm ny da
vo mi quan h da cc c trng v khong cch hnh hc, v tr trong
khun mt.
Nhiu thut ton, m hnh c xy dng cho cng vic ny. De Silva
l mt thut ton tiu biu. M hnh ca Jeng cng l h thng pht hin c
trng c bit n rng ri. Trong h thng ny, vic khi to s c xc nhbng vic nh v v tr ca i mt trong bc nh. T vic xc nh i mt, qu
trnh s truy tm cc c trng khc nh mi, ming v ng t. Mi c trng
sau khi truy tm u thit lp cc hm quan h vi cc c trng khc, iu ny
gip cho vic xc nh khun mt c th tin cy hn, cc hm quan h ny chnh
l cc h s c miu t nh trong ng thc di dy:
(I.9)
Bn cnh , nhiu h thng truy tm c trng cng c xut nh h
thng GAZE ca Herpers da vo s chuyn ng ca mt trong h thng trc
quan con ngi HVS. im ct yu ca h thng l thut ton nh v cc c
trng ni bt. Mt thut ton a mc s dng b lc a hng Gaussian.
1.4.1.2.2 Phn tch chm sao
Mt vi thut ton cp n trong phn trn c tin cy ph thuc vo
mc t ng n v thng tin c tm ra t cc tp m hnh nh mt vi di
nhng iu kin c nh. Nu nh khi iu kin khng cn tha mn, nh l
nh v khun mt trong mt bi cnh phc tp, nhiu thut ton c th khng
19
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
20/122
cn chnh xc. V vy vn t ra l lm th no chng ta c th nhm cc
c trng khun mt li thnh tng chm vi nhng tham s i din chung
nht, phn nh c ht cc trng hp xy ra ca cc c trng, bng vic s
dng phng php m hnh ha hiu qu nh l phng php phn tch thng
k.
Nhiu phng php nhm thnh cc chm sao c xut. Trong
ni bt l phng php s dng l thuyt nt thng k t b lc a cp
Gaussian. Mt m hnh thng k trong min khng gian ca cc c trng khun
mt cho php pht hin mt cch linh hot hn. Thut ton h tr vic qun l s
thiu ht c trng cng nh cho php s dng cc h s m rng. Mc thnh
cng ca m hnh ny l 84% khi nghin cu tp 150 bc nh. Vic pht hin saic xc nh l do h s ph thuc ca c trng u.
M hnh thng k cho nh c s xut hin nhiu khun mt cng c
xut, trong m hnh ny, cc khun mt c phn lp thnh tng nhm vi
nhng c trng chung nht. Nhng nhm ny li c phn lp tip trong cc
thnh phn c trng khun mt. Sau khi c trng ny nhn c t vic x l
mc thp. Vic nhm c trng ny c tc dng gim bt sai s c trng sinh rado nh hng ca bi cnh hn tp. Mt mng theo lut Bayesian s c h tr
kt hp vi vic pht hin ring cho tng nhm c trng c th chc chn
rng gi thuyt v s ng n ca khun mt c c s tin cy vi mc
cao.
H thng s dng phng php ny ni ting nht l h thng ca Maio v
Maltoni. Trong h thng ny nh u vo c chuyn i trc tip bng cch
s dng mt ton t gradient c ca s 7*7. T nh chuyn i trc tip ny,
ngi ta p dng hai giai on nhn bit khun mt. nh c nhn bit s c
khoanh vng trong mt hnh ellipse. H thng ca Maio v Maltoni l h thng
thi gian thc vi mc pht hin khi test l 69/70 bc nh m khng b mt
li no.
20
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
21/122
1.4.1.3 Cc m hnh hnh dng tch cc (Active shape models)
y l m hnh thi gian thc hiu qu v l thnh tu quan trng ca
hng tip cn da vo phn tch c trng. M hnh da vo tnh cht vt l
tht s v s xut hin mc cao ca cc c trng. M hnh ASM tng tc vi
cc c trng nh cc b (bin, sng) v dn dn lm bin dng nt ca
c trng . Co ba dng ca m hnh ASM ang c nghin cu. u tin l
m hnh s dng mt ng i kch hot (active contour) gi l snakes (dng
con rn). M hnh th hai l m hnh da vo cc dng mu bin i
(deformable templates) cho php thc hin hiu qu hn m hnh snakes. M
hnh th ba l m hnh Smart snakes (con rn hot thng minh) v PDM (mhnh phn b im). M hnh ny da trn tp cc im c gn nhn v ch
cho php bin i theo mt vi hnh dng da trn qu trnh hc.
1.4.1.3.1 M hnh dng con rn (Snake)
c s dng xc nh ng bao ca u. thc hin vic ny, mt
con rn ban u c khi to ti mt vng ln cn xung quanh vng bin u.Sau co dn v pha cc ng bin v a ra hnh dng gi nh ca vng
u. S tin ha ca con rn oc thc hin thng qua vic cc tiu ha mt
hm nng lng dng Esnake (tng t nh trong vt l) v c biu din nh
sau:
Esnake = Ebn trong + Ebn ngoi (I.10)
Trong Ebn trong v Ebn ngoi ln lt l cc hm nng lng bn trong v
bn ngoi. Nng lng bn trong l phn nng lng ph thuc v cc thuc tnh
bn cht ca con rn v to nn s tin ha t nhin ca ng bin ng. Cc
tin ha t nhin v in hnh ca con rn l s co ngn v s m rng. Trong
21
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
22/122
khi , nng lng bn ngoi c khuynh hng chng li nng lng bn trong
v lm cho cc ng bin ng sai lch so vi tin ha t nhin thm ch tha
nhn hnh dng ca cc c tnh gn nht l hnh dng ca vng u khi trng
thi cn bng.
Hai vn chnh cn quan tm trong vic p dng m hnh con rn l la
chn cch tnh nng lng chnh xc v k thut cc tiu ha hng lng. Nng
lng Elastic c s dng ph bin nh l nng lng bn trong. Khong cch
gia cc im iu khin trn ng bin ng c cn i v do em li
cho ng bin c tnh ging nh si dy cao su c th co hoc dn. Vn
nng lng bn ngoi c xem xt da vo kiu dng ca c trng nh c
xem xt. C th tnh nng lng ny theo cc thng s gradient. V theocchny, cc ng bin ng thng hi t v pha cc v tr bin. Bn cnh cc
thng s v gradient, m s cch tnh nng lng bn ngoi khc cn bao gm
c cc hm lin tc lin quan n mu da trong hp dn cc con rn v pha
cc vng mt.
Mc d phng php con rn mt cch tng qut c th xc nh oc cc
ng bao quanh cc vng c trng nhng vic trin khai phng php vn bcn tr bi hai vn . Th nht l cc phn ca con rn hay b by vo cc vng
c trng nh khng ng. Th hai l phng php con rn khng thc s hiu
qu trong xc nh cc c trng khng li (c trng xut hin ni bt) do xu
hng tin ti cc tiu cong ca con rn.
1.4.1.3.2 Dng mu c th bin i (Deformable templates)
Xc nh ng bao ca mt vng c trng khun mt khng phi l mt
vn d gii quyt bi v cc du hiu cc b ca cc ng bin mt kh c
th oc t chc thnh cc th th tng th nhn bit thng qua cc ng bin.
tng phn thp v sng xung quanh mt s vng c trng nh cng lm
cho qu trnh do tm bin kh thc hin. Yuille v cng s m rng khi nim
22
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
23/122
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
24/122
L mt m hnh m t tham s ha ti u ca hnh dng da trn phong
php thng k. Kin trc ca qu trnh so khp ca PDM khc vi cc m hnh
hnh dng ng khc. Cc ng bin ng ca PDM c ri rc ha thnh cc
tp im c nh nhn. S bin i ca cc tp im ny trc ht c tham
s ha thng qua cc tp mu hc.cha cc i tng c hnh dng v t th
khc nhau. S dng phng php phn tch thnh phn chnh PCA, s bin i
ca cc c trng trong tp mu hc c xy dng thnh mt m hnh linh
ng tuyn tnh. M hnh oc cu thnh t trung bnh ca tt c cc c trng
trong tp hp v m hnh c bn ca s bin i tng im nh:x = xtb + Pv
(I.12)
Trong , x biu din mt im trong PDM v xtb l c tnh trung bnhtrong tp mu i vi im , P = [p1, p2, , pt ] l ma trn cha t vector bin
i quan tng nht ca ma trn hip phng sai, cn v l vector trng s.
M hnh PDM u tin oc pht trin bi Lanitis v cng s. M hnh
minh ha dng v tng th ca khun mt bao gm c tnh nh lng my, mi,
mt. S dng 152 im iu khin c chn bng tay v 160 nh mt mu, mt
m hnh PDM c xy dng. Ch s dng 16 trng s, m hnh c th xp xc 95% cc hnh dng khun mt trong tp mu. so khp mt mhnhf
PDM vi mt mt, m hnh hnh dng trung bnh (vi im nh nhn l xtb) u
tin c t gn mt. Sau cc chin lc tm kim trn mc xm cc b
c s dng a tng im hng n im tng ng thuc ng bao.
Trong sut qu trnh bin i ny, hnh dng ch c php thay i theo mt
cch ph hp vi cc thng tin oc m hnh ha trong tp mu.
u im cua PDM l s dng m hnh khun mt vi cc tham s ti u.
c tnh tng th ca m hnh cng cho php tt c cc c trng c xc nh
song song vi nhau v do gim bt oc yu cu phi tm kim ln lt cc
c trng. Hn n, s thiu vng mt c trng no khng phil mt vn
24
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
25/122
nghim trng khi m n cc c trng khc trong m hnh vn c th t ti
mt gii php ti u ton th.
1.4.2 Hng tip cn da trn thng tin xut hin trong nh (Image-based
approach)
Hn ch ca hng tip cn da vo c trng ca hnh nh l kh
nng nhn bit nhiu khun mt trong mt bc nh c bi cnh phc tp l
khng cao cho d c nhiu n lc ci tin v nng cao cht lng d tm.
iu i hi mt phng php mi, mt hng tip cn mi gii quyt
vn ny. V hng tip cn da vo thng tin hnh nh l hng tip cn c
th p ng nhu cu .Hu ht cc phng php trong hng tip cn ny u s dng chung
mt k thut la k thut qut ca s hay cn gi l k thut qut khung nhn
nhn bit khun mt. Thut ton qut ca s s d tm trong nh u vo tt
c cc khun mt c th c trong nh. Kch thc ca ca s, h s ly mu,
kch thc ca bc qut phthuc vo mc ch ca phng php cng nh
hiu nng ca h thng.Nhn bit khun mt da vo thng tin hnh nh c chia lm ba hng
nghin cu con chnh l phng php khng gian con tuyn tnh, phng
php da vo mng neural v phng php thng k.
1.4.2.1. Phng php khng gian con tuyn tnh (Linear Subspace
Methods)
Hnh nh ca khun mt con ngi nm trn mt khng gian con ca ton
b khng gian hnh nh. th hin khng gian con ny, ngi ta c th s
dng phng php v thn kinh, tuy nhin vn c vi phng php c lin quan
cht ch hn vi phn tch thng k bin thin tiu chun ci m c th ng
dng c. Cc k thut trong phng php ny bao gm phn tch thnh phn
25
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
26/122
chnh (PCA principal component analysis), phn tch bit s tuyn tnh (LDA),
v phn tch h s (FA).
Vo cui nhng nm 80, Sirovich v Kirby pht trin mt k thut s dng
PCA th hin hi qu khun mt con ngi. a ra s ging nhau gia
nhiu hnh nh khun mt khc nhau, k thut ny u tin tm ra nhng thnh
phn c bn ca s phn b trn khun mt, th hin bng eigenvectors ca ma
trn cc bin ca b cc. Tng khun mt trong mt tp hp cc khun mt sau
c th tnh xp x bng s kt hp tuyn tnh gia nhng eigenvector ln
nht, c bit ti nh eigenfaces.
Turk v Pentland sau m rng k thut ny cho nhn dng khun
mt. Cch thc ca h khai thc tnh t nhin cn bn ca eigenfaces trn nhdng khun mt. Bi v s ti to khun mt bng cc thnh phn c bn ca n
ch l s gn ng, sai s cn d c nh ngha trong gii thut nh s o
lng s b ca mt. Sai s cn d ny cho ta du hiu tt ca s tn ta ca
khun mt thng qua quan st mc ti thiu chung trn bn khong cch.
Gn y hn, Moghaddam v Pentland pht trin xa hn k thut ny
trong phm vi xc sut. Khi s dng PCA nh dng, ngi ta thng b i phn b trc giao ca khng gian khun mt (nh cp trc ).
Moghaddam v Pentland phat hin ra rng iu ny dn ti gi thit khng gian
khun mt c mt khng i, do h m rng my d s ging nhau ti cc
i, dng c khng gian khun mt v phn b trc giao ca n x l mt
bt k. H ghi nhn t l nh dng l 95% trn tp hp ca 7000 hnh nh khun
mt khi nh dng mt tri. So snh vi my d DFFS th tt hn rt nhiu. Khi
d u ca 2000 hnh nh khun mt t d liu ca FERET, t l d l 97%.
Jebara v Pentland a k thut ny vo h thng truy tm khun mt ngi
da vo c mu sc, 3D v thng tin v chuyn ng. Mt cch tip cn tng t
l PCA c p dng cho tp hp khun mt v mu ging khun mt, cng vi
tiu chun la chn da vo t l ging nhau.
26
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
27/122
Samal v Iyengar a ra cch d khun mt PCA da trn hnh chiu
khun mt. Thay v khun mt eigen, h to ra hnh chiu eigen v kt hp vi
k thut x l hnh nh tiu chun. H ghi nhn t l d l 92% trn tp hp 129
hnh nh (66 hnh nh khun mt thc v 63 hnh nh thng thng), trong
khun mt chim hu ht hnh nh.
1.4.2.2 Phng php da vo mng Neural
Mng neural tr thnh mt k thut ph bin trong vn nhn dng
khun mt v tt nhin l trong c nhn bit khun mt. Mng neural ngy nay
c nhiu thay i so vi s khai n gin MLP ca n.
H thng d tm khun mt thc hin qua bn bc chnh [6]: c lng v tr: vic dng tip cn my hc, c th l mng neural, i
hi vic hun luyn mu. gim s lng bin i trong nh hun luyn
dng, nh c canh bin vi cc nh khc cc tiu ho cc bin i
v tr c trng khun mt. Khi thi hnh chng trnh, ta khng bit chnh
xc cc v tr c trng khun mt, do khng th dng chng nh v
cc ng vin khun mt tim nng. Thay vy, ta d tm ton din mi vtr v t l tm mi v tr ng vin. Cc ci tin d tm ton din lm
cho thut ton nhanh hn, vi t l d tm gim 10% n 30%.
Tin x l: gim cc bin i gy ra do chiu sng hay camera, nh
c tin x l vi cc thut ton chun nh cn bng lc ci thin
sng v tng phn trong nh.
D tm: Cc khun mt tim nng chun ho v v tr, t th, v
sng trong hai bc u tin c kho st xc nh chng c thc s
l khun mt hay khng. Quyt nh ny c thc hin bng mng
neural hun luyn vi nhiu nh mu khun mt v khng khun mt.
Quyt nh: Kt hp nhiu mng c c mt quyt nh khch quan
nht. Mi mng hc nhng iu khc nhau t d liu hun luyn, v a
27
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
28/122
ra cc li khc nhau. Cc quyt nh ca chng c th kt hp dng mt
s heuristic n gin, lm tng chnh xc d tm khun mt v ngn
chn li.
Hnh 2: H thng Rowley
28
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
29/122
Hnh 3: S lung x l cc bc chnh trong pht hin khun mt
29
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
30/122
S trn l thut ton d tm khun mt thng trong nh xm, bng cch
s dng mng noron. Thut ton thc hin bng cch p dng mt hay nhiu
mng neural trc tip vi cc phn ca nh u vo, v phn x cc kt qa ca
chng. Mi mng c hun luyn kt xut mt kt qu l c hay khng c
khun mt.
Hun luyn mng neural d tm khun mt l mt cng vic y thch
thc, v kh khn trong vic biu th cc nh khng khun mt. Khng nh
vic nhn dng khun mt, trong cc lp phn bit l cc khun mt khc
nhau. Hai lp gi l phn bit trong d tm khun mt l nh c cha khun
mt v nh khng cha khun mt. D dng ly c mu nh cha khunmt in hnh, nhng vic ly mu nh khng cha khun mt in hnh kh hn
rt nhiu. Ta trnh vic dng tp hun luyn c kch thc ln biu din
khng khun mt bng vic chn thm nh vo tp hun luyn khi tin hnh
hun luyn. Phng php bootstrap nhm gim kch thc ca tp hun luyn
cn thit. Vic dng cch thc x l gia a mng v cc heuristic lm r
rng cc kt qa v ci thin ng k chnh xc ca b d tm.
1.4.2.3. Hng tip cn s dng phng php thng k (Statistical
Approachs)
Bn cnh phng php s dng khng gian con tuyn tnh v phng
php s dng mng Nron, cn c mt s phng php khc tip cn theo
hng thng k nhn bit khun mt. Nhng phng php ny da trn c s
l thuyt thng tin, l thuyt v SVM (Support Vector Machine) v cc lut xc
sut ca Bayes.
SVM l phng php do Vladimir N. Vapnik xut nm 1995. SVM da
trn l thuyt thng k v ngy cng c s dng ph bin trong nhiu lnh
vc, c bit l trong lnh vc phn loi mu v nhn dng mu. ng thi
30
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
31/122
phng php ny c nhiu tnh nng u vit so vi cc phng php c in
khc nh d dng x l, x l c tnh n nh cao trn d liu phc tp, c th c
s chiu ln v quan trng hn c l kh nng x l tng qut.
Phong php tm kim khun mt da trn m hnh Markov n cng l
mt trong cc hng nghin cu c ch trng. M hnh Markov n l mt tp
cc m hnh thng k c s dng m t cc c tnh thng k ca tn hiu.
L thuyt v chui Markov v m hnh Markov c nghin cu su rng v
p dng nhiu trong l thuyt nhn dng nh nhn dng ting ni, ch vit.
Samarie v cng s, Netfian v cng d l hai nhm nghin cu hng u trong
vic p dng m hnh Markov n vo tm kim v nhn dng mt ngi.
1.4.4 Kt lun
Nhn bit mt ngi l mt lnh vc ang thu ht nhiu s quan tm ca
cc nh nghin cu. Ngy cng c nhiu thut ton mi, hng tip cn mi
nhm nng cao cht lng cng nh chnh xc ca h thng d tm khun
mt. Tuy nhin do tnh phc tp ca mi trng, khng gian v bi cnh cng
nh yu cu v tnh thi gian thc ca h thng m cho n nay, vn cha cmt phng php no tht s ti u. Vic tm ra phng php mi vn cn
ng v c th cn s tr gip ca cng nghip my tnh, l s pht trin ca
phn cng, tc x l ca my tnh.
Tng chung li th, nhn dng mt ngi c hai hng tip cn chnh,
l hng tip cn da vo nhng c trng ca mt ngi v hng tip cn da
vo thng tin hnh nh.
Hng tip cn da vo nhng c trng ca mt ngi c p dng ch
yu khi h thng yu cu tnh thi gian thc. V khi vn v mu sc
v chuyn ng ca hnh nh phi c quan tm. Tuy nhin, hng tip
cn ny th cht lng pht hin ca h thng c th s khng cao, mun
31
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
32/122
nng cao, chng ta phi c thm nhng k thut mi b sung v kh phc
tp.
Hng tip cn da vo thng tin hnh nh l phng php c cht lng
v hiu qu cao nht, nhng ch x l cho nh xm. V cc phng php
u s dng chung k thut ca s a phn gii. Chng ta c th khng
cn s dng ca s qut ny nu kt hp hng tip cn trn vi phng
php da vo c tnh khun mt nh l mt bc tin x l.
ng dng quan trng nht ca nhn bit khun mt cho n hin nay c l
l l giai on tin x l cho h thng nhn dng mt ngi. Ngoi ra, vi s
gia tng ca ti nguyn trn Internet, l thuyt v nhn bit mt ngi c th
c ng dng ch s ho ni dung nh v c s d liu video. Ngoi ra, cnc ng dng trong cng ngh sinh trc hc v hi tho truyn hnh.
2. Tng quan v cc k thut nhn bit mu da da trn tnh cht
im nh
2.1 Gii thiu
Nh trnh by trong phn trc, da vo mu sc ca da ngi cng l
mt trong nhng phng php c dng pht hin mt ngi. Tuy nhin nu
ch n thun s dng mu sc khng thi th rt kh c th t c hiu qu
cao trong pht hin mt ngui. V trong cc khung cnh th c rt nhiu vt c
mu sc tng t nh mu ca khun mt. Tuy nhin nu kt hp phng php
ny vi cc phng php khc li c th mang li hiu qu cao. V kinh nghim
cho thy mu da ngi c c tnh mu ring bit, v c tnh ny cho php d
dng nhn ra u l da ngi [8]. V thng thng trong hng tip cn pht
hin mt ngi da trn thng tin xut hin trong nh, th mu da c s dng
nh mt bc phn vng cc vng nh c mu sc ging mu da, iu cho
32
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
33/122
php gim khng gian tm kim khun mt, ci thin hiu nng ca h thng tm
kim. Do nhiu m hnh c xy dng c th pht hin oc da ngi,
Khi xy dng hay m hnh ha mt h thng pht hin hay phn tch vng
mu da vi mc ch s dng cho vic pht hin mt ngi, ngi ta thng t
ra ba vn chnh [7]. Th nht l m hnh c xy dng trong khng gian
mu no, th hai l hm phn phi ca mu da c m hnh ha chnh xc n
mc no v cui cng l s x l vng mu da c phn vng cho nhn bit
mt ngi nh th no. Trong phn ny, s ch cp n hai cu hi trn, cn
vic x l vng da nh th no cho vic pht hin mt ngi, s cp n trong
chng sau, vi mt phng php c th c chn s dng cho bi n
ny.Phng php c c p trong phn ny l phng php pht hin
da ngi da trn c tnh im nh, ngha l s phn lp im nh thnh hai
lp, lp l lp im anh c thuc mu da v lp kia khng phi l mu da. Cc
im nh l hon ton c lp vi nhau. Ngc li vi phng php ny l
phng php da trn c tnh vng nh.
Pht hin mu da da trn c tnh im nh c mt lch s pht trin khdi, tuy nhin trong khun kh phn tng quan ny, ch cp v so snh nhng
k thut c cng b v c nh gi hiu qu.
Mc ch cui cng ca phn tng quan ny l thu tp cc k thut
c cng b, m t nhng tng chnh ca k thut , tng hp v a ra
nhng u im, nhc im v nhng c trng ca tng k thut. T s a
ra quyt nh la chn k thut ph hp dng phn vng mu da p dng cho
bi n ny.
2.2 Khng gian mu s dng cho m hnh ha mu da
Trong lnh vc o mu, cng nh cc lnh vc trong truyn tn hiu hnh
nh v video s dng rt nhiu khng gian mu vi cc tnh cht khc nhau. V
33
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
34/122
trong s nhiu khng gian mu c p dng cho vn m hnh ha mu
da. Sau y l tm lc nhm cc khng gian mu c s dng rng ri nht
cng nh cc tnh cht ca chng
2.2.1 Khng gian mu RGB
RGB l khng gian mu c bn c p dng t lu cho mn hnh CRT.
Trong khng gian mu ny, mi im mu l s kt hp ca ba thnh phn n
mu ( - Red, Xanh l cy- Green v xanh da tri : Blue). y l mt trong
nhng khng gian mu c s dng ph bin nht cho vic x l v lu tr d
liu nh s. Tuy nhin do tnh tng quan cao gia cc knh, gi tr cm nhn
khng ng nht, s pha trn gia d liu thnh phn mu v d liu v sngm khng gian RGB khng c a thch s dng cho vic phn tch mu cng
nh trong cc thut ton nhn dng da trn mu sc.
2.2.2 Khng gian RGB chun ha
Khng gian RGB chun ha l khng gian mu nhn c t khng gian
RGB c bn theo cng thc chun ha n gin sau y:
(I.13)
.
C th d dng thy rng, trong khng gian ny, r+g +b = 1. Do ch
cn hai trong ba thnh phn trn l biu din khng gian mu ny, thnh
phn th ba s khng cn gi tr v c th c b qua, rt ngn c s
chiu ca khng gian ny. Hai thnh phn cn li thng c gi l cc thnh
phn mu tinh khit (pure colors). Thng thng, hai thnh phn r v b
thng c gi li, cn b b rt b i. Tnh cht cn ch ca khng gian mu
ny l tnh bt bin i vi ca b mt. Ngha l, nu nh khng quan tm
n nh sng xung quanh, th khng gian chun ha RGB l bt bin i vi s
34
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
35/122
thay i v hng b mt lin quan n ngun chiu (tt nhin l dui mt vi
gi thit nht nh). Kt hp vi php chuyn i n gin t khng gian mu
RGB c bn m khng gian RGB chun ha ny ngy cng c s dng rng
ri trong nhiu lnh vc, trong c linh vc nhn dng.
2.2.3 HIS, HSV, HSL - bo ha ca mu
Khng gian mu da trn tnh bo ha mu c gii thiu khi c nhng
nhu cu trong vic xc nh s lng tnh cht mu. Chng miu t mu sc vi
nhng gi tr thuc v trc gic, da trn kin ca cc ha s v nhng trng
thi khc nhau ca mu sc, trng thi bo ha cng nh tng tng mu khc
nhau. Hue biu th cho mu tri (nh mu , mu xanh l cy, mu ta vmu vng) ca mt vng nh, saturation ( bo ha) l thc o cho gii mc
ngng mu ca mt vng nh. Cc khi nim nh intensity (cng ),
lightness (tnh du) hay value(gi tr) lin quan n sng ca mu. Gi tr
trc gic ca cc thnh phn trong khng gian mu ny v s phn bit r rng
gia sng vi c thnh phn mu ca khng gian mu l u im m gip cho
khng gian ny c s dng ph bin trong vn phn vng mu da.
Cng thc chuyn t khng gian RGB sang khng gian ny nh sau:
(I.14)
35
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
36/122
Ngoi ra cn c th tnh Hue Saturation bng cch s dng hm log cho
cc thnh phn mu ca khng gian mu RGB. Phng php ny c th lm
gim s c lp ca cc thnh phn mu theo mc sng.
H ta cc gia Hue v Saturation c th gy ra nhiu kh khn trong
m hnh mu da, chnh v vy ngi ta cn chuyn n sang h ta cc theo
cng thc sau:
(I.15)
2.2.4 TSL Tint, Saturation, Lightness (sc thi, bo ha, du )
Khng gian chun ha thnh phn mu v sng TSL c chuyn tkhng gian chun ha RGB theo cng thc sau y:
(I.16)
Trong , r = r 1/3, g = g 1/.
Theo kt qu nghin cu, so snh chn khng gian mu s dng cho m
hnh mu da thi khng gian chun ha TSL thc hin m hnh ha mu da nhanh
hn cc khng gian khc.
2.2.5 YcrCb
YCrCb l khng gian mu c s dng nhiu trong vn nn nh. Mu
sc dc biu din bi luma ( l gi tr sng c tnh ton t khng gian
RGB), gm ba thnh phn, mt thnh phn l tng cc trng s t RGB, hai
36
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
37/122
thnh phn mu khc nhau Cr v Cb c to ra bng cch t t hai thnh phn
Red v Blue trong khng gian mu RGB. Cng thc chuyn i nh sau:
(I.17)
Vic chuyn i n gin, tnh phn chia r rng ca sng v cc thnh
phn mu l nhng c tnh gip cho khng gian ny li cun cc nh nghin
cu s dng cho vic m hnh ha mu da.
2.2.6 Cc h ta khng gian mu khc
Bn cnh YcrCb, mt vi khng gian mu khc oc to ra t chuyn i
tuyn tnh khng gian RGB c s dng trong vn pht hin mu da. Nh l
YES, YUV hay YIQ. Tuy nhin chng t c s dng hn.
2.3 M hnh ha mu daMc ch cui cng ca pht hin mu da l xy dng mt quy t c tnh
quyt nh. y l quy tc s gip phn bit mt im nh l da hay khng phi
l da ngi. Thng thng, quy tc ny s thit lp mt gi tr o cho php tnh
ton mc tng ng gia mt im nh mu vi c trng mu da. Gi tr
o ny c thit lp nh th no, cng thc ra sao ty thuc vo tng phng
php m hnh ha mu da.
2.3.1 Xc nh ngng c th mt im nh l mu da
Trong mt s khng gian mu, phng php xy dng v xp lp mu da
bng cch xc nh r rng (thng qua mt s quy tc) bin gii cc gi tr ca
im nh l mu da hay khng. V d nh:
37
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
38/122
Trong khng gian RGB:
(R,G,B) c xp thuc lp mu da nu nh:
R>95 v G>40 v B>20 v
Max(R,G,B) Min(R,G,B) >15 v
|R-B| > 15 v R>g v R>B
Tnh n gin ca phng php ny cng thu ht nhiu s tp trung
nghin cu. u im d thy ca phung php ny l tnh n gin ca quy
tc nhn bit mu da. iu ny cho php phn lp mt cch nhanh chng v d
dng. Tuy nhin kt qu t c khi phn lp l khng cao trong trng hptng qut. V vy kh khn chnh ca phng php ny nu mun c c h s
nhn dng cao l phi tm ra c mt khng gian mu thch hp cng nh
cc quy tc tt nhn bit mu da trong khng gian mu ny.
Hin nay ngi ta ang xut s dng thut ton my hc tm ra mt
khng gian mu thch hp cng nh cc quy tc phn lp mu da vi mong
mun c c h s nhn dng cao. Tuy nhin cng ch mi l xut vcha c mt kt qu c th ca mt nghin cu no oc cng b.
Tuy nhin, gia v kt qu t c, chng ta vn c th tm ra c
nhng quy tc cho php nhn bit chc chn mt im nh khng phi l mu
da. Nhng quy tc ny c th c s dng lm bc lc khi to cho cc
phng phn lp php phc tp hn gia vng mu da v vng khng phi mu
da. N gip cho qu trnh phn lp c thc hin nhanh chng hn v tn
cng hn.
2.3.2 Phong php m hnh ha mu da s dng phn phi khng tham s
tng chnh ca phong php m hnh ha mu da khng tham s l
c lng phn phi mu da t d liu hun luyn m khng xut pht t mt
38
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
39/122
m hnh r rng no ca mu da. Kt qu ca phng php ny thng c
biu din di dng mt bn phn b mu da (SPM Skin Probability Map).
Mi mt gi tr phn b c gn cho mi im trong khng gian mu.
2.3.2.1 Bng tra cu chun ha (LUT Lookup Table)
Mt s thut ton pht hin mt ngi v bm st mt ngi s dng mt
lc mc xm da trn hng tip cn phn vng cc im nh l mu da.
Khng gian mu c lng t ha thnh tng nhm, mi mt nhm p ng
cho mt khong cc thnh phn mu. Cc nhm lc ny c tham chiu ti
mt bng gi l bng tra cu. Mi mt nhm lu tr mt s lng ln xut hin
ca mt mu khi tin hnh hun lun nh da ngi. Sau qu trnh hun luyn,biu s tnh ton v chun ha, chuyn sang gi tr biu trong phn phi
xc sut min ri rc: Pskin(c) = skin[c]/Norm (I.18)
Trong , skin[c] nhn gi tr ca nhm lc , p ng cho vc t mu
c, Norm l mt h s chun ha (tng tt c cc gi tr ca cc nhm biu )
hay l gi tr ln nht ca mt nhm biu . Gi tr chun ha ca ca bng tra
cu cc nhm biu l cn c cho php quyt nh mt mu c l mu dahay khng.
2.3.2.2 Phn lp Bayes (Bayes Classifier)
Gi tr ca Pskin(c) trong cng thc trn l mt iu kin xc sut P(c|
skin) xc sut mt mu quan st c l mt pixel mu da. V xc sut thch hp
c dng pht hin mu da l P(skin|c) xc sut quan st mu c
mu da khi xut hin mt gi tr mu c ri rac. tnh gi tr ny, ta s dng
cng thc Bayes quen thuc:
(I.19)
39
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
40/122
Trong P(c|skin) v P(c|-skin) oc tnh trc tip t biu mu da v
khng mu da. Xc sut ton phn P(skin) v P(-skin) th c c lng t mt
s lng cc mu l mu da v khng mu da trong tp mu hun luyn. Bt
ng thc P(skin|c) > , trong l mt gi tr ngng, c th c s dng
tr thnh quy tc trong pht hin mu da.
Cng thc trn i khi hi phc tp, v c th trnh iu ny, nu nh
thc s khng cn phi bit mt cch chnh xc sut P(skin|c) v P(-skin|c) m
ch cn bit t s gia chng th ngi ta thng a v cng thc nh sau:
(I.20)
So snh cng thc ny vi mt ngng c th to ra mt quy tc cho php
pht hin t s mu da/khng phi mu da. Sau mt vi php bin i, chng ta
nhn c cng thc
(I.21)
Cng thc trn c th thy rng, vic chn la gi tr ca xc sut ton
phn khng nh hng n cht lng ca b pht hin, v vi bt k mt xc
sut ton phn P(skin) u c th chn c mt gi tr K ph hp sao cho gi tr
ca ngng l .
2.3.2.4 Tng kt phng php khng tham s
40
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
41/122
Hai u im d thy ca phng php m hnh ha phn phi khng tham
s l: th nht, chng c th hun luyn v s dng c mt cch nhanh
chng. Th hai, chng c lp vi l thuyt v hnh dng ca phn phi mu da
(iu ny khng ng trong m hnh ha mu da c tham s). Tuy nhin nhc
im ca phng php ny l chng yu cu nhiu b nh lu tr v
khng c kh nng ni suy hay to ra d liu hun luyn. Ly v d nh, chgn
ta lng t ha im nh trong khng gian RGB v 8bit cho mi mu, khi
chng ta phi cn mt mng c ti 224 phn t l tr tp tt c cc xc sut
ca m hnh. c th gim bt kch thc ny bng cch loi b nhng d liu
hun luyn nh l, khng gian mu thng s dng kch thc 128*128*128,
64*64*64, 32*32*32. Theo nh nghin cu th kch thc 32*32*32 l kchthc khng gian mang li hiu qu cao nht.
2.3.3 M hnh ha phn ph mu da c tham s
Hu ht cc m hnh mu da khng tham s da trn biu xm u yu
cu rt nhiu b nh v hiu nng ca chng ph thuc hon ton ca tp nh
hun luyn c nh. V vy cn c mt m hnh mu da c th t thm hoc tto ra d liu hun luyn , iu dn n s ra i a m hnh phn phi
tham s.
2.3.3.1 M hnh da trn phn phi Gaussian n.
Phn phi mu da c th oc m hnh ha bi phn phi Gaussian thm
vo hm mt xc sut. nh ngha nh sau:
(I.22)
41
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
42/122
y, c l mt vc t mu, s v s l hai tham s phn phi (vc t trng
bnh v ma trn hip phng sai). Cc tham s ca m hnh c c lng
thng qua qu trnh hun luyn bi cng thc sau:
(I.23)
Trong , n l tng s cc mu mu da . Xc sut p(c|skin) c th c
tnh trc tip mc tong t mu da (likehood skin color) hoc c th tnh
bng khong cch Mahalanobis t v t mu c, vc t trung bnh s, ma trn hip
phng sai s. Cng thc tnh khong cch Mahalanonbis:
(I.24)
Phong php m hnh ha gia trn phn phi n Gaussian c trin
khai v nghin cu.
2.3.3.2 M hnh kt hp da trn phn phi Gaussian
Mt m hnh cng phu, phc tp hn, c kh nng biu din c phn
phi phc tp l m hnh kt hp da trn phn phi Gaussian. y l m
hnh m rng t m hnh n Gaussian trn, trong trng hp ny, hm phn
phi mt xc sut l:
(I.25)
Trong , k l s lng cc thnh phn c kt hp, i l tham s kt
hp, tha mn rng buc ki = 1 i = 1, v pi(c|skin) tha mn hm phi mt xc
sut Gaussian, vi mi vc t trung bnh v ma trn hip phng sai ca n.
Hun luyn m hnh oc thc hin vi mt k thut c bit n nhiu gi l
42
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
43/122
thut ton k vng ti a (EM - Expectation Maximization), trong gi s rng
s lngcc thnh phn k l bit trc. Chi tit vic hun luyn m hnh kt
hp Gaussian vi thut ton EM ny c th c tm thy trong nhiu nghin
cu. Vic phn lp trong m hnh kt hp Gaussian c thc hin nh vic so
snh xc sut p(c|skin) vi mt vi gi tr ngng.
Vic chn la s lng thnh phn k y l quan trng. V n nh
hng n chnh xc ca vic hun luyn cho m hnh. Theo nh nhng
nghin cu hin nay, k = 8 l s la chn mang hiu nng cao nht cho m hnh
kt hp phn phi Gausian.
2.3.3.3 a phn phi GausianMc gn ng ca cc nhm mu da vi phn phi Gaussian 3D trong
khng gian YcbCr c miu t trong nhiu bi bo. Mt s lng khc nhau
cc thut ton phn nhm K-trung bnh c s dng cho nhm Gaussian thc
hin vic hun luyn m hnh. Cc im nh c phn lp thnh lp mu da
nu nh khong cch Mahalanobis t vct mu c n trung tm ca cm gn
nht trong m hnh nh ln hn mt ngng cho trc.
2.3.3.4 Tng kt cc phong php m hnh ha theo tham s
Tt c cc phng php m hnh ha theo tham s c miu t nh trn
(ngoi tr phng php 2.3.3.3) u tnh ton trn mt phng cc thnh phn
mu ca khng gian mu m b qua thng tin v sng.
D nhin, khi mt m hnh phn phi c th c s dng, s c cu hi
t ra v s xc thc v gi tr ca m hnh . Hin nhin, m hnh c lp vi
hnh dng ca phn phi trong khng gian mu th cng tt hn, do m hnh
khng tham s xt v mt ny hin nhin s tt hn m hnh c tham s. Tuy
nhin do yu cu qu cao v b nh m khi nh gi hiu nng th m hnh c
43
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
44/122
tham s li c hiu nng cao hn. iu ny c th thy trong cc bng nh gi
nhiu bi bo.
2.4 So snh kt qu cc m hnh
c th nh gi v so snh hiu nng ca cc phng php m hnh
ha mu da l khng d, v mi phng php thng c xut ca mt
nhm cc nh nghin cu v c th nghim trn c s d liu ring. V cha
c mt c s d liu chun no c cng b rng ri cho vn ny. C s d
liu hun luyn v kim nh c bit n nhiu nht l c s d liu ca
Compaq. Trong bng so snh c a ra di y, l kt qu tt nht m mi
phng php t c, c tng hp bi [Valimir Vezhnevets, Vassili SazonovAlla Andreeva ], vi kt qu th nghim da trn c d liu ca Compaq nu
trn. Bng sau y s so snh h s pht hin ng v khng ng ca tng
phng php. Mc d cc phng php l khc nhau v d liu hun luyn v
tp d liu test, cng nh chin lc hun luyn, bng di y vn m t mt
bc tranh ton cnh v hiu nng ca cc phng php [7]:
Phng Php Nhn bit ng Nhn bit saiBayes SPM trong RGB
(Jones v Regh 1999)
80%
90%
8.5%
14.2%Bayes SPM trong RGB
(Bran v Mason 2000)
93.4 % 19.8%
Maximum Entropy Model trong RGB
(Jedynak v al. 2002)
80% 8%
Gaussian Mixture models trong RGB
(Jones v Rehg 1999)
80%
90%
~9.5%
~15.5%SOM in TS
(Brown v al. 2002)
78% 32%
Elliptical boundary model trong CIE xy
(Lee v Yoo 2002)
90% 20.9%
44
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
45/122
Single Gaussian trong Cb v Cr
(Lee v Yoo 2002)
90% 33.3%
Gausian Mixture trong IQ
(Lee v Yoo 2002)
90% 30,0%
Thresholding ca trc I trong YIQ(Brand v Mason 2000)
94.7% 30.2%
Bng 1: Kt qu nhn bit ng v sai ca cc phng php
2.5 nh gi phng php
u im chnh ca cc phng php s dng cc ngng phn lp
im nh l mu da hay khng l tnh n gin v tnh trc gic cao trong cc
quy tc phn lp. Tuy nhin, im kh khn l cn phi tm c c mt
khng gian mu tt v cc quy tc xng ng trong khng gian . Phng php
c xut hin ny s dng thut ton my hc c th tm c khng
gian v cc quy tc thch hp, tuy nhin xut ny vn ang l mt vn m
trong tng lai
Cc phng php s dng m hnh ha khng tham s tht s nhanh trong
c vic hun luyn v phn lp, c lp vi phn b hnh dng ca mu da v ckhng gian mu. Tuy nhin, phng php ny li yu cu qu nhiu b nh lu
tr v ph thuc c dnh vo tp d liu hun luyn.
Cc phng php m hnh ha c tham s cng x l kh nhanh. Hn na
chng li c kh nng t to ra cc d liu hun luyn ph hp, chng c
miu t bng mt s lng khng nhiu cc tham s v c bit chng cn
khng ng k b nh lu tr. Tuy nhin, chgn c th s thc s chm (ging
nh m hnh kt hp gia trn phn phi Gaussian) trong c hun luyn v lm
vic, v hiu nng ca chng ph thuc nhiu vo hnh dng ca phn phi mu
da. Bn cnh , hu ht cc phng php m hnh ha mu da c tham s u
b qua nhng thng k v mu khng phi l tham s.
45
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
46/122
2.6 Chn la khng gian mu v phng php m hnh ha dng
nhn bit mu da cho n.
Vi mc ch l s dng nhn bit mu da tin hnh phn vng mu da,
gim khng gian tm kim khun mt trong nh mu. V vy, phng php cn
thit cho n phi c hiu nng cao, thi gian thc hin nhanh, yu cu b nh
khng ln. Thi gian hun luyn khng phi l vn . Khng gian nh phi ph
hp vi phng php nhn bit mu da. Chnh v vy, xem xt tt c cc phng
php, cc c trng cng nh hiu nng ca tng phng php. Chng ta s s
dng phng php m hnh ha c tham s tin hnh phn vng mu da cho
nh. C th phng php c la chn l phng php m hnh ha mu da
c tham s da trn phn phi Gaussian. V khng gian mu c la chn l khng gian YcrCb do c im chuyn i n gin t RGB, s phn bit r
rng gia sng v cc thnh phn mu. ng thi, nng cao hiu nng v
gim thi gian tnh ton cho phng php chn la ny, chng ta s xem xt cc
quy tc oc xut trong nhm phng php dng ngung lc khi to loi
b nhng im nh chc chn khng phi mu da. Chi tit cch thc tin hnh
ca phng php phn vng mu da ny s c cp n trong phn 2 cachng III.
3. Gii thiu v mng neural nhn to MPL v thut ton lan truyn
ngc
3.1 Gii thiu
H thng pht hin mt ngi c xy dng trong n da trn mng
neural MPL (Multi Perceptron Layer) v s dng thut ton lan truyn ngc
luyn mng. V vy trong phn ny, s ni mt cch c bn nht v MPL v
thut ton lan truyn ngc.
46
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
47/122
C th ni, hin nay, khng c mt nh ngha chnh thc no cho mng
neural. Tuy nhin phn ln mi ngi u ng tnh rng mng neural l mt
mng bao gm rt nhiu b x l n gin (gi l cc unit), mi unit c vng
nh ring ca mnh. Cc unit c kt ni vi nhau thng qua knh thng tin
(gi l cc connection), thng mang d liu s (khng phi l cc k hiu), v
c m ha theo mt cch no y. Cc unit ch x l trn b d liu ca ring
n v trn cc u vo c a ti thng qua cc lin kt. hn ch ca cc php
x l cc b ny l n thng trng thi ngh trong sut qu trnh hc.
Mt s mng neural l cc m hnh mng neural sinh hc, mt s th
khng, nhng t trc ti nay, th tt c cc lnh vc ca mng neural u oc
nghin cu xy dng xut pht t cc yu cu xy dng cc h thng nhn tort phc tp, hay cc php x l thng minh, v nhng g tung t nh b no
con ngi.
Hu ht cc mng neural u c mt vi quy tc hc no m thng qua
cc trng s ca cc lin kt c iu chnh da trn d liu. Ni cch khc,
cc mng neural hc v cc v d v da trn cc d liu th n c kh nng
tng qut tri thc v a ra nhn thc ca mnh.Mng neural l m hnh mng ng dng cc phng php x l song song
v cc thnh phn mng x l hon ton c lp vi nhau. Mt vi ngui xem
kh nng x l song song s lng ln v tnh lin kt cao ca mng neural l
cc tnh cht c trugn ca n. Tuy nhin vi nhng yu cu nh th th li
khng c nhng m hnh n gin, v d nh m hnh hi quy tuyn tnh n
gin, mt m hnh c ng dng rt rng ri ca mng neural.
Mng neural c th c p dng trong mi trng hp khi tn ti mt
mi lin h gia cc bin c lp (inputs) v cc bin ph thuc (outputs), thm
ch l ngay c khi mi quan h phuc tp. Mt s lnh vc m mng neural
c p dng thnh cng nh d on triu chng y hc, d on th trng
47
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
48/122
chng khon, nh gi tin cy ti chnh, iu chnh iu kin ca c cu my
mc.
3.2 Mng Perceptron nhiu tng (MPL Multi Perceptron Layer) [3]
MPL l mt loi mng lan truyn tin c hun luyn theo kiu hc c
thy. Mng l mt cu trc gm nhiu lp trng s. y ta ch xt n loi
mng lan truyn kh vi. y l loi mng c th p dng phng php tnh ton
kh hiu qu v mnh gi l lan truyn ngc li , xc nh o hm hm li
theo cc trng s v dc trong mng. y l mt tnh cht rt quan trng ca
nhng mng kiu ny bi nhng o hm ny ng vai tr trung tm trong cc
gii thut hc ca cc mng a lp. Vn lan truyn ngc s c ta xt titrong mt phn ring sau ny.
3.2.1 nh x mng lan truyn tin
Trong phn ny ta s nghin cu m hnh mng neural lan truyn tin nh
l mt khung tng qut i din cho cc hm nh x phi tuyn gia t p cc bin
u vo v t p cc bin u ra.
3.2.1.1 Mng phn lp
Cc mng n lp c xy dng da trn s kt hp tuyn tnh cc bin
u vo c chuyn i bi mt hm truyn phi tuyn.
Ta c th xy dng c cc hm tng qut hn bng cch nghin cu
nhng m hnh mng c cc lp cc nt l lin tip, vi cc kt ni t tt c cc
nt thuc mt lp ti tt c cc nt thuc lp k tip, v khng cho php bt k
mt loi kt ni no khc. Nhng mng phn lp nh th ny c th d phn tch
hn cc cu trc tng qut khc, v cng d c m phng bi phn mm hn.
48
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
49/122
Hnh 4: M hnh mng lan truyn tin
Cc nt khng phi l cc nt nhp v nt xut c gi l cc nt n.
Trong m hnh chng ta nghin cu y, c d nt nh p, M nt n v c nt xut.
Kt qu ca nt n th j c tnh nh sau:
= +=d
i jwixjiwja 1
)1( 0)1( (I.26)
Trong l trng s ca lp u tin, t nt nh p i n nt n j, v l
trng ngng ca nt n j.
Gi s t mt bin c nh x0 = 1. T cng thc (I.26) c th c
vit li:
=
=d
i ixjiwja 0
)1((I.27)
Sau hot ngzk ca nt n j c tnh ton bng cch chuyn i
tng tuyn tnh (I.27) s dng hm truyn g(.), tc l: zk= g(aj) (I.28)
49
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
50/122
Kt xut ca mng c tnh bng cch chuyn i hot ng ca cc
nt n s dng mt lp cc nt th 2. Vi mi nt xut k, ta c:
=
+=M
i kwjzkjwka 1
)2(0
)2((I.29)
t z0 =1 ta c:
=
=M
i jzkjwka 0
)2((I.30)
Sau gi tr ny c cho qua ham truyn phi tuyn cho ta kt xut u
ra ca nt xut k:( )
kkagy ~
= (I.31) y ta s dng k hiu biu din hm truyn ca cc nt xut nhm
ch ra rng hm ny c th khng trng vi hm c s dng trong lp n.
Kt hp (I.27), (I.28), (I.30), (I.31) ta c cng thc chung cho m hnh
mng trong hnh trn:
=
=
=M
j
d
i ixjiwgkjwgky 0 0
)1()2(~ (I.32)
3.2.1.2 Kin trc mng tng qut
Ta c th xy dng c nhng nh x mng tng qut hn bng cch
nghin cu nhng s mng phc tp hn. Tuy nhin y th ta ch gii hn
nghin cu trong phm vi cc mng lan truyn tin.
Mng lan truyn tin l mng khng c mt kt ni quay lui no trong
mng.
Theo Bishop (1995): OV mt tng qut, mt mng c gi l lan truyn
tin nu n c th gn cc s lin tc cho tt c cc nt nhp, tt c cc nt n v
nt xut sao cho mi nt ch c th nhn c cc kt ni t cc nt nh p hoc
cc nt c gn s b hn.O
50
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
51/122
Vi nhng mng c tnh cht nh th, kt xut ca mng l cc hm quyt
nh ca cc u vo, v v th ton b mng c gi l mt nh x hm phi
tuyn a bin.
Kt xut ca nt ktnh c nh sau:
= jzj kj
wgkz (I.33)
trong g(.) l mt hm truyn phi tuyn, v j thuc t p tt c cc nt
nhp v cc nt gi kt ni ti nt k(Tham s trng ngng cng c bao
hm trong tng ny).Vi mt tp cho trc cc gi tr u vo, p dng lin tc cng thc
(I.33) s cho php cc kch hot ca tt c cc nt trong mng c c lng,
bao gm c cc kch hot ca cc nt xut. Qu trnh ny c gi l lan truyn
tin cc tn hiu qua mng.
Nu nh cc hm truyn ca tt c cc nt n trong mng l tuyn tnh, th
vi nhng mng nh th ta lun lun tm c mt m hnh mng tng ngm khng c mt nt n no. Nhng mng ny c gi l mng tuyn tnh a
lp v v th khng c i su nghin cu, m ngi ta ch ch yu nghin cu
cc mng a lp vi cc hm truyn ca cc nt n l phi tuyn.
3.2.2 Hm sigmoid
By gi chng ta s xem xt hm truyn logistic dng S, trong cc u
ra ca n nm trong khong (0,1), c phng trnh nh sau:
( )( )a
ag+
=exp1
1(I.34)
51
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
52/122
Hnh v di y biu din mt hm truyn sigmoid cho cc nt trong
mng. y l mt hm m c mt c tnh v cng quan trng v : khi x chy t
v cng ln n v cng b th f(x) lun chy trong khong t 0 n 1. Gii
thut hc y s iu chnh trng s ca cc kt ni gia cc nt hm ny
nh x gi tr ca x sang dng nh phn, thng thng:
f(x) > 0.9 : f(x) = 1
f(x) < 0.1 : f(x) = 0.
Hnh 5: th hm truyn sigmoid
Trong phn ny chng ta s xem xt c c mng neural vi nt xut tuyn
tnh. Tuy nhin iu ny cng chng hn ch lp cc hm m mng c th xp x
ho. Vic s dng cc hm sigmoid ti cc u ra s gii han pham vi co th
xy ra ca cc nt xut thnh phm vi c th t ti c ca hm sigmoid (gi
tr kt xut l t 0 ti 1), v trong mt s trng hp th iu ny c th l khng
mong mun. Thm ch ngay c khi gi tr xut mong mun l nm trong gii hn
ca hm sigmoid th chng ta vn phi ch rng hm sigmoid g(.) l mt hm
n iu tng, do n c th ly nghch o c. Do vy mt gi tr xut y
52
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
53/122
mong mun i vi mng c nt xut thuc dng sigmoid th tng ng vi
mt gi tr xut g-1(y) i vi mng c nt xut tuyn tnh.
Mt nt n thuc dng sigmoid c th xp x mt nt n tuyn tnh bt k
mt cch chnh xc. Cng vic ny t c bng cch thit k cho tt c cc
trng s cc cung u vo ca nt, cng nh cc trng ngng, sao cho rt nh
m tng ca cc gi tr nhp phi nm trn phn tuyn tnh ca ng cong
sigmoid, gn ng vi ng thng nguyn thu. Trng s trn cung xut t mt
nt n tng cha cc nt k tip c th to ra tng i ln ti t l vi
hot ng (v vi trng ngng c c bc dch chuyn ph hp nu cn
thit). Tng t, mt nt n dng sigmoid c th c to ra nhm xp x mt
hm bc thang (step) bng vc t gi tr cho cc trng s v trng ngng rtln.
Bt k mt nh x hm lin tc no u c th c trnh by vi chnh
xc tuy y bi mt mng neural hai lp trng s s d ng cc nt n dng sigmoid
(Bishop, 1995).
Do chng ta bit c rng nhng mng neural vi nhiu tng nt x
l cng c kh nng xp x ho bi v chng cha ng trong n mng neuralhai tng nh mt trng hp c bit. iu ny cho php cc tng cn li c
sp xp thc hin nhng bin i tuyn tnh nh tho lun trn, v s
bin i ng nht chnh l mt trng hp dc bit ca mt php bin i tuyn
tnh (bit rng c s nt n khng c s gim bt v chiu xy ra).
3.3 Thut ton lan truyn ngc [1]
By gi chng ta s tp trung nghin cu mt k thut rt ph bin ca
mng neural nhiu tng. Chng ta s xem xt cch m mt mng hc mt nh x
t mt t p d liu cho trc.
Chng ta bit vic hc da trn nh ngha ca hm li, hm li ny sau
s c ti thiu ho da vo cc trng s v cc trng ngng trong mng.
53
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
54/122
Trc tin ta s xem xt trng hp mng s dng hm ngng. Vn
cn bn y chnh l c ch khi to cc trng s cho mng nh th no.
Cng vic ny thng c gi l credit assignment problem. nu mt nt u
ra to ra mt p s sai lch th chng ta phi quy t nh xem liu nt n no
phi chu trch nhim cho s sai lch , cng chnh l vic quyt nh trng s
no cn phi iu chnh v iu chnh l bao nhiu.
gii quyt vn gn trng s ny, chng ta hy xem xt mt mng
vi cc hm truyn phn bit ,do gi tr tng trng ca cc nt xut s tr
thnh mt hm phn bit ca cc bin nhp v ca trng s v trng ngng.
Nu ta coi hm li, v d c dng sai s trung bnh bnh phng, l mt hm
ring bit cho cc gi tr xut ca mng th bn thn n cng chnh l mt hmphn bit ca cc trng s.
Do chng ta c th tnh ton c o hm hm li theo cc trng s,
v gi tr o hm ny li c th dng lm cc tiu ho hm li bng cch s
dng phng php gim gradient (gradient descent) hoc cc phng php ti
u ho khc.
Gii thut c lng o hm hm li c bit n vi tn gi lan truynngc, n tng ng vi vic lan truyn ngc li trong mng. K thut v lan
truyn ngc c bit n rt rng ri v chi tit qua cc bi bo cng nh cc
cun sch ca Rumelhart, Hinton v Williams (1986). Tuy nhin gn y mt s
tng tng t cng c mt s nh ngin cu pht trin bao gm Werbos
(1974) v Parker (1985).
Cn ni thm rng gii thut lan truyn ngc c s dng trong mng
neural c ngha rt ln. V d nh, kin trc ca mng perceptron nhiu tng
cng thng c gi l mng lan truyn ngc. Khi nim lan truyn ngc
cung thng c s dng m t qu tr nh hun luyn ca mng perceptron
nhiu tng s dng phng php gradient descent p dng trn hm li dng sai
s trung bnh bnh phng. lm r hn v thut ng ny chng ta cn xem xt
54
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
55/122
qu trnh luyn mng mt cch k cng. Phn ln cc gii thut luyn mng u
lin quan n mt th tc c l p i l p li nhm lm ti thiu hm li, bng
cch iu chnh trng s trong mt chui cc bc.
Ti mi bc nh vy, chng ta c th chia thnh hai bc phn bit.
Ti bc th nht, cn phi tnh o hm hm li theo cc trng s. Chng
ta bit rng mt ng gp rt quan trng ca k thut lan truyn ngc l
vic cung cp mt phng php ht sc hiu qu v mt tnh ton trong vic
nh gi cc o hm. V ti bc ny li s c lan truyn ngc tr li mng
nn chng ta s s dng khi nim lan truyn ngc c trng ring cho vic
nh gi o hm ny.
Ti bc th hai, cc o hm s c s dng trong vic tnh ton siu chnh i vi trng s. V k thut n gin nht c s dng y l k
thut gradient descent, k thut ny c Rumelhart et al. (1986) a ra ln u
tin.
Mt iu ht sc quan trng l phi nhn thc c rng hai bc ny l
phn bit vi nhau. Do , qu trnh x l u tin , c bit n l qu trnh
lan truyn ngc cc li vo trong mng nh gi o hm, c th c pdng i vi rt nhiu lai mng khc nhau ch khng ch i vi ring mng
perceptron nhiu tng. N cng c th c p dng vi cc loi hm li khc
ch khng ch l hm tnh sai s bnh phng cc tiu, v nh gi cc o
hm khc ny c th s dng cc phng php khc nh phng php ma trn
Jacobian v Hessian m chng ta s xem xt phn sau. V cng tng t nh
vy th ti bc th hai, vic iu chnh trng s s dng cc o hm c
tnh trc c th thc hin vi nhiu phng php ti u ho khc nhau, v
rt nhiu trong s cc phng php cho kt qu tt hn phng php gradient
descend.
3.3.1. Lan truyn ngc
55
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
56/122
Hnh 5: Lan truyn ngc
By gi chng ta s p dng gii thut lan truyn ngc cho bt k mt
mng neural c cu hnh lan truyn tin tu , s dng cc hm truyn phi tuyntu , v c hm li c dng tu . minh ho chng ta s dng mt mng c
cu trc mt tng nt n dng sigmoid v hm li l hm tnh theo sai s trung
bnh bnh phng.
Trong cc mng lan truyn tin ni chung mi nt u tnh tng trng ho
cc u vo ca n theo cng thc:
= i ijij zwa (I.35)Vi zi l gi tr nhp hoc l gi tr xut ca mt nt c cung kt ni vi
nt j v wji chnh l trng s ca cung kt ni . Gi tr tng ny c tnh trn
tt c cc nt c kt ni trc tip vi nt j. Chng ta bit rng, trng ngng ca
nt cng c a vo trong tng bng cch to ra thm mt gi tr nh p c nh
56
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
57/122
= 1. Tng trong (I.35) li c bin i thng qua mt hm truyn phi tuyn g(.)
a ra c ga tr xut zi ca nt j theo cng thc:
( ji agz = (I.36)
By gi chng ta cn phi xc nh gi tr ca cc trng s trong mng
thng qua vic ti thiu ho hm li.
y ta s coi c hm li c vit nh mt tng ca tt c cc li ti mi
mu ring bit.Tng ny s c tnh trn tt c cc mu ca t p hun luyn
=n
nEE (I.37)
Vi n l nhn ca tng mu.
Chng ta cng gi nh rng li En c th c th hin nh mt hm
ring ca cc bin u ra, c ngha l :
En = En(yc, , yc)
Mc ch ca chng ta y chnh l phi tm ra mt hm nhm tnh
c o hm ca hm li theo cc trng s v trng ngng ca mng.
i vi tng mu, ta s coi nh cung cp mt vector nhp tng ng l
u vov tnh c cc gi tr xut ca cc nt n cng nh nt xut theo cc
cng thc (I.35), (I.36). Qu trnh ny thng c gi l qu trnh lan truyn
tin trong mng.
By gi hy xem xt vic tnh o hm ca En theo c trng s wji. Gi trxut ca cc nt s ph thuc vo tng mu nhp n no. Tuy nhin d nhn,
ta quy c s b qua vic vit k t n trn cc bin nhp v xut. Trc tin ta
cn ch rng En ph thuc vo trng s wji thng qua tng gi tr nhp a i ca
nt j. Do ta c th a ra cng thc tnh cc o hm ring nh sau:
57
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
58/122
ji
j
j
n
ji
n
w
a
a
E
w
E
=
* (I.38)
T (I.35) ta c:
iji
j zw
a=
(I.39)
Nh vy suy ra:
ij
ji
n
zw
E=
(I.40)
Trong j
n
ja
E
T cng thc (I.40) ta thy rng tnh c o hm chng ta ch cn
tnh gi tr cho mi nt n v nt xut trong mng v sau p dng cng thc
(I.40).
Vi cc nt xut th vic tnh kl ht sc n gin.
Ta c:
( )k
n
k
k
n
ky
Eag
a
E
=
' (I.41)
tnh ra (I.41) ta cn tm ra cng thc tnh g(a) vy
En
.
tnh c cho c nt n, ta cn s dng cng thc tnh o hm
ring:
58
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
59/122
=
k j
k
k
n
j
n
j a
a
a
E
a
E (I.42)
Trong gi tr tng c tnh trn cc nt k m nt j kt ni n. Vic
sp xp cc nt cng nh cc trng s c minh ho trong Hnh 6.
Hnh 6: Minh ha vic tnh j cho vic tnh nt n j
Ch rng cc nt c nhn k ny c th bao gm c nt nhp v nt xut.
By gi chng ta c cng thc lan truyn ngc nh sau:
( )k
kkjjj wag '
(I.43)
Cng thc ny ni ln rng gi tr ca i vi mt nt n c th c
tnh t vic lan truyn ngc cc gi tr ca cc nt n cao hn trong mng,
nh c minh ho trong hnh 5. Bi v chng ta bit c cc gi tr ca
cc nt xut nn ta c th p dng (I.43) mt cch quy nhm tnh ra cc gi tr
cho tt c cc nt n trong mng, m khng quan tm n cu hnh ca n.
59
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
60/122
Chng ta c th tng kt li gii thut lan truyn ngc nhm tnh o hm
hm li En theo cc trng s trong 4 bc:
a vector nh p xn vo mng v lan truyn tin n trong mng s
dng (I.35) v (I.36) tm ra gi tr xut cho tt c cc nt n cng nh nt
xut.
Tnh cho tt c cc nt xut s dng cng thc (I.41)
Lan truyn ngc cc d bng cng thc (I.43) thu c cho
mi nt n trong mng.
p dng ijji
nz
wE
= tnh cc o hm.
o hm ca li tng E c th thu c bng cch l p i l p li cc bc
trn i vi trng mu trong t p hun luyn v sau tnh tng trn tt c cc
li.
Trong qu trnh tnh o hm trn chng ta gi nh rng mi nt n
cng nh xut u c chung mt hm truyn g(.). Tuy nhin iu ny hon ton
c th tnh c vi trng hp mi nt khc nhau u c cc hm truyn ring,
n gin bng cch nh du dng ca hm g(.) ng vi tng nt.
3.3.2 Hiu qu ca lan truyn ngc
Mt trong nhng c tnh quan trng nht ca lan truyn ngc chnh l
kh nng tnh ton hiu qu ca n [1].
t w l tng s cc trng s v trng ngng. Do mt php tnh hm
li (cho mt mu nhp no ) cn O(w) thao tc viw ln. iu ny cho
php s lng trng s c th ln hn s lng nt, tr nhng mng c qu t kt
ni. Do vy, hiu qu ca vic tnh ton trong lan truyn ngc s lin quan n
vic tnh gi tr ca tng trong cng thc (I.35), cn vic tnh ton cc hm
60
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
61/122
truyn th tng ph kh nh. Mi lt tnh tng trong (I.35) cn n mt php
nhn v mt php cng, dn n chi ph tnh ton ton b s bng O(w). [1]
Vi tt c w trng s th s c w o hm cn tnh ton. Vi mi ln tnh
o hm nh vy cn phi thc hin tm biu thc hm li, xc nh cng thc
tnh o hm v sau tnh ton chng theo gii thut lan truyn ngc, mi
cng vic s i hi O(w) thao tc. Nh vy ton b qu trinh tnh ton tt c
cc o hm s t l vi O(w2). Gii tht lan truyn ngc cho php cc o hm
c tnh trong O(w) thao tc. iu ny cng dn n rng c hai pha lan truyn
ngc v lan truyn tin u cn O(w) thao tc, vic tnh o hm theo cng thc
(I.43) cng cn O(w) thao tc.Nh vy gii thut lan truyn ngc lm gim
phc tp tnh ton t O(w2) n O(w) i vi mi vector nhp. V qu trnhluyn mng, d c s dng lan truyn ngc, c th cn rt nhiu thi gian, nn
vic t c hiu qu nh vy l ht sc quan trng.Vi tng s N mu luyn,
s lng cc bc tnh ton nh gi hm li trn ton b t p d liu s l N
ln bc tnh ton ca mt mu.
61
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
62/122
CHNG II: TNG TH HOT NG CA H THNG V
VN CHUN B C S D LIU
1. Tng th s hot ng ca h thng pht hin mt ngi
H thng pht hin khun mt ca n tin hnh da trn nm hot ng
chnh sau y:
Hun luyn nh khun mt v nh khng phi khun mt: y l qu
trnh hot ng ngoi tuyn ca h thng. Qu trnh hun luyn da trn
c ch my hc m c th l mng neural nhn to. Tp c s d liu
c chun ha v kch thc ca s chun c cho vo mng neural hun luyn. Kt qu ca hun luyn s cho ra b tham s ca mng. B
tham s ny s c dng cho qu trnh pht hin khun mt ca h
thng. Do nh cn pht hin khun mt l nh mu nn tp nh hun luyn
khun mt l nh mu v s c chuyn sang nh a mc xm trc khi
a vo hun luyn.
Tin x l: y l qu trnh lm gim sai khc gy ra do iu kin sngbng php cn bng lc mc xm, lc nhiuca cc nh c s
dng hun luyn mng neural cng nh hun luyn phn vng mu da.
Cc thut ton c s dng trong qu trnh tin x l ny bao gm cn
bng lc mc xm, lc thng thp.
Hun luyn phn vng mu da: y cng l hot ng ngoi tuyn ca
h thng. Phng php phn vng mu da c la chn da trn m
hnh ha mu da c tham s s dng phn phi Gaussian v trong khng
gian mu YCrCb. Qu trnh hun luyn t b c s d liu cc mu mu
da ca cc chng tc chu lc u, , M , Phi, Chu i dngKt qu
ca qu trnh hun luyn s cho ra b tham s bao gm xc sut ngng
nh nht m m hnh hc c, vector trung bnh v ma trn hip phng
62
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
63/122
sai. y l b tham s c dng tin hnh phn vng mu da nh
trc khi nh c a vo h thng pht hin khun mt.
Pht hin khun mt: y l hot trc tuyn ca h thng. Trong hot
ng ny, nh mu u vo cn pht hin khun mt trc khi pht hin
khun mt s c qua qu trnh tin x l nh lc nhiu, cn bng biu
mc xm. Sau nh c phn vng mu da v to ra mt nh nh
phn nh phn vng. nh gc sau qu trnh phn vng mu da s c
chuyn sang nh a mc xm. Cui cng, s l qu trnh pht hin khun
mt trong nh bng cch trch mi ca s ca nh theo khng gian tm
kim ca vng da c phn vng. c th pht hin khun mt ca nh
cc kch thc khc nhau, trong qu trnh ny, nh cng c x l aphn gii.
X l kt qu: Sau qu trnh pht hin, cc ca s c h thng pht
hin l khun mt trc khi cho kt qu cui cng s c x l bng mt
vi heuristic c th cho ra nhng ca s c pht hin khun mt c
tin cy cao nht.
Tng th cc hot ng ca h thng c th c m t nh s thut
ton sau y
63
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
64/122
64
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
65/122
2. Chun b c s d liu
H thng pht hin khun mt c xy da trn mng neural v phn
vng mu da, chnh v vy vic chun b d liu cho h thng ng mt vai tr
v cng quan trng, n quyt nh n hiu nng cui cng ca h thng. D
liu cho h thng y s bao gm:
D liu cho hun luyn mng neural: Bao gm tp cc d liu khun mt
v khng phi khun mt. Tp cc nh c s dng hun luyn mng.
D liu cho vic phn vng mu da: u l tp cc mu mu da ca nhiu
chng tc v chu lc trn th gii, s phong ph v chnh xc ca tp
mu ny quyt nh kt hiu qu ca qu trnh phn vng.
D liu c dng kho st v th nghim kt qu hot ng ca h
thng
2.1 D liu hun luyn mng neural
2.1.1 nh hun luyn l khun mt
nh hun luyn khun mt c s dng trong n ny l tp nh chunc ly t website ca Dr Libor Spacek:
http://cswww.essex.ac.uk/mv/allfaces/index.html. y l mt ngun nh mu
chun phong ph vi 750 nh mu 24bit kch thc 480 x 640 ca 50 ngi, mi
ngi l 15 kiu nh theo t th nhn thng hoc x dch mt lng khng ng
k. Cc khun mt cc trng thi nh bnh thng, ci, nghim ngh, eo
knh v khng eo knh, nhm mt v m mt.
Ton b 750 nh ny c s dng chun ha v kch thc ca s
25x25, y l kch thc ca s chun c chn s dng cho h thng pht
hin khun mt. iu ny cng c ngha l, kch thc ti thiu ca khun mt
c th c pht hin bi h thng l 25 x 25.
65
http://cswww.essex.ac.uk/mv/allfaces/index.htmlhttp://cswww.essex.ac.uk/mv/allfaces/index.html -
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
66/122
Hnh 8: V d v nh trong c s d liu ca Libor Spacek
lm phong ph thm cho ngun nh khun mt, sau khi nh cchun ha v kch thc 25 x 25, nh s c cho qua php i xng [8]. Nh
vy, cui cng c s d liu nh khun mt m chng ta c c l 1500 nh.
66
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
67/122
Hnh 9: V d v nh c chun ha v kch thc ca s 25 x 25 v
sau khi ly i xng
Sau khi chun ha v ly i xng, cc ca s c tin hnh tin x l.
Thc ra, qu trnh tin x l c thc hin khi nh c cho vo h thng hun
luyn mng neural. V trc khi thc hin tin x l, cc ca s nh c
chuyn sang a mc xm grayscale 24bit bng cch s dng khng gian mu
YcrCb (gi tr ca mi im nh a mc xm l gi tr sng Y ca khng gian
mu YCrCb). Sau nh c tin hnh tin x l, u tin ca s c lcnhiu bng php lc thng thp, sau tin hnh cn bng lc mc xm
lm tng tng phn trong nh [8].
tin hnh cn bng lc mc xm, y, s s dng mt chp mt
n loi b nh hng ca pixel nn kch thc 25 x 25
Hnh 10: Mt n loi b kch nh hng ca pixel nn
Nh vy qu trnh cn bng lc ch c tin hnh cho nhng pixel
nm trong vng trn mt n [8]
67
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
68/122
Hnh 11: V d nh sau qu trnh cn bng lc
2.1.2 nh hun luyn khng khun mt
C th ni vic hun luyn nh pht hin khun mt gp nhiu thch thc
l do gp kh khn trong vic biu th nh khng khun mt. Khng nhau vic
nhn dng khun mt, trong cc lp phn bit l cc khun mt khc nhau.
Hai lp gi l phn bit trong d tm khun mt l nh c cha khun mt vnh khng cha khun mt [6]. D dng ly c mu nh cha khun mt
in hnh, nhng vic ly mu nh khng cha khun mt in hnh v c gi tr
l kh hn rt nhiu. C th thy, i vi mt h thng c th, th nhng nh
khng khun mt c xem l c gi tr nht khi n b pht hin nhm l nh
khun mt. Trong n ny, do u vo l cc nh mu, v hn na nh trc
khi c pht hin khun mt c cho qua b phn vng mu da, chnh v vy,nhng nh khng khun mt c gi tr thng thng l nh c cha vng c mu
tng t mu da. Chnh v vy, tp nh khng khun mt c mu tng t mu
da, c bit l tp nh c cha b phn c th con ngi nh tay, chn, cng nh
cc b phn trn khun mt l ng ch nht.
Tuy nhin m bo tnh tng qut ca h thng, tp nh khng khun
mt c chun b khng ch c nhng nh c mu tng t mu da m l tp
nh t nhin bt k. Nh nh hoa l cy c, nh ca.
Trong n ny, qu trnh hun luyn nh khng khun mt bao gm
hun luyn th ng v hun luyn ch ng c hc. Hun luyn th ng c
ngha l hun luyn khng khun mt t tp nh to sn. Cn hun luyn ch
ng c hc l tin hnh cp nht nhng ca s b pht hin nhm l khun mt
68
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
69/122
vo c s d liu nh khng khun mt. Ton b qu trnh hun luyn ny s
c cp n trong chng III ca n. Trong phn ny, ch cp n c
s d liu to sn ban u, nh l mt bc chun b cho qu trnh hun luyn
nh khng khun mt th ng.
Tp nh ban u ny bao gm hai phn v cha khong 200 ca s. Trong
, 100 ca s c to ngu nhin t mt s bc nh t nhin khng cha mt
ngi. 100 nh cn li l tp cc nh c trch chn th cng t cc tp nh c
sn. Nhng ca s ny tp trung vo nhng vng tong t mu da, cc b phn
c th con ngi cng nh b phn ca khun mt. 200 nh ny sau qu trnh
trch chn cng c tin hnh lc nhiu v cn bng lc xm.
Hnh 12: Hnh minh ha cc ca s c trch chn ngu nhin trong c s
d liu nh hun luyn khng khun mt.
Bn cnh tp 200 nh to sn ny, chng ta cng chun b sn khong 50
bc nh c s dng tin hnh hun luyn ch ng c hc cho nh khng
khun mt .y l ngun nh c ly bt k trn mng Internet. 50 nh ny l
69
-
8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da
70/122
tp cc nh mu kch thc 480 x 360, l cc nh tp th, gia nh, t nhin. Tp
50 nh ny cng c tin hnh lc nhiu v cn bng lc xm.
Hnh 13: V d v nh dng hun luyn ch ng nh khng khun mt
2.2 nh hun luyn phn vng mu da
M hnh phn vng mu da c s dng da trn m hnh c tham s
da trn phn phi Gaussian, s dng trong khng gian mu YCrCb.
c th hc tt v to ra b tham s hiu qu, cc mu mu da c
trch chn phi l nhng mu in hnh, bao gm tt c cc mu da ca cc chu
lc, chng tc. ng thi phi l mu da thc, khng phi mu da c trang
im hay x l bng k thut x l nh.
Ton b mt trm mu mu da c trong c s d liu ca n u c
trch chn th cng t nhiu bc nh tm kim trn Internet. Cc mu mu da
ny bao gm kh y cho cc chng tc chu lc u, , M, Phi