HA thAng phát hiAn khuôn mAt dAa trên mAng neural và phuong pháp vân vùng màu da

download HA thAng phát hiAn khuôn mAt dAa trên mAng neural và phuong pháp vân vùng màu da

of 122

Transcript of HA thAng phát hiAn khuôn mAt dAa trên mAng neural và phuong pháp vân vùng màu da

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    1/122

    TM TT

    Pht hin khun mt l mt vn c bn trong ngnh hc quan st bng

    my tnh. L mt trong nhng giai on ca h thng nhn dng mt ngi cng

    vi nhiu ng dng rng ri v ph bin khc nh ch s ha ni dung trong

    nh, h thng gim st, hi tho truyn hnh, pht hin khun mt v ang

    dnh c s quan tm nghin cu ca nhiu ngi trong sut hai thp k qua.

    Tuy nhin, vi nhng thch thc rt ln gy ra do tnh bin ng ca mi trng

    cng nh tnh bin i cao ca khun mt, pht hin mt ngi vn ang l mt

    trong nhng vn m i vi cc nh nghin cu. V cho n nay vn cha c

    mt phng php no thc s gii quyt ht cc thch thc ca pht hin khunmt. Nhiu ci tin, nhiu xut c a ra nhm ci thin cht lng pht

    hin khun mt. V mt trong nhng ci tin l da trn nhng c im bt

    bin hoc c s bin ng c th phn vng c ca khun mt m mu da ca

    con ngi chnh l mt trong nhng c im .

    Xut pht t tng kt hp gia mu da v mt phng php pht hin

    khun mt hiu qu, n tp trung xy dng mt h thng kt hp gia hthng pht hin khun mt da trn mng neural v phng php phn vng

    mu da da trn m hnh mu da c tham s s dng phn ph Gaussian.

    H thng pht hin c xy dng v c bn c nguyn tc hot ng

    theo m hnh mng neural kinh in. l m hnh mng neural Perceptron a

    lp, s dng thut ton lan truyn nguc v phng php gim gradient hc

    mng. V c bn kin trc mng neural xy dng khng c g thay i, tuy

    nhin, y chng ta s ci tin kin trc mt im vi vic s dng thm m

    hnh xc sut da trn l thuyt Bayes c th c s mm do hn trong vic

    nh gi kt qu cui cng ca mng. Ngoi ra, n cng nu ra mt chin

    thut hun luyn hp l, cho php hun luyn nhanh m vn m bo c tnh

    1

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    2/122

    tng qut v hiu qu ca mng. l chin thut hun luyn mng ch ng c

    hc.

    Phng php phn vng mu da c kt hp vo h thng nh l mt

    gii hn cho php gim khng gian tm kim, tc l khun mt s ch c tm

    kim trn cc vng mu da. Vic phn vng ny gip cho thi gian pht hin

    ca h thng ci thin ng k, hn na n cn gip cho h thng hot ng hiu

    qu hn.

    gip cho kt qu pht hin c r rng v cht lng, n cng

    nu ra cc heuristic c th ph hp cho h thng, Nhng heursitic ny da trn

    kt qu thc t cng nh thng k ca qu trnh hun luyn v kim th h

    thng. n vi tn gi l H thng pht hin khun mt da trn mng

    neural v phng php vn vng mu dac b cc lm nm mc chnh.

    Chng I: Gii thiu L chng gii thiu, bao gm ba phn nh.

    Phn u l tng quan cc hng tip cn, cc phng php pht hin mt ngi

    c xut. Phn hai l tng quan cc phng php phn vng mu da datrn tnh cht im nh. Qua phn ny vi nhng nh gi cc phng php s

    gip chng ta chn c phng php phn vng ph hp cho h thng. Phn

    ba s l c s l thuyt c bn nht v mng neural MPL v thut ton lan truyn

    ngc. y l kin trc mng v thut ton s c s dng cho h thng mng

    neural ca n.

    Chng II:Tng th hot ng ca h thng v vn chun b c s

    d liu y l chng miu t m hnh thut ton hot ng tng th nht ca

    h thng s c xy dng. ng thi s cp vn chun b v tin x l

    cho cc tp c s d liu oc dng hun luyn mng neural cng nh luyn

    tp phn vng mu da. y l mt trong nhng cng vic quan trng quyt nh

    n cht lng ca h thng.

    2

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    3/122

    Chng III: Pht hin khun mt da trn mng neural v phng

    php phn vng mu da y l chng quan trng nht ca n. N s

    miu t y kin trc h thng c xy dng. Thut ton v phng php

    hun luyn mng neural. Thut ton v phng php hun luyn phn vng mu

    da. V s xut ra nhng heuristic gip ci thin cht lng pht hin v thi

    gian chy ca h thng.

    Chng IV: Phn tch thit k v ci t chng trnh

    Chong V:Kho st thc nghim v nh gi chng trnh y l

    chng s miu t kt qu vic kim th chng trnh da trn b test chun v

    b test t to. ng thi s c nhng nh gi v nhn xt v kt qu ca

    chng trnh.Kt lun v hng pht trin

    Trong phm vi bi n, vi vic h thng c xy dng trn mt mng

    neural n l, v vy em tin hnh hun luyn cho mng nhn bit nhng

    khun mt vi t th nhn thng (frontal), c nghing v gc quay khng

    ng k. Cc khun mt c th c nhiu trng thi khc nhau. Cc nh cdng kim th bao gm c nh chn dung v nh tp th. nh khng v c

    nhiu (t thm) kim tra thm v tnh hiu qu ca h thng. Cc nh c

    kim th c kch thc bao gm 240 x 180, 320 x 240, 480 x 360 im nh.

    Vi b test bao gm 300 nh chn dung kch thc 320 x 240; 320 nh

    ny oc thm nhiu, 320 nh ny c thu nh li kch thc 240 x 180

    kim tra h thng c th pht hin cc khun mt c kch thc khc nhau, 320

    nh ny c thm nhiu.

    Ngoi tp nh chn dung chun ra, chng trnh cn test vi 100 nh tp

    th t to vi nhiu mc ch khc nhau. 100 nh ny cng c thm nhiu

    tin hnh kim th.

    3

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    4/122

    CHNG I: GII THIU

    1. Tng quan v cc phng php pht hin mt ngi

    1.1 Pht hin mt ngi v ng dng

    Nhn bit i tng ni chung v nhn bit mt ngi ni ring l bi

    ton c bn v quan trng trong lnh vc quan st bng my tnh. Nhn bit mt

    ngui thu ht s tp trung nghin cu ca nhiu nh nghin cu trong sut nhiu

    thp k qua. Tuy nhin vn cha c mt hng tip cn no thc s trn vn

    mang li hiu qu v gii quyt ht cc thch thc v tnh hung trong vn pht hin mt ngi, nguyn nhn l do tnh bin i cao ca khun mt con

    ngi. Chnh v vy, y vn l vn m v tip tc thu ht s nghin cu su

    hn vi cc k thut mi c xut. Cc k thut c p dng c th chia

    thnh mt trong hai tip cn: so snh s ph hp vi cc m hnh hnh hc hai,

    ba chiu vo nh, hay phng php so snh s ph hp cc m hnh khung nhn

    vo nh c cha khun mt cn nhn bit. Cc nghin cu trc y cho thyrng cc hng php da trn khung nhn c th nhn bit cc khun mt thng

    trong nn phc tp mt cch hiu qu.

    Vi mc ch tn dng nhng u im ca cc k thut uc xut,

    kt hp chng li c th xy dng uc mt h thng pht hin mt ngi

    mt cch hiu qu. n tp trung vo vn pht hin mt ngi trong nh

    mu tnh, nhm kt hp nhng c trng ca mt ngi trong nh mu c th l

    s dng k thut phn vng mu da ngi trong nh mu kt hp vi hng tip

    cn da trn khung nhn vi mc ch s dng mng neural nhn to - mt

    phng php tuy kinh in nhng vn rt m v cha ng nhiu u im trong

    vn nhn dng, xy dng h thng pht hin mt ngi.

    4

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    5/122

    K thut phn vng da ngui trong nh mu c p dng trong h thng

    nhn bit mt ngi vi mc ch cui cng l gim khng gian tm kim mt

    ngi trong nh, gip cho hiu nng hot ng ca h thng c nng cao hn.

    Cn u im ni bt ca mng neural nhn to ni ring v phng tip cn da

    trn my hc ni chung trong vic pht hin mt ngui l c th miu t v

    pht hin khun mt trong nhiu tnh hung khc nhau. Nhng tnh hung gp

    phi khi pht hin khun mt bao gm:

    T th ca khun mt (Pose): Khun mt l nghn thng (frontal),

    nghing mt phn (partial profile) hay nghing hon ton (full profile).

    Khun mt hng thng ng (upright) hay l khun mt xoay mt gc

    no (rotate) Ni dung khun mt: Khun mt cha y cc c trng nh mt,

    mi, ming, tai hay thiu mt vi c trng no .

    Trng thi ca khun mt: chnh l trng thi tnh cm ca khun

    mt nh cui, khc, tc gin

    y l nhng tnh hung m cc hng tip cn khc phi mt nhiu cng

    sc v phc tp c th miu t c. Nhng vi mng neural, thng qua tpmu v qu trnh hun luyn mng hiu qu, kt qu mang li l c th rt kh

    quan.

    ng dng

    Cng ngh nhn bit mt ngi c s ng dng rng ri trong thc t.

    Trong nhn dng sinh trc hc, trong hi tho truyn hnh, trong ch s ho nh

    v c s d liu video, trong tng tc ngi my. Nhn bit mt ngi l giai

    on u trong h thng nhn dng mt ngi.

    Hai bi ton nhn bit v nhn dng i tng c lin quan mt thit. H

    thng nhn dng i tng c th xy dng m khng c tp b nhn bit i

    tng, mi b nhn bit pht hin mt i tng quan tm. Tng t, b nhn

    5

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    6/122

    bit i tng c th c xy dng m khng c h thng nhn dng i tng;

    b nhn dng i tng ny cn phn bit i tng mong mun vi mi i

    tng khc c th xut hin hay l lp i tng cha bit. Do hai bi ton l

    nh nhau, d trong thc hnh hu ht cc h thng nhn dng i tng t khi

    gii quyt nn tu , v cc h thng nhn bit i tng t khi c hun luyn

    trn loi i tng xy dng h thng nhn dng. im ch trng khc

    nhau ca cc bi ton ny dn n cc trnh by v thut ton khc nhau.

    Thng thng, cc h thng nhn dng khun mt lm vic bng cch

    trc ht p dng b nhn bit khun mt nh v khun mt, sau p dng

    thut ton nhn dng nhn din khun mt.

    1.2 Cc thch thc trong vn pht hin mt ngi

    Vic nhn bit i tng l bi ton xc nh ca s con ca nh c thuc

    v tp cc nh ca i tng quan tm hay khng. Do , ng bin quyt nh

    ca tp nh i tng phc tp s lm tng kh ca bi ton v c th tng s

    li nhn bit. Gi s ta mun pht hin khun mt nghing trong mt phng nh,

    ngoi cc khun mt thng. Vic thm cc khun mt nghing vo tp cc nh tamun nhn bit lm tng bin thin ca tp, v c th lm tng phc tp

    ca ng bin quyt nh ca tp nh. phc tp ny lm bi ton nhn bit

    kh hn. Vic thm nh mi vo tp nh i tng c th lm ng bin quyt

    nh n gin hn v d hc hn. C th tng tng iu ny l ng bin

    quyt nh c lm trn bng vic thm cc nh vo tp. C nhiu ngun bin

    i trong bi ton nhn bit i tng, v c th trong bi ton nhn bit khun

    mt. C cc ngun bin i sau [6]:

    Bin i trong mt phng nh: loi bin i nh khun mt n gin

    nht c th c biu din c lp vi khun mt, bng cch quay, dch

    chuyn, bin i t l v ly i xng nh.

    6

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    7/122

    Bin i sng v ng cnh: bin i do i tng v mi trng gy

    ra, c th cc thuc tnh b mt ca i tng v cc ngun sng. Cc thay

    i v ngun sng ni ring c th bin i hon ton v b ngoi ca

    khun mt.

    Bin i nn: Nhiu nh nghin cu cho rng vi k thut nhn dng mu

    hin nay, tip cn da trn khung nhn nhn bit i tng ch thch

    hp cho cc i tng c ng bin nh c th d on c. Khi i

    tng c hnh dng d on c, ta c th trch ra window ch cha cc

    pixel bn trong i tng, v b qua nn.

    Bin i hnh dng: vi khun mt, loi bin i ny bao gm biu l

    tnh cm khun mt, ming v mt m hay ng, v hnh dng khun mtca tng ngi.

    1.3 Cc vn lin quan n pht hin mt ngi

    Bn cnh vn pht hin mt ngi, c nhiu vn khc c quan hmt thit vi pht hin mt ngi m nhiu khi gy ra nhm ln nu khng c

    tm hiu mt cch k cng.

    Nhng vn bao gm [7]

    nh v khun mt hay xc nh v tr khun mt: y l vn rt

    gn vi vn pht hin mt ngi. Nu nh pht hin mt ngi trong

    nh l phi tr li cc cu hi c tn ti khun mt trong nh hay khng ?

    Nu tn ti th tn ti bao nhiu khun mt? V tr ca khun mt u ?

    Th vn nh v mt ngi ch tr li cho cu hi v tr mt ngi u

    trong mt nh bit trc l c mt mt ngi . Nh vy c th thy,

    nh v khun mt l mt phn cng vic ca pht hin mt ngi.

    7

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    8/122

    Pht hin cc c trng ca khun mt: y l vn cng rt gn vi

    vn nh v khun mt. N cng gi thit rng ch c mt khun mt

    trong nh. V vic pht hin c trng khun mt l tm ra v tr ca cc

    c trng nh i mt, mi, ming, mi, tai

    Bm st khun mt: Mc ch ca vn ny l c lng lin tc s

    thay i v v tr v hung ca khun mt trong mt chui nh thi gian

    thc.

    Nhn bit trng thi khun mt: Mc tiu ca vn ny l nhn bit

    trng thi ca khun mt con ngi (hnh phc, tc gin, au kh). y

    l vn rt kh v th v v trng thi khun mt ca tng ngi c th l

    rt khc nhau trong cng mt trng thi tm l. Nhn dng khun mt: Trong vn ny, chng ta phi i snh khun

    mt cn nhn dng vi cc khun mt c sn trong th vin v tm ra

    nhng thng tin cn thit v khun mt cn nhn dng nu n c c trng

    tng ng vi khun mt no trong th vin.

    Thm tra v xc minh khun mt: y l vn nm trong vn nhn

    dng khun mt. Thng thng sau khi nhn dng khun mt, ngi taphi tin hnh mt giai on na gi l thm tra v xc minh tnh ng

    n ca khun mt c nhn dng. N cho php tng s ng n ca

    vn nhn dng khun mt.

    Trong nhng vn nu trn, c th thy nhn bit khun mt v nhn

    dng khun mt l hai vn c bn v c th cha ng cc vn cn li. V

    thng thng, nhn bit khun mt s l giai on u ca h thng nhn dng

    khun mt. S khc nhau c bn gia pht hin khun mt vi nhn dng khun

    mt l: Nu nh nhn dng khun mt l phn bit nhng khun mt khc

    nhau trong tp danh mc cc khun mt, cn nhn bit khun mt l phn lp

    uc u l danh mc cc khun mt v u l danh mc cc nh khng phi

    khun mt.

    8

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    9/122

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    10/122

    10

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    11/122

    Hnh 1: S cc hng tip cn v phng php pht hin mt

    ngi

    1.4.1 Hng tip cn da trn c trng ca nh (Feature-based

    approaches)

    Phng php tip cn da trn c trng ca khun mt c chia thnh

    ba vn . Gi s cn phi pht hin mt khun mt trong mt nn nh ln xn,

    phn tch mc thp (low-level analysis) thc hin phn on cc c trng ca

    nh da trn nhng thuc tnh ca im nh nh xm hay mu sc. S phn

    on lc ny cn mp m v cha r rng. Vn th hai l phn tch c trng,

    cc c trng ca nh c t chc thnh cc c trng khun mt c tnh tng

    qut hn da trn c tnh hnh hc ca khun mt. Sau giai on ny, tnh mpm ca cc c trng ca nh c gim bt, ng thi, v tr khun mt

    cng vi cc c trng khun mt c xc nh. Tip theo s l vic s dng

    m hnh hnh dng (active shape models). Nhng m hnh ny bao gm t m

    hnh dng rn (snakes - c xut vo nhng nm 80) cho ti m hnh phn

    tn im (PDM Point Distributed Model) c xut vo nhng nm gn

    y trch chn c trng c s bin ng phc tp nh mt, mi,

    1.4.1.1 Phn tch mc thp (Low-level analysis)

    Ngi ta gi l phn tch mc thp v vic phn tch y l phn tch da

    trn cc c trng rt c bn v mang tnh trc quan, nhng c trng bao

    gm bin nh, thng tin a mc xm, mu sc, chuyn ng, tnh i xng ca

    khun mt.

    1.4.1.1.1 Bin nh (Edges)

    y l mt c trng c bn nht trong cc ng dng v x l nh, s

    dng bin pht hin khun mt c thc hin u tin bi Sakai. Da trn

    vic phn tch cc ng nh ca khun mt, vi mc ch l nh v nhng c

    11

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    12/122

    im trn khun mt. Mt m hnh c xut tm ra nhng ng nt ca

    mt ngi. Cng vic tm ra hnh dng ca mt ngi c trin khai bao gm

    mt ng cong bm st vo khun mt vi mt cong xc nh v rng buc

    trnh s nh hng ca cc nhiu bin. Nhng c tnh ca ng trong hnh

    dng ca u ngi sau c a ra phn tch c trng s dng nt v

    v tr ca khun mt. K thut d tm da vo ng bin ny cn c p dng

    pht hin cp knh trn khun mt.

    Trong hng tip cn pht hin mt ngi da vo ng bin, nhng

    ng bin cn c gn nhn v c ph hp vi m hnh khun mt c

    sp xp c th gip chng ta xc minh s ng n ca vic pht hin .

    Ngi ta c th thit lp s gn nhn bin bng cc s dng mt tri, ngtc hoc mt phi ca khun mt. Vic gn nhn ny lm cho kh nng pht hin

    chnh xc khun mt trong mt bc nh vi khng gian phc tp v c nhiu

    khun mt.

    Mt trong nhng phng php c bit n l phng php gn nhn

    ca Govindaraju, phng php ny s dng h s vng ca khun mt l tng ,

    l h s gia di v rng ca khun mt:

    (I.1)

    S dng phng php ny, ngi ta kim th 60 nh c nn phc tp

    bao gm 90 khun mt th thy kh nng h thng c th pht hin chnh xc l

    76% vi mc trung bnh l sai 2 mt li / nh.

    1.4.1.1.2 Thng tin a mc xm (Grayscale Information)

    Bn cnh ng bin, th thng tin v mc xm trong khun mt cng c

    th c xem nh l mt c trng. Nhng c trng khun mt nh l lng

    my, ng t hay, mi thng xut hin vi mc xm ln hn nhng thnh phn

    12

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    13/122

    ph cn bao quanh chng. Tnh cht ny c th c khai thc phn bit cc

    thnh phn khc nhau ca khun mt. Nhng thut ton trch chn c trng

    khun mt gn y thng da vo mc xm nh nht trong mt vng khun

    mt. Trong nhng thut ton ny, bc nh u vo u tin c ci thin bng

    vic lm tng tng phn v bin hnh mc xm (gray-scale morphological)

    c th tng ti ca nhng vng ni trn, t vic nhn bit s d dng

    hn. Nhng vng ti ny c trch chn bng php ly ngng di. Bn cnh

    , ngi ta tin hnh xy dng h thng t ng tm kim cc vng ti thuc

    mt thng qua s phn tch v mu sc. H thng s dng mt mu mt gn

    trng s xc nh cac v tr c th c ca cp mt.

    1.4.1.1.3 Mu (color)

    Trong khi thng tin v mc xm c xem l mt c trng c bn ca

    nh, mu sc c ngha nhiu trong vic nhn bit s xut hin ca i tng.

    Mt trong nhng khng gian mu c bit n rng ri nht l khng gian

    RGB, l khng gian m mi mu c nh ngha bi s kt hp ca ba

    thnh phn mu l Red, Green v Blue. Do s thanh i ch yu trong musc ca da l do s thay i v chi, thng thng cc mu RGB c coi

    trng hn, do , nh hng ca chi c th c lc b. Ngi ta c th

    chun ha cc thnh phn mu t RGB thnh rgb nh sau:

    (I.2)

    13

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    14/122

    T h thc trn chng ta c th thy rng r+g+b = 1. Vic chun ha mu

    ny c ngha l, ch cn vit hai trong s ba gi tr trn l chng ta c th tm ra

    gi tr cn li. Trong vic phn tch mu sc ca da, mt biu mu da vo r

    v g ch ra rng mu ca khun mt tp trung thnh mt cm nh trong biu

    mc xm. so snh thng tin mu ca mt pixel vi gi tr ca r v g trong

    cm trn, v t to ra kh nng cc pixel thuc vng da ca mt c th c

    tm ra.

    Bn cnh m hnh RGB, chng ta cn c mt vi m hnh mu khc c

    s dng trong vic nghin cu vn nhn dng mt ngi. M hnh HIS l mt

    v d, m hnh ny c nhng u im so vi cc m hnh khc trong vic mang

    li s phn bit r rng gia cc cm mu ca cc c trng khun mt. Do m hnh ny thng c s dng cho cng vic trch chn c trng ca khun

    mt nh mi, mt, lng my. Do vic ny c quan h cht ch vi vic cm th

    mu sc con ngi, n cng c s dng ph bin trong cc s phn vng

    khun mt.

    Mt m hnh khc c bit n trong vic p dng nhn dng khun

    mt l m hnh YIQ. chuyn i t khng gian mu RGB sang khng gianYIQ, chng ta thy c thnh phn I, l khong mu t cam (orange) -> xanh

    l (Cyan), ging nh khong mu ca da ngi chu . Vic chuyn i ny

    cng nh hng ti vic trit tiu nn cc mu khc v cho php nhn bit nhng

    khun mt nh trong mt mi trng t nhin. Cc m hnh mu khc cng

    c p dng cho vic nhn bit mt ngi cn c HSV, YES, YCrCb, YUV,

    CIE-xyz, L*u*v, CSN v UCS(Farnsworth).

    Vic phn vng mu c th c thc hin bng vic s dng cc ngng

    xp x mu khi mu da c m hnh ha thng qua biu mc xm. Phng

    php phc tp hn l s dng phng php tnh ton thng k, s thay i

    khun mt ca m hnh l trong mt ph rng. Ngi ta tin hnh s dng

    phn phi Gaussian tp hp hng ngn mu mu ca da t cc loi khc nhau.

    14

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    15/122

    Phn phi Gaussian c c trng bi vector trung bnh v ma trn hip

    phng sai . Mu ca im nh t nh u vo c th c so snh vi mu

    da ca m hnh bng cch tnh h s khong cch Mahalanobis. H s ny s cho

    bit tng ng ca mu pixel vi mu da ca m hnh.

    Mt u im ca m hnh mu da vo phng php thng k l s sai

    khc v mu ca nhng i tng mi c th c ph hp vo m hnh bng

    phng php hun luyn. S dng phng php ny, s nhn bit mu c th s

    hiu qu hn, chng li s thay i ca cc nhn t mi trng nh l iu kin

    chiu sng v c tnh ring ca my nh.

    1.4.1.1.4 Chuyn ngNu nh chng ta pht hin khun mt cho video, khi thng tin v s

    chuyn ng, c ch, dng iu c ngha rt ln trong vic xc nh i tng

    chuyn ng. Cc chuyn ng lin tc k nhau c phn chia bng vic phn

    tch cc frame khc nhau. Hng tip cn ny, ni chng l kh n gin, c

    h tr phn bit mt chuyn ng cn cnh v c hiu qu khng ph thuc

    iu kin ni dung bi cnh. Bn cnh vng mt, ngi ta cn tin hnh thchin trn nhiu frame khc nhau nh v cc c trng ca khun mt. Nh l

    trng thi ca i mt bng cch tnh ton ln v chiu ngang v chiu dc

    gia nhng vng lin tip nhn c trong cc frame khc nhau.

    Mt cch khc c th tnh ton cc chuyn ng trc quan l thng

    qua vic c lng s chuyn ng ca cc ng vin ca nh. So snh cc

    frame khc nhau, kt qu c c t s chuyn ng ca cc ng vin l c

    th tin cy, c bit l khi chuyn ng l khng quan trng. Mt b lc

    Gaussian c tnh khng gian v thi gian c s dng bi h thng McKenna

    pht hin chuyn ng ca vng bao khun mt cng nh vng bao ton b

    c th con ngi. Tin trnh ny yu cu gi tr mc xm ca nh I(x,y) vi mt

    15

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    16/122

    ton t bin ph thc thi gian m(x,y,t) c nh ngha t b lc Gaussian

    G(x,y,t) nh sau:

    (I.3)

    Trong u l h s thi gian, a l rng b lc. Ton t bin ph thuc

    thi gian sau c nhn chp vi cc frame ca nh theo bi cng thc:

    (I.4)

    Kt qu ca tin trnh x l min thi gian ny S(x,y,t) s cho ta mt ch

    s trc tip ca s chuyn ng bin trong I(x,y,t).

    Mc d phng php ny miu t vic nhn bit bin v vng chuyn

    ng, nhng chng cng cho php chng ta tin vo s chnh xc ca vic clng tc ca chuyn ng lung sng hay cn gi l lung quang (optical

    flow). Bi v vic c lg ny da trn cc mu chuyn ng trong mt khong

    ngn, v c cm gic nh chuyn ng l rt trn v mn. Da vo thng tin

    ca chuyn ng, khun mt chuyn ng trong nh tun t c phn vng.

    Lung quang c m hnh bi lung nh vi phng trnh rng buc sau y:

    (I.5)

    Trong , Ix, Iy v It l cc o hm min thi gian ca cng nh v

    Vx v Vy l tc chuyn nh. gii phng trnh trn cho Vx, Vy, mt vng

    bao gm cc im nh chuyn ng theo mt qu o c ghi nhn. Nhng

    16

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    17/122

    vng p ng ti nhng qu o chuyn ng khc nhau c phn lp trong

    vng chuyn ng v vng khng chuyn ng.

    1.4.1.1.5 Tiu chun suy rng (Generalized Measure)

    Nhng c trng trc quan nh ng bin, mu sc hay chuyn ng l

    giai on u tin trong h thng quan trc con ngi. Qu trnh ny cho php

    nhng thng tin trc quan c t chc li thnh nhng nhm hot ng mc

    cao. Da vo vic quan st, Reisfeld xut rng mt h thng quan st bng

    my nn c bt u vi vic tnh ton mc thp giai on tin tp trng cc

    tnh cht nh c tng hp. Ban u, Reisfeld v Yeshurun gii thiu mt

    ton t i xng tng qut da v ton t im bin. Do nhng c trng cakhun mt c tnh i xng mt cch t nhin. Khi thc hin, ton t i xng

    ny s tnh ton v gn cho mi im nh mt cng gi l cng im

    nh da trn mc nh hng ca vng bao im d. Cng i xng ,

    M(p), cho mi im nh c xc nh bng:

    (I.6)

    Trong , C(i,j) l mc nh hng ca vng bin im i,j (ca pixel)

    trong tp cc pixel c nh ngha bi (p). N c xc nh theo cng thc:

    (I.7)

    Trong , D(i,j) l hm h s di, P(i,j) l hm h s phase, ri v rj c

    xc nh theo cng thc di y:

    17

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    18/122

    (I.8)

    Trong pk ch im (xk, yk) vi k = 1K, l gradient ca cng ti im pk,ij l gc theo chiu ngc kim ng h gia ng thng qua pi v

    pj so vi mt ngang. Hnh di y miu t mt v d v cch tnh M (p) t

    gradient ca mtj trc nh mt ngi. Cng i xng c tham chiu mt

    cch r rng th hin s nh v cc c trng ca khun mt nh l mt v

    ming.

    1.4.1.2 Phn tch c trng (Feature analysis)

    Nhng c trng c to ra t qu trnh phn tch mc thp thc ra l

    khng r rng. Qu vy, trong vic nh v vng mt s dng m hnh mu da,

    cc i tng c cng mu nn tng t nh mu da c th cng c nhn bit.

    iu ny c th c gii quyt bng vic phn tch mc cao. Trong nhiu k

    thut nhn bit khun mt, nhng tch ly hiu bit hnh thi v khun mt s

    c p dng c th c tnh ha v xc minh li nhng c trng t

    nhng trng thi mp m. C hai hng tip cn trong ng dng v hnh thi

    khunn mt. Hng tip cn u tin lin quan n chin lc truy tm c trng

    da vo mi quan h v v tr da cc c trng. Nhng c trng c nhn

    bit nh cc c trng tn ti. K thut th hai s dng k thut nhm c

    18

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    19/122

    trng thnh cc chm sao bng cch s dng mt s m hnh khun mt khc

    nhau.

    14.1.2.1 Tm kim c trng

    Vic truy tm cc c trng ca khun mt l truy tm cc c trng ni

    bt ca khun mt bng cch da vo hnh thi ca chng. Vic truy tm ny da

    vo mi quan h da cc c trng v khong cch hnh hc, v tr trong

    khun mt.

    Nhiu thut ton, m hnh c xy dng cho cng vic ny. De Silva

    l mt thut ton tiu biu. M hnh ca Jeng cng l h thng pht hin c

    trng c bit n rng ri. Trong h thng ny, vic khi to s c xc nhbng vic nh v v tr ca i mt trong bc nh. T vic xc nh i mt, qu

    trnh s truy tm cc c trng khc nh mi, ming v ng t. Mi c trng

    sau khi truy tm u thit lp cc hm quan h vi cc c trng khc, iu ny

    gip cho vic xc nh khun mt c th tin cy hn, cc hm quan h ny chnh

    l cc h s c miu t nh trong ng thc di dy:

    (I.9)

    Bn cnh , nhiu h thng truy tm c trng cng c xut nh h

    thng GAZE ca Herpers da vo s chuyn ng ca mt trong h thng trc

    quan con ngi HVS. im ct yu ca h thng l thut ton nh v cc c

    trng ni bt. Mt thut ton a mc s dng b lc a hng Gaussian.

    1.4.1.2.2 Phn tch chm sao

    Mt vi thut ton cp n trong phn trn c tin cy ph thuc vo

    mc t ng n v thng tin c tm ra t cc tp m hnh nh mt vi di

    nhng iu kin c nh. Nu nh khi iu kin khng cn tha mn, nh l

    nh v khun mt trong mt bi cnh phc tp, nhiu thut ton c th khng

    19

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    20/122

    cn chnh xc. V vy vn t ra l lm th no chng ta c th nhm cc

    c trng khun mt li thnh tng chm vi nhng tham s i din chung

    nht, phn nh c ht cc trng hp xy ra ca cc c trng, bng vic s

    dng phng php m hnh ha hiu qu nh l phng php phn tch thng

    k.

    Nhiu phng php nhm thnh cc chm sao c xut. Trong

    ni bt l phng php s dng l thuyt nt thng k t b lc a cp

    Gaussian. Mt m hnh thng k trong min khng gian ca cc c trng khun

    mt cho php pht hin mt cch linh hot hn. Thut ton h tr vic qun l s

    thiu ht c trng cng nh cho php s dng cc h s m rng. Mc thnh

    cng ca m hnh ny l 84% khi nghin cu tp 150 bc nh. Vic pht hin saic xc nh l do h s ph thuc ca c trng u.

    M hnh thng k cho nh c s xut hin nhiu khun mt cng c

    xut, trong m hnh ny, cc khun mt c phn lp thnh tng nhm vi

    nhng c trng chung nht. Nhng nhm ny li c phn lp tip trong cc

    thnh phn c trng khun mt. Sau khi c trng ny nhn c t vic x l

    mc thp. Vic nhm c trng ny c tc dng gim bt sai s c trng sinh rado nh hng ca bi cnh hn tp. Mt mng theo lut Bayesian s c h tr

    kt hp vi vic pht hin ring cho tng nhm c trng c th chc chn

    rng gi thuyt v s ng n ca khun mt c c s tin cy vi mc

    cao.

    H thng s dng phng php ny ni ting nht l h thng ca Maio v

    Maltoni. Trong h thng ny nh u vo c chuyn i trc tip bng cch

    s dng mt ton t gradient c ca s 7*7. T nh chuyn i trc tip ny,

    ngi ta p dng hai giai on nhn bit khun mt. nh c nhn bit s c

    khoanh vng trong mt hnh ellipse. H thng ca Maio v Maltoni l h thng

    thi gian thc vi mc pht hin khi test l 69/70 bc nh m khng b mt

    li no.

    20

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    21/122

    1.4.1.3 Cc m hnh hnh dng tch cc (Active shape models)

    y l m hnh thi gian thc hiu qu v l thnh tu quan trng ca

    hng tip cn da vo phn tch c trng. M hnh da vo tnh cht vt l

    tht s v s xut hin mc cao ca cc c trng. M hnh ASM tng tc vi

    cc c trng nh cc b (bin, sng) v dn dn lm bin dng nt ca

    c trng . Co ba dng ca m hnh ASM ang c nghin cu. u tin l

    m hnh s dng mt ng i kch hot (active contour) gi l snakes (dng

    con rn). M hnh th hai l m hnh da vo cc dng mu bin i

    (deformable templates) cho php thc hin hiu qu hn m hnh snakes. M

    hnh th ba l m hnh Smart snakes (con rn hot thng minh) v PDM (mhnh phn b im). M hnh ny da trn tp cc im c gn nhn v ch

    cho php bin i theo mt vi hnh dng da trn qu trnh hc.

    1.4.1.3.1 M hnh dng con rn (Snake)

    c s dng xc nh ng bao ca u. thc hin vic ny, mt

    con rn ban u c khi to ti mt vng ln cn xung quanh vng bin u.Sau co dn v pha cc ng bin v a ra hnh dng gi nh ca vng

    u. S tin ha ca con rn oc thc hin thng qua vic cc tiu ha mt

    hm nng lng dng Esnake (tng t nh trong vt l) v c biu din nh

    sau:

    Esnake = Ebn trong + Ebn ngoi (I.10)

    Trong Ebn trong v Ebn ngoi ln lt l cc hm nng lng bn trong v

    bn ngoi. Nng lng bn trong l phn nng lng ph thuc v cc thuc tnh

    bn cht ca con rn v to nn s tin ha t nhin ca ng bin ng. Cc

    tin ha t nhin v in hnh ca con rn l s co ngn v s m rng. Trong

    21

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    22/122

    khi , nng lng bn ngoi c khuynh hng chng li nng lng bn trong

    v lm cho cc ng bin ng sai lch so vi tin ha t nhin thm ch tha

    nhn hnh dng ca cc c tnh gn nht l hnh dng ca vng u khi trng

    thi cn bng.

    Hai vn chnh cn quan tm trong vic p dng m hnh con rn l la

    chn cch tnh nng lng chnh xc v k thut cc tiu ha hng lng. Nng

    lng Elastic c s dng ph bin nh l nng lng bn trong. Khong cch

    gia cc im iu khin trn ng bin ng c cn i v do em li

    cho ng bin c tnh ging nh si dy cao su c th co hoc dn. Vn

    nng lng bn ngoi c xem xt da vo kiu dng ca c trng nh c

    xem xt. C th tnh nng lng ny theo cc thng s gradient. V theocchny, cc ng bin ng thng hi t v pha cc v tr bin. Bn cnh cc

    thng s v gradient, m s cch tnh nng lng bn ngoi khc cn bao gm

    c cc hm lin tc lin quan n mu da trong hp dn cc con rn v pha

    cc vng mt.

    Mc d phng php con rn mt cch tng qut c th xc nh oc cc

    ng bao quanh cc vng c trng nhng vic trin khai phng php vn bcn tr bi hai vn . Th nht l cc phn ca con rn hay b by vo cc vng

    c trng nh khng ng. Th hai l phng php con rn khng thc s hiu

    qu trong xc nh cc c trng khng li (c trng xut hin ni bt) do xu

    hng tin ti cc tiu cong ca con rn.

    1.4.1.3.2 Dng mu c th bin i (Deformable templates)

    Xc nh ng bao ca mt vng c trng khun mt khng phi l mt

    vn d gii quyt bi v cc du hiu cc b ca cc ng bin mt kh c

    th oc t chc thnh cc th th tng th nhn bit thng qua cc ng bin.

    tng phn thp v sng xung quanh mt s vng c trng nh cng lm

    cho qu trnh do tm bin kh thc hin. Yuille v cng s m rng khi nim

    22

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    23/122

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    24/122

    L mt m hnh m t tham s ha ti u ca hnh dng da trn phong

    php thng k. Kin trc ca qu trnh so khp ca PDM khc vi cc m hnh

    hnh dng ng khc. Cc ng bin ng ca PDM c ri rc ha thnh cc

    tp im c nh nhn. S bin i ca cc tp im ny trc ht c tham

    s ha thng qua cc tp mu hc.cha cc i tng c hnh dng v t th

    khc nhau. S dng phng php phn tch thnh phn chnh PCA, s bin i

    ca cc c trng trong tp mu hc c xy dng thnh mt m hnh linh

    ng tuyn tnh. M hnh oc cu thnh t trung bnh ca tt c cc c trng

    trong tp hp v m hnh c bn ca s bin i tng im nh:x = xtb + Pv

    (I.12)

    Trong , x biu din mt im trong PDM v xtb l c tnh trung bnhtrong tp mu i vi im , P = [p1, p2, , pt ] l ma trn cha t vector bin

    i quan tng nht ca ma trn hip phng sai, cn v l vector trng s.

    M hnh PDM u tin oc pht trin bi Lanitis v cng s. M hnh

    minh ha dng v tng th ca khun mt bao gm c tnh nh lng my, mi,

    mt. S dng 152 im iu khin c chn bng tay v 160 nh mt mu, mt

    m hnh PDM c xy dng. Ch s dng 16 trng s, m hnh c th xp xc 95% cc hnh dng khun mt trong tp mu. so khp mt mhnhf

    PDM vi mt mt, m hnh hnh dng trung bnh (vi im nh nhn l xtb) u

    tin c t gn mt. Sau cc chin lc tm kim trn mc xm cc b

    c s dng a tng im hng n im tng ng thuc ng bao.

    Trong sut qu trnh bin i ny, hnh dng ch c php thay i theo mt

    cch ph hp vi cc thng tin oc m hnh ha trong tp mu.

    u im cua PDM l s dng m hnh khun mt vi cc tham s ti u.

    c tnh tng th ca m hnh cng cho php tt c cc c trng c xc nh

    song song vi nhau v do gim bt oc yu cu phi tm kim ln lt cc

    c trng. Hn n, s thiu vng mt c trng no khng phil mt vn

    24

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    25/122

    nghim trng khi m n cc c trng khc trong m hnh vn c th t ti

    mt gii php ti u ton th.

    1.4.2 Hng tip cn da trn thng tin xut hin trong nh (Image-based

    approach)

    Hn ch ca hng tip cn da vo c trng ca hnh nh l kh

    nng nhn bit nhiu khun mt trong mt bc nh c bi cnh phc tp l

    khng cao cho d c nhiu n lc ci tin v nng cao cht lng d tm.

    iu i hi mt phng php mi, mt hng tip cn mi gii quyt

    vn ny. V hng tip cn da vo thng tin hnh nh l hng tip cn c

    th p ng nhu cu .Hu ht cc phng php trong hng tip cn ny u s dng chung

    mt k thut la k thut qut ca s hay cn gi l k thut qut khung nhn

    nhn bit khun mt. Thut ton qut ca s s d tm trong nh u vo tt

    c cc khun mt c th c trong nh. Kch thc ca ca s, h s ly mu,

    kch thc ca bc qut phthuc vo mc ch ca phng php cng nh

    hiu nng ca h thng.Nhn bit khun mt da vo thng tin hnh nh c chia lm ba hng

    nghin cu con chnh l phng php khng gian con tuyn tnh, phng

    php da vo mng neural v phng php thng k.

    1.4.2.1. Phng php khng gian con tuyn tnh (Linear Subspace

    Methods)

    Hnh nh ca khun mt con ngi nm trn mt khng gian con ca ton

    b khng gian hnh nh. th hin khng gian con ny, ngi ta c th s

    dng phng php v thn kinh, tuy nhin vn c vi phng php c lin quan

    cht ch hn vi phn tch thng k bin thin tiu chun ci m c th ng

    dng c. Cc k thut trong phng php ny bao gm phn tch thnh phn

    25

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    26/122

    chnh (PCA principal component analysis), phn tch bit s tuyn tnh (LDA),

    v phn tch h s (FA).

    Vo cui nhng nm 80, Sirovich v Kirby pht trin mt k thut s dng

    PCA th hin hi qu khun mt con ngi. a ra s ging nhau gia

    nhiu hnh nh khun mt khc nhau, k thut ny u tin tm ra nhng thnh

    phn c bn ca s phn b trn khun mt, th hin bng eigenvectors ca ma

    trn cc bin ca b cc. Tng khun mt trong mt tp hp cc khun mt sau

    c th tnh xp x bng s kt hp tuyn tnh gia nhng eigenvector ln

    nht, c bit ti nh eigenfaces.

    Turk v Pentland sau m rng k thut ny cho nhn dng khun

    mt. Cch thc ca h khai thc tnh t nhin cn bn ca eigenfaces trn nhdng khun mt. Bi v s ti to khun mt bng cc thnh phn c bn ca n

    ch l s gn ng, sai s cn d c nh ngha trong gii thut nh s o

    lng s b ca mt. Sai s cn d ny cho ta du hiu tt ca s tn ta ca

    khun mt thng qua quan st mc ti thiu chung trn bn khong cch.

    Gn y hn, Moghaddam v Pentland pht trin xa hn k thut ny

    trong phm vi xc sut. Khi s dng PCA nh dng, ngi ta thng b i phn b trc giao ca khng gian khun mt (nh cp trc ).

    Moghaddam v Pentland phat hin ra rng iu ny dn ti gi thit khng gian

    khun mt c mt khng i, do h m rng my d s ging nhau ti cc

    i, dng c khng gian khun mt v phn b trc giao ca n x l mt

    bt k. H ghi nhn t l nh dng l 95% trn tp hp ca 7000 hnh nh khun

    mt khi nh dng mt tri. So snh vi my d DFFS th tt hn rt nhiu. Khi

    d u ca 2000 hnh nh khun mt t d liu ca FERET, t l d l 97%.

    Jebara v Pentland a k thut ny vo h thng truy tm khun mt ngi

    da vo c mu sc, 3D v thng tin v chuyn ng. Mt cch tip cn tng t

    l PCA c p dng cho tp hp khun mt v mu ging khun mt, cng vi

    tiu chun la chn da vo t l ging nhau.

    26

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    27/122

    Samal v Iyengar a ra cch d khun mt PCA da trn hnh chiu

    khun mt. Thay v khun mt eigen, h to ra hnh chiu eigen v kt hp vi

    k thut x l hnh nh tiu chun. H ghi nhn t l d l 92% trn tp hp 129

    hnh nh (66 hnh nh khun mt thc v 63 hnh nh thng thng), trong

    khun mt chim hu ht hnh nh.

    1.4.2.2 Phng php da vo mng Neural

    Mng neural tr thnh mt k thut ph bin trong vn nhn dng

    khun mt v tt nhin l trong c nhn bit khun mt. Mng neural ngy nay

    c nhiu thay i so vi s khai n gin MLP ca n.

    H thng d tm khun mt thc hin qua bn bc chnh [6]: c lng v tr: vic dng tip cn my hc, c th l mng neural, i

    hi vic hun luyn mu. gim s lng bin i trong nh hun luyn

    dng, nh c canh bin vi cc nh khc cc tiu ho cc bin i

    v tr c trng khun mt. Khi thi hnh chng trnh, ta khng bit chnh

    xc cc v tr c trng khun mt, do khng th dng chng nh v

    cc ng vin khun mt tim nng. Thay vy, ta d tm ton din mi vtr v t l tm mi v tr ng vin. Cc ci tin d tm ton din lm

    cho thut ton nhanh hn, vi t l d tm gim 10% n 30%.

    Tin x l: gim cc bin i gy ra do chiu sng hay camera, nh

    c tin x l vi cc thut ton chun nh cn bng lc ci thin

    sng v tng phn trong nh.

    D tm: Cc khun mt tim nng chun ho v v tr, t th, v

    sng trong hai bc u tin c kho st xc nh chng c thc s

    l khun mt hay khng. Quyt nh ny c thc hin bng mng

    neural hun luyn vi nhiu nh mu khun mt v khng khun mt.

    Quyt nh: Kt hp nhiu mng c c mt quyt nh khch quan

    nht. Mi mng hc nhng iu khc nhau t d liu hun luyn, v a

    27

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    28/122

    ra cc li khc nhau. Cc quyt nh ca chng c th kt hp dng mt

    s heuristic n gin, lm tng chnh xc d tm khun mt v ngn

    chn li.

    Hnh 2: H thng Rowley

    28

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    29/122

    Hnh 3: S lung x l cc bc chnh trong pht hin khun mt

    29

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    30/122

    S trn l thut ton d tm khun mt thng trong nh xm, bng cch

    s dng mng noron. Thut ton thc hin bng cch p dng mt hay nhiu

    mng neural trc tip vi cc phn ca nh u vo, v phn x cc kt qa ca

    chng. Mi mng c hun luyn kt xut mt kt qu l c hay khng c

    khun mt.

    Hun luyn mng neural d tm khun mt l mt cng vic y thch

    thc, v kh khn trong vic biu th cc nh khng khun mt. Khng nh

    vic nhn dng khun mt, trong cc lp phn bit l cc khun mt khc

    nhau. Hai lp gi l phn bit trong d tm khun mt l nh c cha khun

    mt v nh khng cha khun mt. D dng ly c mu nh cha khunmt in hnh, nhng vic ly mu nh khng cha khun mt in hnh kh hn

    rt nhiu. Ta trnh vic dng tp hun luyn c kch thc ln biu din

    khng khun mt bng vic chn thm nh vo tp hun luyn khi tin hnh

    hun luyn. Phng php bootstrap nhm gim kch thc ca tp hun luyn

    cn thit. Vic dng cch thc x l gia a mng v cc heuristic lm r

    rng cc kt qa v ci thin ng k chnh xc ca b d tm.

    1.4.2.3. Hng tip cn s dng phng php thng k (Statistical

    Approachs)

    Bn cnh phng php s dng khng gian con tuyn tnh v phng

    php s dng mng Nron, cn c mt s phng php khc tip cn theo

    hng thng k nhn bit khun mt. Nhng phng php ny da trn c s

    l thuyt thng tin, l thuyt v SVM (Support Vector Machine) v cc lut xc

    sut ca Bayes.

    SVM l phng php do Vladimir N. Vapnik xut nm 1995. SVM da

    trn l thuyt thng k v ngy cng c s dng ph bin trong nhiu lnh

    vc, c bit l trong lnh vc phn loi mu v nhn dng mu. ng thi

    30

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    31/122

    phng php ny c nhiu tnh nng u vit so vi cc phng php c in

    khc nh d dng x l, x l c tnh n nh cao trn d liu phc tp, c th c

    s chiu ln v quan trng hn c l kh nng x l tng qut.

    Phong php tm kim khun mt da trn m hnh Markov n cng l

    mt trong cc hng nghin cu c ch trng. M hnh Markov n l mt tp

    cc m hnh thng k c s dng m t cc c tnh thng k ca tn hiu.

    L thuyt v chui Markov v m hnh Markov c nghin cu su rng v

    p dng nhiu trong l thuyt nhn dng nh nhn dng ting ni, ch vit.

    Samarie v cng s, Netfian v cng d l hai nhm nghin cu hng u trong

    vic p dng m hnh Markov n vo tm kim v nhn dng mt ngi.

    1.4.4 Kt lun

    Nhn bit mt ngi l mt lnh vc ang thu ht nhiu s quan tm ca

    cc nh nghin cu. Ngy cng c nhiu thut ton mi, hng tip cn mi

    nhm nng cao cht lng cng nh chnh xc ca h thng d tm khun

    mt. Tuy nhin do tnh phc tp ca mi trng, khng gian v bi cnh cng

    nh yu cu v tnh thi gian thc ca h thng m cho n nay, vn cha cmt phng php no tht s ti u. Vic tm ra phng php mi vn cn

    ng v c th cn s tr gip ca cng nghip my tnh, l s pht trin ca

    phn cng, tc x l ca my tnh.

    Tng chung li th, nhn dng mt ngi c hai hng tip cn chnh,

    l hng tip cn da vo nhng c trng ca mt ngi v hng tip cn da

    vo thng tin hnh nh.

    Hng tip cn da vo nhng c trng ca mt ngi c p dng ch

    yu khi h thng yu cu tnh thi gian thc. V khi vn v mu sc

    v chuyn ng ca hnh nh phi c quan tm. Tuy nhin, hng tip

    cn ny th cht lng pht hin ca h thng c th s khng cao, mun

    31

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    32/122

    nng cao, chng ta phi c thm nhng k thut mi b sung v kh phc

    tp.

    Hng tip cn da vo thng tin hnh nh l phng php c cht lng

    v hiu qu cao nht, nhng ch x l cho nh xm. V cc phng php

    u s dng chung k thut ca s a phn gii. Chng ta c th khng

    cn s dng ca s qut ny nu kt hp hng tip cn trn vi phng

    php da vo c tnh khun mt nh l mt bc tin x l.

    ng dng quan trng nht ca nhn bit khun mt cho n hin nay c l

    l l giai on tin x l cho h thng nhn dng mt ngi. Ngoi ra, vi s

    gia tng ca ti nguyn trn Internet, l thuyt v nhn bit mt ngi c th

    c ng dng ch s ho ni dung nh v c s d liu video. Ngoi ra, cnc ng dng trong cng ngh sinh trc hc v hi tho truyn hnh.

    2. Tng quan v cc k thut nhn bit mu da da trn tnh cht

    im nh

    2.1 Gii thiu

    Nh trnh by trong phn trc, da vo mu sc ca da ngi cng l

    mt trong nhng phng php c dng pht hin mt ngi. Tuy nhin nu

    ch n thun s dng mu sc khng thi th rt kh c th t c hiu qu

    cao trong pht hin mt ngui. V trong cc khung cnh th c rt nhiu vt c

    mu sc tng t nh mu ca khun mt. Tuy nhin nu kt hp phng php

    ny vi cc phng php khc li c th mang li hiu qu cao. V kinh nghim

    cho thy mu da ngi c c tnh mu ring bit, v c tnh ny cho php d

    dng nhn ra u l da ngi [8]. V thng thng trong hng tip cn pht

    hin mt ngi da trn thng tin xut hin trong nh, th mu da c s dng

    nh mt bc phn vng cc vng nh c mu sc ging mu da, iu cho

    32

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    33/122

    php gim khng gian tm kim khun mt, ci thin hiu nng ca h thng tm

    kim. Do nhiu m hnh c xy dng c th pht hin oc da ngi,

    Khi xy dng hay m hnh ha mt h thng pht hin hay phn tch vng

    mu da vi mc ch s dng cho vic pht hin mt ngi, ngi ta thng t

    ra ba vn chnh [7]. Th nht l m hnh c xy dng trong khng gian

    mu no, th hai l hm phn phi ca mu da c m hnh ha chnh xc n

    mc no v cui cng l s x l vng mu da c phn vng cho nhn bit

    mt ngi nh th no. Trong phn ny, s ch cp n hai cu hi trn, cn

    vic x l vng da nh th no cho vic pht hin mt ngi, s cp n trong

    chng sau, vi mt phng php c th c chn s dng cho bi n

    ny.Phng php c c p trong phn ny l phng php pht hin

    da ngi da trn c tnh im nh, ngha l s phn lp im nh thnh hai

    lp, lp l lp im anh c thuc mu da v lp kia khng phi l mu da. Cc

    im nh l hon ton c lp vi nhau. Ngc li vi phng php ny l

    phng php da trn c tnh vng nh.

    Pht hin mu da da trn c tnh im nh c mt lch s pht trin khdi, tuy nhin trong khun kh phn tng quan ny, ch cp v so snh nhng

    k thut c cng b v c nh gi hiu qu.

    Mc ch cui cng ca phn tng quan ny l thu tp cc k thut

    c cng b, m t nhng tng chnh ca k thut , tng hp v a ra

    nhng u im, nhc im v nhng c trng ca tng k thut. T s a

    ra quyt nh la chn k thut ph hp dng phn vng mu da p dng cho

    bi n ny.

    2.2 Khng gian mu s dng cho m hnh ha mu da

    Trong lnh vc o mu, cng nh cc lnh vc trong truyn tn hiu hnh

    nh v video s dng rt nhiu khng gian mu vi cc tnh cht khc nhau. V

    33

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    34/122

    trong s nhiu khng gian mu c p dng cho vn m hnh ha mu

    da. Sau y l tm lc nhm cc khng gian mu c s dng rng ri nht

    cng nh cc tnh cht ca chng

    2.2.1 Khng gian mu RGB

    RGB l khng gian mu c bn c p dng t lu cho mn hnh CRT.

    Trong khng gian mu ny, mi im mu l s kt hp ca ba thnh phn n

    mu ( - Red, Xanh l cy- Green v xanh da tri : Blue). y l mt trong

    nhng khng gian mu c s dng ph bin nht cho vic x l v lu tr d

    liu nh s. Tuy nhin do tnh tng quan cao gia cc knh, gi tr cm nhn

    khng ng nht, s pha trn gia d liu thnh phn mu v d liu v sngm khng gian RGB khng c a thch s dng cho vic phn tch mu cng

    nh trong cc thut ton nhn dng da trn mu sc.

    2.2.2 Khng gian RGB chun ha

    Khng gian RGB chun ha l khng gian mu nhn c t khng gian

    RGB c bn theo cng thc chun ha n gin sau y:

    (I.13)

    .

    C th d dng thy rng, trong khng gian ny, r+g +b = 1. Do ch

    cn hai trong ba thnh phn trn l biu din khng gian mu ny, thnh

    phn th ba s khng cn gi tr v c th c b qua, rt ngn c s

    chiu ca khng gian ny. Hai thnh phn cn li thng c gi l cc thnh

    phn mu tinh khit (pure colors). Thng thng, hai thnh phn r v b

    thng c gi li, cn b b rt b i. Tnh cht cn ch ca khng gian mu

    ny l tnh bt bin i vi ca b mt. Ngha l, nu nh khng quan tm

    n nh sng xung quanh, th khng gian chun ha RGB l bt bin i vi s

    34

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    35/122

    thay i v hng b mt lin quan n ngun chiu (tt nhin l dui mt vi

    gi thit nht nh). Kt hp vi php chuyn i n gin t khng gian mu

    RGB c bn m khng gian RGB chun ha ny ngy cng c s dng rng

    ri trong nhiu lnh vc, trong c linh vc nhn dng.

    2.2.3 HIS, HSV, HSL - bo ha ca mu

    Khng gian mu da trn tnh bo ha mu c gii thiu khi c nhng

    nhu cu trong vic xc nh s lng tnh cht mu. Chng miu t mu sc vi

    nhng gi tr thuc v trc gic, da trn kin ca cc ha s v nhng trng

    thi khc nhau ca mu sc, trng thi bo ha cng nh tng tng mu khc

    nhau. Hue biu th cho mu tri (nh mu , mu xanh l cy, mu ta vmu vng) ca mt vng nh, saturation ( bo ha) l thc o cho gii mc

    ngng mu ca mt vng nh. Cc khi nim nh intensity (cng ),

    lightness (tnh du) hay value(gi tr) lin quan n sng ca mu. Gi tr

    trc gic ca cc thnh phn trong khng gian mu ny v s phn bit r rng

    gia sng vi c thnh phn mu ca khng gian mu l u im m gip cho

    khng gian ny c s dng ph bin trong vn phn vng mu da.

    Cng thc chuyn t khng gian RGB sang khng gian ny nh sau:

    (I.14)

    35

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    36/122

    Ngoi ra cn c th tnh Hue Saturation bng cch s dng hm log cho

    cc thnh phn mu ca khng gian mu RGB. Phng php ny c th lm

    gim s c lp ca cc thnh phn mu theo mc sng.

    H ta cc gia Hue v Saturation c th gy ra nhiu kh khn trong

    m hnh mu da, chnh v vy ngi ta cn chuyn n sang h ta cc theo

    cng thc sau:

    (I.15)

    2.2.4 TSL Tint, Saturation, Lightness (sc thi, bo ha, du )

    Khng gian chun ha thnh phn mu v sng TSL c chuyn tkhng gian chun ha RGB theo cng thc sau y:

    (I.16)

    Trong , r = r 1/3, g = g 1/.

    Theo kt qu nghin cu, so snh chn khng gian mu s dng cho m

    hnh mu da thi khng gian chun ha TSL thc hin m hnh ha mu da nhanh

    hn cc khng gian khc.

    2.2.5 YcrCb

    YCrCb l khng gian mu c s dng nhiu trong vn nn nh. Mu

    sc dc biu din bi luma ( l gi tr sng c tnh ton t khng gian

    RGB), gm ba thnh phn, mt thnh phn l tng cc trng s t RGB, hai

    36

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    37/122

    thnh phn mu khc nhau Cr v Cb c to ra bng cch t t hai thnh phn

    Red v Blue trong khng gian mu RGB. Cng thc chuyn i nh sau:

    (I.17)

    Vic chuyn i n gin, tnh phn chia r rng ca sng v cc thnh

    phn mu l nhng c tnh gip cho khng gian ny li cun cc nh nghin

    cu s dng cho vic m hnh ha mu da.

    2.2.6 Cc h ta khng gian mu khc

    Bn cnh YcrCb, mt vi khng gian mu khc oc to ra t chuyn i

    tuyn tnh khng gian RGB c s dng trong vn pht hin mu da. Nh l

    YES, YUV hay YIQ. Tuy nhin chng t c s dng hn.

    2.3 M hnh ha mu daMc ch cui cng ca pht hin mu da l xy dng mt quy t c tnh

    quyt nh. y l quy tc s gip phn bit mt im nh l da hay khng phi

    l da ngi. Thng thng, quy tc ny s thit lp mt gi tr o cho php tnh

    ton mc tng ng gia mt im nh mu vi c trng mu da. Gi tr

    o ny c thit lp nh th no, cng thc ra sao ty thuc vo tng phng

    php m hnh ha mu da.

    2.3.1 Xc nh ngng c th mt im nh l mu da

    Trong mt s khng gian mu, phng php xy dng v xp lp mu da

    bng cch xc nh r rng (thng qua mt s quy tc) bin gii cc gi tr ca

    im nh l mu da hay khng. V d nh:

    37

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    38/122

    Trong khng gian RGB:

    (R,G,B) c xp thuc lp mu da nu nh:

    R>95 v G>40 v B>20 v

    Max(R,G,B) Min(R,G,B) >15 v

    |R-B| > 15 v R>g v R>B

    Tnh n gin ca phng php ny cng thu ht nhiu s tp trung

    nghin cu. u im d thy ca phung php ny l tnh n gin ca quy

    tc nhn bit mu da. iu ny cho php phn lp mt cch nhanh chng v d

    dng. Tuy nhin kt qu t c khi phn lp l khng cao trong trng hptng qut. V vy kh khn chnh ca phng php ny nu mun c c h s

    nhn dng cao l phi tm ra c mt khng gian mu thch hp cng nh

    cc quy tc tt nhn bit mu da trong khng gian mu ny.

    Hin nay ngi ta ang xut s dng thut ton my hc tm ra mt

    khng gian mu thch hp cng nh cc quy tc phn lp mu da vi mong

    mun c c h s nhn dng cao. Tuy nhin cng ch mi l xut vcha c mt kt qu c th ca mt nghin cu no oc cng b.

    Tuy nhin, gia v kt qu t c, chng ta vn c th tm ra c

    nhng quy tc cho php nhn bit chc chn mt im nh khng phi l mu

    da. Nhng quy tc ny c th c s dng lm bc lc khi to cho cc

    phng phn lp php phc tp hn gia vng mu da v vng khng phi mu

    da. N gip cho qu trnh phn lp c thc hin nhanh chng hn v tn

    cng hn.

    2.3.2 Phong php m hnh ha mu da s dng phn phi khng tham s

    tng chnh ca phong php m hnh ha mu da khng tham s l

    c lng phn phi mu da t d liu hun luyn m khng xut pht t mt

    38

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    39/122

    m hnh r rng no ca mu da. Kt qu ca phng php ny thng c

    biu din di dng mt bn phn b mu da (SPM Skin Probability Map).

    Mi mt gi tr phn b c gn cho mi im trong khng gian mu.

    2.3.2.1 Bng tra cu chun ha (LUT Lookup Table)

    Mt s thut ton pht hin mt ngi v bm st mt ngi s dng mt

    lc mc xm da trn hng tip cn phn vng cc im nh l mu da.

    Khng gian mu c lng t ha thnh tng nhm, mi mt nhm p ng

    cho mt khong cc thnh phn mu. Cc nhm lc ny c tham chiu ti

    mt bng gi l bng tra cu. Mi mt nhm lu tr mt s lng ln xut hin

    ca mt mu khi tin hnh hun lun nh da ngi. Sau qu trnh hun luyn,biu s tnh ton v chun ha, chuyn sang gi tr biu trong phn phi

    xc sut min ri rc: Pskin(c) = skin[c]/Norm (I.18)

    Trong , skin[c] nhn gi tr ca nhm lc , p ng cho vc t mu

    c, Norm l mt h s chun ha (tng tt c cc gi tr ca cc nhm biu )

    hay l gi tr ln nht ca mt nhm biu . Gi tr chun ha ca ca bng tra

    cu cc nhm biu l cn c cho php quyt nh mt mu c l mu dahay khng.

    2.3.2.2 Phn lp Bayes (Bayes Classifier)

    Gi tr ca Pskin(c) trong cng thc trn l mt iu kin xc sut P(c|

    skin) xc sut mt mu quan st c l mt pixel mu da. V xc sut thch hp

    c dng pht hin mu da l P(skin|c) xc sut quan st mu c

    mu da khi xut hin mt gi tr mu c ri rac. tnh gi tr ny, ta s dng

    cng thc Bayes quen thuc:

    (I.19)

    39

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    40/122

    Trong P(c|skin) v P(c|-skin) oc tnh trc tip t biu mu da v

    khng mu da. Xc sut ton phn P(skin) v P(-skin) th c c lng t mt

    s lng cc mu l mu da v khng mu da trong tp mu hun luyn. Bt

    ng thc P(skin|c) > , trong l mt gi tr ngng, c th c s dng

    tr thnh quy tc trong pht hin mu da.

    Cng thc trn i khi hi phc tp, v c th trnh iu ny, nu nh

    thc s khng cn phi bit mt cch chnh xc sut P(skin|c) v P(-skin|c) m

    ch cn bit t s gia chng th ngi ta thng a v cng thc nh sau:

    (I.20)

    So snh cng thc ny vi mt ngng c th to ra mt quy tc cho php

    pht hin t s mu da/khng phi mu da. Sau mt vi php bin i, chng ta

    nhn c cng thc

    (I.21)

    Cng thc trn c th thy rng, vic chn la gi tr ca xc sut ton

    phn khng nh hng n cht lng ca b pht hin, v vi bt k mt xc

    sut ton phn P(skin) u c th chn c mt gi tr K ph hp sao cho gi tr

    ca ngng l .

    2.3.2.4 Tng kt phng php khng tham s

    40

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    41/122

    Hai u im d thy ca phng php m hnh ha phn phi khng tham

    s l: th nht, chng c th hun luyn v s dng c mt cch nhanh

    chng. Th hai, chng c lp vi l thuyt v hnh dng ca phn phi mu da

    (iu ny khng ng trong m hnh ha mu da c tham s). Tuy nhin nhc

    im ca phng php ny l chng yu cu nhiu b nh lu tr v

    khng c kh nng ni suy hay to ra d liu hun luyn. Ly v d nh, chgn

    ta lng t ha im nh trong khng gian RGB v 8bit cho mi mu, khi

    chng ta phi cn mt mng c ti 224 phn t l tr tp tt c cc xc sut

    ca m hnh. c th gim bt kch thc ny bng cch loi b nhng d liu

    hun luyn nh l, khng gian mu thng s dng kch thc 128*128*128,

    64*64*64, 32*32*32. Theo nh nghin cu th kch thc 32*32*32 l kchthc khng gian mang li hiu qu cao nht.

    2.3.3 M hnh ha phn ph mu da c tham s

    Hu ht cc m hnh mu da khng tham s da trn biu xm u yu

    cu rt nhiu b nh v hiu nng ca chng ph thuc hon ton ca tp nh

    hun luyn c nh. V vy cn c mt m hnh mu da c th t thm hoc tto ra d liu hun luyn , iu dn n s ra i a m hnh phn phi

    tham s.

    2.3.3.1 M hnh da trn phn phi Gaussian n.

    Phn phi mu da c th oc m hnh ha bi phn phi Gaussian thm

    vo hm mt xc sut. nh ngha nh sau:

    (I.22)

    41

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    42/122

    y, c l mt vc t mu, s v s l hai tham s phn phi (vc t trng

    bnh v ma trn hip phng sai). Cc tham s ca m hnh c c lng

    thng qua qu trnh hun luyn bi cng thc sau:

    (I.23)

    Trong , n l tng s cc mu mu da . Xc sut p(c|skin) c th c

    tnh trc tip mc tong t mu da (likehood skin color) hoc c th tnh

    bng khong cch Mahalanobis t v t mu c, vc t trung bnh s, ma trn hip

    phng sai s. Cng thc tnh khong cch Mahalanonbis:

    (I.24)

    Phong php m hnh ha gia trn phn phi n Gaussian c trin

    khai v nghin cu.

    2.3.3.2 M hnh kt hp da trn phn phi Gaussian

    Mt m hnh cng phu, phc tp hn, c kh nng biu din c phn

    phi phc tp l m hnh kt hp da trn phn phi Gaussian. y l m

    hnh m rng t m hnh n Gaussian trn, trong trng hp ny, hm phn

    phi mt xc sut l:

    (I.25)

    Trong , k l s lng cc thnh phn c kt hp, i l tham s kt

    hp, tha mn rng buc ki = 1 i = 1, v pi(c|skin) tha mn hm phi mt xc

    sut Gaussian, vi mi vc t trung bnh v ma trn hip phng sai ca n.

    Hun luyn m hnh oc thc hin vi mt k thut c bit n nhiu gi l

    42

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    43/122

    thut ton k vng ti a (EM - Expectation Maximization), trong gi s rng

    s lngcc thnh phn k l bit trc. Chi tit vic hun luyn m hnh kt

    hp Gaussian vi thut ton EM ny c th c tm thy trong nhiu nghin

    cu. Vic phn lp trong m hnh kt hp Gaussian c thc hin nh vic so

    snh xc sut p(c|skin) vi mt vi gi tr ngng.

    Vic chn la s lng thnh phn k y l quan trng. V n nh

    hng n chnh xc ca vic hun luyn cho m hnh. Theo nh nhng

    nghin cu hin nay, k = 8 l s la chn mang hiu nng cao nht cho m hnh

    kt hp phn phi Gausian.

    2.3.3.3 a phn phi GausianMc gn ng ca cc nhm mu da vi phn phi Gaussian 3D trong

    khng gian YcbCr c miu t trong nhiu bi bo. Mt s lng khc nhau

    cc thut ton phn nhm K-trung bnh c s dng cho nhm Gaussian thc

    hin vic hun luyn m hnh. Cc im nh c phn lp thnh lp mu da

    nu nh khong cch Mahalanobis t vct mu c n trung tm ca cm gn

    nht trong m hnh nh ln hn mt ngng cho trc.

    2.3.3.4 Tng kt cc phong php m hnh ha theo tham s

    Tt c cc phng php m hnh ha theo tham s c miu t nh trn

    (ngoi tr phng php 2.3.3.3) u tnh ton trn mt phng cc thnh phn

    mu ca khng gian mu m b qua thng tin v sng.

    D nhin, khi mt m hnh phn phi c th c s dng, s c cu hi

    t ra v s xc thc v gi tr ca m hnh . Hin nhin, m hnh c lp vi

    hnh dng ca phn phi trong khng gian mu th cng tt hn, do m hnh

    khng tham s xt v mt ny hin nhin s tt hn m hnh c tham s. Tuy

    nhin do yu cu qu cao v b nh m khi nh gi hiu nng th m hnh c

    43

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    44/122

    tham s li c hiu nng cao hn. iu ny c th thy trong cc bng nh gi

    nhiu bi bo.

    2.4 So snh kt qu cc m hnh

    c th nh gi v so snh hiu nng ca cc phng php m hnh

    ha mu da l khng d, v mi phng php thng c xut ca mt

    nhm cc nh nghin cu v c th nghim trn c s d liu ring. V cha

    c mt c s d liu chun no c cng b rng ri cho vn ny. C s d

    liu hun luyn v kim nh c bit n nhiu nht l c s d liu ca

    Compaq. Trong bng so snh c a ra di y, l kt qu tt nht m mi

    phng php t c, c tng hp bi [Valimir Vezhnevets, Vassili SazonovAlla Andreeva ], vi kt qu th nghim da trn c d liu ca Compaq nu

    trn. Bng sau y s so snh h s pht hin ng v khng ng ca tng

    phng php. Mc d cc phng php l khc nhau v d liu hun luyn v

    tp d liu test, cng nh chin lc hun luyn, bng di y vn m t mt

    bc tranh ton cnh v hiu nng ca cc phng php [7]:

    Phng Php Nhn bit ng Nhn bit saiBayes SPM trong RGB

    (Jones v Regh 1999)

    80%

    90%

    8.5%

    14.2%Bayes SPM trong RGB

    (Bran v Mason 2000)

    93.4 % 19.8%

    Maximum Entropy Model trong RGB

    (Jedynak v al. 2002)

    80% 8%

    Gaussian Mixture models trong RGB

    (Jones v Rehg 1999)

    80%

    90%

    ~9.5%

    ~15.5%SOM in TS

    (Brown v al. 2002)

    78% 32%

    Elliptical boundary model trong CIE xy

    (Lee v Yoo 2002)

    90% 20.9%

    44

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    45/122

    Single Gaussian trong Cb v Cr

    (Lee v Yoo 2002)

    90% 33.3%

    Gausian Mixture trong IQ

    (Lee v Yoo 2002)

    90% 30,0%

    Thresholding ca trc I trong YIQ(Brand v Mason 2000)

    94.7% 30.2%

    Bng 1: Kt qu nhn bit ng v sai ca cc phng php

    2.5 nh gi phng php

    u im chnh ca cc phng php s dng cc ngng phn lp

    im nh l mu da hay khng l tnh n gin v tnh trc gic cao trong cc

    quy tc phn lp. Tuy nhin, im kh khn l cn phi tm c c mt

    khng gian mu tt v cc quy tc xng ng trong khng gian . Phng php

    c xut hin ny s dng thut ton my hc c th tm c khng

    gian v cc quy tc thch hp, tuy nhin xut ny vn ang l mt vn m

    trong tng lai

    Cc phng php s dng m hnh ha khng tham s tht s nhanh trong

    c vic hun luyn v phn lp, c lp vi phn b hnh dng ca mu da v ckhng gian mu. Tuy nhin, phng php ny li yu cu qu nhiu b nh lu

    tr v ph thuc c dnh vo tp d liu hun luyn.

    Cc phng php m hnh ha c tham s cng x l kh nhanh. Hn na

    chng li c kh nng t to ra cc d liu hun luyn ph hp, chng c

    miu t bng mt s lng khng nhiu cc tham s v c bit chng cn

    khng ng k b nh lu tr. Tuy nhin, chgn c th s thc s chm (ging

    nh m hnh kt hp gia trn phn phi Gaussian) trong c hun luyn v lm

    vic, v hiu nng ca chng ph thuc nhiu vo hnh dng ca phn phi mu

    da. Bn cnh , hu ht cc phng php m hnh ha mu da c tham s u

    b qua nhng thng k v mu khng phi l tham s.

    45

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    46/122

    2.6 Chn la khng gian mu v phng php m hnh ha dng

    nhn bit mu da cho n.

    Vi mc ch l s dng nhn bit mu da tin hnh phn vng mu da,

    gim khng gian tm kim khun mt trong nh mu. V vy, phng php cn

    thit cho n phi c hiu nng cao, thi gian thc hin nhanh, yu cu b nh

    khng ln. Thi gian hun luyn khng phi l vn . Khng gian nh phi ph

    hp vi phng php nhn bit mu da. Chnh v vy, xem xt tt c cc phng

    php, cc c trng cng nh hiu nng ca tng phng php. Chng ta s s

    dng phng php m hnh ha c tham s tin hnh phn vng mu da cho

    nh. C th phng php c la chn l phng php m hnh ha mu da

    c tham s da trn phn phi Gaussian. V khng gian mu c la chn l khng gian YcrCb do c im chuyn i n gin t RGB, s phn bit r

    rng gia sng v cc thnh phn mu. ng thi, nng cao hiu nng v

    gim thi gian tnh ton cho phng php chn la ny, chng ta s xem xt cc

    quy tc oc xut trong nhm phng php dng ngung lc khi to loi

    b nhng im nh chc chn khng phi mu da. Chi tit cch thc tin hnh

    ca phng php phn vng mu da ny s c cp n trong phn 2 cachng III.

    3. Gii thiu v mng neural nhn to MPL v thut ton lan truyn

    ngc

    3.1 Gii thiu

    H thng pht hin mt ngi c xy dng trong n da trn mng

    neural MPL (Multi Perceptron Layer) v s dng thut ton lan truyn ngc

    luyn mng. V vy trong phn ny, s ni mt cch c bn nht v MPL v

    thut ton lan truyn ngc.

    46

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    47/122

    C th ni, hin nay, khng c mt nh ngha chnh thc no cho mng

    neural. Tuy nhin phn ln mi ngi u ng tnh rng mng neural l mt

    mng bao gm rt nhiu b x l n gin (gi l cc unit), mi unit c vng

    nh ring ca mnh. Cc unit c kt ni vi nhau thng qua knh thng tin

    (gi l cc connection), thng mang d liu s (khng phi l cc k hiu), v

    c m ha theo mt cch no y. Cc unit ch x l trn b d liu ca ring

    n v trn cc u vo c a ti thng qua cc lin kt. hn ch ca cc php

    x l cc b ny l n thng trng thi ngh trong sut qu trnh hc.

    Mt s mng neural l cc m hnh mng neural sinh hc, mt s th

    khng, nhng t trc ti nay, th tt c cc lnh vc ca mng neural u oc

    nghin cu xy dng xut pht t cc yu cu xy dng cc h thng nhn tort phc tp, hay cc php x l thng minh, v nhng g tung t nh b no

    con ngi.

    Hu ht cc mng neural u c mt vi quy tc hc no m thng qua

    cc trng s ca cc lin kt c iu chnh da trn d liu. Ni cch khc,

    cc mng neural hc v cc v d v da trn cc d liu th n c kh nng

    tng qut tri thc v a ra nhn thc ca mnh.Mng neural l m hnh mng ng dng cc phng php x l song song

    v cc thnh phn mng x l hon ton c lp vi nhau. Mt vi ngui xem

    kh nng x l song song s lng ln v tnh lin kt cao ca mng neural l

    cc tnh cht c trugn ca n. Tuy nhin vi nhng yu cu nh th th li

    khng c nhng m hnh n gin, v d nh m hnh hi quy tuyn tnh n

    gin, mt m hnh c ng dng rt rng ri ca mng neural.

    Mng neural c th c p dng trong mi trng hp khi tn ti mt

    mi lin h gia cc bin c lp (inputs) v cc bin ph thuc (outputs), thm

    ch l ngay c khi mi quan h phuc tp. Mt s lnh vc m mng neural

    c p dng thnh cng nh d on triu chng y hc, d on th trng

    47

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    48/122

    chng khon, nh gi tin cy ti chnh, iu chnh iu kin ca c cu my

    mc.

    3.2 Mng Perceptron nhiu tng (MPL Multi Perceptron Layer) [3]

    MPL l mt loi mng lan truyn tin c hun luyn theo kiu hc c

    thy. Mng l mt cu trc gm nhiu lp trng s. y ta ch xt n loi

    mng lan truyn kh vi. y l loi mng c th p dng phng php tnh ton

    kh hiu qu v mnh gi l lan truyn ngc li , xc nh o hm hm li

    theo cc trng s v dc trong mng. y l mt tnh cht rt quan trng ca

    nhng mng kiu ny bi nhng o hm ny ng vai tr trung tm trong cc

    gii thut hc ca cc mng a lp. Vn lan truyn ngc s c ta xt titrong mt phn ring sau ny.

    3.2.1 nh x mng lan truyn tin

    Trong phn ny ta s nghin cu m hnh mng neural lan truyn tin nh

    l mt khung tng qut i din cho cc hm nh x phi tuyn gia t p cc bin

    u vo v t p cc bin u ra.

    3.2.1.1 Mng phn lp

    Cc mng n lp c xy dng da trn s kt hp tuyn tnh cc bin

    u vo c chuyn i bi mt hm truyn phi tuyn.

    Ta c th xy dng c cc hm tng qut hn bng cch nghin cu

    nhng m hnh mng c cc lp cc nt l lin tip, vi cc kt ni t tt c cc

    nt thuc mt lp ti tt c cc nt thuc lp k tip, v khng cho php bt k

    mt loi kt ni no khc. Nhng mng phn lp nh th ny c th d phn tch

    hn cc cu trc tng qut khc, v cng d c m phng bi phn mm hn.

    48

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    49/122

    Hnh 4: M hnh mng lan truyn tin

    Cc nt khng phi l cc nt nhp v nt xut c gi l cc nt n.

    Trong m hnh chng ta nghin cu y, c d nt nh p, M nt n v c nt xut.

    Kt qu ca nt n th j c tnh nh sau:

    = +=d

    i jwixjiwja 1

    )1( 0)1( (I.26)

    Trong l trng s ca lp u tin, t nt nh p i n nt n j, v l

    trng ngng ca nt n j.

    Gi s t mt bin c nh x0 = 1. T cng thc (I.26) c th c

    vit li:

    =

    =d

    i ixjiwja 0

    )1((I.27)

    Sau hot ngzk ca nt n j c tnh ton bng cch chuyn i

    tng tuyn tnh (I.27) s dng hm truyn g(.), tc l: zk= g(aj) (I.28)

    49

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    50/122

    Kt xut ca mng c tnh bng cch chuyn i hot ng ca cc

    nt n s dng mt lp cc nt th 2. Vi mi nt xut k, ta c:

    =

    +=M

    i kwjzkjwka 1

    )2(0

    )2((I.29)

    t z0 =1 ta c:

    =

    =M

    i jzkjwka 0

    )2((I.30)

    Sau gi tr ny c cho qua ham truyn phi tuyn cho ta kt xut u

    ra ca nt xut k:( )

    kkagy ~

    = (I.31) y ta s dng k hiu biu din hm truyn ca cc nt xut nhm

    ch ra rng hm ny c th khng trng vi hm c s dng trong lp n.

    Kt hp (I.27), (I.28), (I.30), (I.31) ta c cng thc chung cho m hnh

    mng trong hnh trn:

    =

    =

    =M

    j

    d

    i ixjiwgkjwgky 0 0

    )1()2(~ (I.32)

    3.2.1.2 Kin trc mng tng qut

    Ta c th xy dng c nhng nh x mng tng qut hn bng cch

    nghin cu nhng s mng phc tp hn. Tuy nhin y th ta ch gii hn

    nghin cu trong phm vi cc mng lan truyn tin.

    Mng lan truyn tin l mng khng c mt kt ni quay lui no trong

    mng.

    Theo Bishop (1995): OV mt tng qut, mt mng c gi l lan truyn

    tin nu n c th gn cc s lin tc cho tt c cc nt nhp, tt c cc nt n v

    nt xut sao cho mi nt ch c th nhn c cc kt ni t cc nt nh p hoc

    cc nt c gn s b hn.O

    50

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    51/122

    Vi nhng mng c tnh cht nh th, kt xut ca mng l cc hm quyt

    nh ca cc u vo, v v th ton b mng c gi l mt nh x hm phi

    tuyn a bin.

    Kt xut ca nt ktnh c nh sau:

    = jzj kj

    wgkz (I.33)

    trong g(.) l mt hm truyn phi tuyn, v j thuc t p tt c cc nt

    nhp v cc nt gi kt ni ti nt k(Tham s trng ngng cng c bao

    hm trong tng ny).Vi mt tp cho trc cc gi tr u vo, p dng lin tc cng thc

    (I.33) s cho php cc kch hot ca tt c cc nt trong mng c c lng,

    bao gm c cc kch hot ca cc nt xut. Qu trnh ny c gi l lan truyn

    tin cc tn hiu qua mng.

    Nu nh cc hm truyn ca tt c cc nt n trong mng l tuyn tnh, th

    vi nhng mng nh th ta lun lun tm c mt m hnh mng tng ngm khng c mt nt n no. Nhng mng ny c gi l mng tuyn tnh a

    lp v v th khng c i su nghin cu, m ngi ta ch ch yu nghin cu

    cc mng a lp vi cc hm truyn ca cc nt n l phi tuyn.

    3.2.2 Hm sigmoid

    By gi chng ta s xem xt hm truyn logistic dng S, trong cc u

    ra ca n nm trong khong (0,1), c phng trnh nh sau:

    ( )( )a

    ag+

    =exp1

    1(I.34)

    51

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    52/122

    Hnh v di y biu din mt hm truyn sigmoid cho cc nt trong

    mng. y l mt hm m c mt c tnh v cng quan trng v : khi x chy t

    v cng ln n v cng b th f(x) lun chy trong khong t 0 n 1. Gii

    thut hc y s iu chnh trng s ca cc kt ni gia cc nt hm ny

    nh x gi tr ca x sang dng nh phn, thng thng:

    f(x) > 0.9 : f(x) = 1

    f(x) < 0.1 : f(x) = 0.

    Hnh 5: th hm truyn sigmoid

    Trong phn ny chng ta s xem xt c c mng neural vi nt xut tuyn

    tnh. Tuy nhin iu ny cng chng hn ch lp cc hm m mng c th xp x

    ho. Vic s dng cc hm sigmoid ti cc u ra s gii han pham vi co th

    xy ra ca cc nt xut thnh phm vi c th t ti c ca hm sigmoid (gi

    tr kt xut l t 0 ti 1), v trong mt s trng hp th iu ny c th l khng

    mong mun. Thm ch ngay c khi gi tr xut mong mun l nm trong gii hn

    ca hm sigmoid th chng ta vn phi ch rng hm sigmoid g(.) l mt hm

    n iu tng, do n c th ly nghch o c. Do vy mt gi tr xut y

    52

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    53/122

    mong mun i vi mng c nt xut thuc dng sigmoid th tng ng vi

    mt gi tr xut g-1(y) i vi mng c nt xut tuyn tnh.

    Mt nt n thuc dng sigmoid c th xp x mt nt n tuyn tnh bt k

    mt cch chnh xc. Cng vic ny t c bng cch thit k cho tt c cc

    trng s cc cung u vo ca nt, cng nh cc trng ngng, sao cho rt nh

    m tng ca cc gi tr nhp phi nm trn phn tuyn tnh ca ng cong

    sigmoid, gn ng vi ng thng nguyn thu. Trng s trn cung xut t mt

    nt n tng cha cc nt k tip c th to ra tng i ln ti t l vi

    hot ng (v vi trng ngng c c bc dch chuyn ph hp nu cn

    thit). Tng t, mt nt n dng sigmoid c th c to ra nhm xp x mt

    hm bc thang (step) bng vc t gi tr cho cc trng s v trng ngng rtln.

    Bt k mt nh x hm lin tc no u c th c trnh by vi chnh

    xc tuy y bi mt mng neural hai lp trng s s d ng cc nt n dng sigmoid

    (Bishop, 1995).

    Do chng ta bit c rng nhng mng neural vi nhiu tng nt x

    l cng c kh nng xp x ho bi v chng cha ng trong n mng neuralhai tng nh mt trng hp c bit. iu ny cho php cc tng cn li c

    sp xp thc hin nhng bin i tuyn tnh nh tho lun trn, v s

    bin i ng nht chnh l mt trng hp dc bit ca mt php bin i tuyn

    tnh (bit rng c s nt n khng c s gim bt v chiu xy ra).

    3.3 Thut ton lan truyn ngc [1]

    By gi chng ta s tp trung nghin cu mt k thut rt ph bin ca

    mng neural nhiu tng. Chng ta s xem xt cch m mt mng hc mt nh x

    t mt t p d liu cho trc.

    Chng ta bit vic hc da trn nh ngha ca hm li, hm li ny sau

    s c ti thiu ho da vo cc trng s v cc trng ngng trong mng.

    53

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    54/122

    Trc tin ta s xem xt trng hp mng s dng hm ngng. Vn

    cn bn y chnh l c ch khi to cc trng s cho mng nh th no.

    Cng vic ny thng c gi l credit assignment problem. nu mt nt u

    ra to ra mt p s sai lch th chng ta phi quy t nh xem liu nt n no

    phi chu trch nhim cho s sai lch , cng chnh l vic quyt nh trng s

    no cn phi iu chnh v iu chnh l bao nhiu.

    gii quyt vn gn trng s ny, chng ta hy xem xt mt mng

    vi cc hm truyn phn bit ,do gi tr tng trng ca cc nt xut s tr

    thnh mt hm phn bit ca cc bin nhp v ca trng s v trng ngng.

    Nu ta coi hm li, v d c dng sai s trung bnh bnh phng, l mt hm

    ring bit cho cc gi tr xut ca mng th bn thn n cng chnh l mt hmphn bit ca cc trng s.

    Do chng ta c th tnh ton c o hm hm li theo cc trng s,

    v gi tr o hm ny li c th dng lm cc tiu ho hm li bng cch s

    dng phng php gim gradient (gradient descent) hoc cc phng php ti

    u ho khc.

    Gii thut c lng o hm hm li c bit n vi tn gi lan truynngc, n tng ng vi vic lan truyn ngc li trong mng. K thut v lan

    truyn ngc c bit n rt rng ri v chi tit qua cc bi bo cng nh cc

    cun sch ca Rumelhart, Hinton v Williams (1986). Tuy nhin gn y mt s

    tng tng t cng c mt s nh ngin cu pht trin bao gm Werbos

    (1974) v Parker (1985).

    Cn ni thm rng gii thut lan truyn ngc c s dng trong mng

    neural c ngha rt ln. V d nh, kin trc ca mng perceptron nhiu tng

    cng thng c gi l mng lan truyn ngc. Khi nim lan truyn ngc

    cung thng c s dng m t qu tr nh hun luyn ca mng perceptron

    nhiu tng s dng phng php gradient descent p dng trn hm li dng sai

    s trung bnh bnh phng. lm r hn v thut ng ny chng ta cn xem xt

    54

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    55/122

    qu trnh luyn mng mt cch k cng. Phn ln cc gii thut luyn mng u

    lin quan n mt th tc c l p i l p li nhm lm ti thiu hm li, bng

    cch iu chnh trng s trong mt chui cc bc.

    Ti mi bc nh vy, chng ta c th chia thnh hai bc phn bit.

    Ti bc th nht, cn phi tnh o hm hm li theo cc trng s. Chng

    ta bit rng mt ng gp rt quan trng ca k thut lan truyn ngc l

    vic cung cp mt phng php ht sc hiu qu v mt tnh ton trong vic

    nh gi cc o hm. V ti bc ny li s c lan truyn ngc tr li mng

    nn chng ta s s dng khi nim lan truyn ngc c trng ring cho vic

    nh gi o hm ny.

    Ti bc th hai, cc o hm s c s dng trong vic tnh ton siu chnh i vi trng s. V k thut n gin nht c s dng y l k

    thut gradient descent, k thut ny c Rumelhart et al. (1986) a ra ln u

    tin.

    Mt iu ht sc quan trng l phi nhn thc c rng hai bc ny l

    phn bit vi nhau. Do , qu trnh x l u tin , c bit n l qu trnh

    lan truyn ngc cc li vo trong mng nh gi o hm, c th c pdng i vi rt nhiu lai mng khc nhau ch khng ch i vi ring mng

    perceptron nhiu tng. N cng c th c p dng vi cc loi hm li khc

    ch khng ch l hm tnh sai s bnh phng cc tiu, v nh gi cc o

    hm khc ny c th s dng cc phng php khc nh phng php ma trn

    Jacobian v Hessian m chng ta s xem xt phn sau. V cng tng t nh

    vy th ti bc th hai, vic iu chnh trng s s dng cc o hm c

    tnh trc c th thc hin vi nhiu phng php ti u ho khc nhau, v

    rt nhiu trong s cc phng php cho kt qu tt hn phng php gradient

    descend.

    3.3.1. Lan truyn ngc

    55

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    56/122

    Hnh 5: Lan truyn ngc

    By gi chng ta s p dng gii thut lan truyn ngc cho bt k mt

    mng neural c cu hnh lan truyn tin tu , s dng cc hm truyn phi tuyntu , v c hm li c dng tu . minh ho chng ta s dng mt mng c

    cu trc mt tng nt n dng sigmoid v hm li l hm tnh theo sai s trung

    bnh bnh phng.

    Trong cc mng lan truyn tin ni chung mi nt u tnh tng trng ho

    cc u vo ca n theo cng thc:

    = i ijij zwa (I.35)Vi zi l gi tr nhp hoc l gi tr xut ca mt nt c cung kt ni vi

    nt j v wji chnh l trng s ca cung kt ni . Gi tr tng ny c tnh trn

    tt c cc nt c kt ni trc tip vi nt j. Chng ta bit rng, trng ngng ca

    nt cng c a vo trong tng bng cch to ra thm mt gi tr nh p c nh

    56

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    57/122

    = 1. Tng trong (I.35) li c bin i thng qua mt hm truyn phi tuyn g(.)

    a ra c ga tr xut zi ca nt j theo cng thc:

    ( ji agz = (I.36)

    By gi chng ta cn phi xc nh gi tr ca cc trng s trong mng

    thng qua vic ti thiu ho hm li.

    y ta s coi c hm li c vit nh mt tng ca tt c cc li ti mi

    mu ring bit.Tng ny s c tnh trn tt c cc mu ca t p hun luyn

    =n

    nEE (I.37)

    Vi n l nhn ca tng mu.

    Chng ta cng gi nh rng li En c th c th hin nh mt hm

    ring ca cc bin u ra, c ngha l :

    En = En(yc, , yc)

    Mc ch ca chng ta y chnh l phi tm ra mt hm nhm tnh

    c o hm ca hm li theo cc trng s v trng ngng ca mng.

    i vi tng mu, ta s coi nh cung cp mt vector nhp tng ng l

    u vov tnh c cc gi tr xut ca cc nt n cng nh nt xut theo cc

    cng thc (I.35), (I.36). Qu trnh ny thng c gi l qu trnh lan truyn

    tin trong mng.

    By gi hy xem xt vic tnh o hm ca En theo c trng s wji. Gi trxut ca cc nt s ph thuc vo tng mu nhp n no. Tuy nhin d nhn,

    ta quy c s b qua vic vit k t n trn cc bin nhp v xut. Trc tin ta

    cn ch rng En ph thuc vo trng s wji thng qua tng gi tr nhp a i ca

    nt j. Do ta c th a ra cng thc tnh cc o hm ring nh sau:

    57

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    58/122

    ji

    j

    j

    n

    ji

    n

    w

    a

    a

    E

    w

    E

    =

    * (I.38)

    T (I.35) ta c:

    iji

    j zw

    a=

    (I.39)

    Nh vy suy ra:

    ij

    ji

    n

    zw

    E=

    (I.40)

    Trong j

    n

    ja

    E

    T cng thc (I.40) ta thy rng tnh c o hm chng ta ch cn

    tnh gi tr cho mi nt n v nt xut trong mng v sau p dng cng thc

    (I.40).

    Vi cc nt xut th vic tnh kl ht sc n gin.

    Ta c:

    ( )k

    n

    k

    k

    n

    ky

    Eag

    a

    E

    =

    ' (I.41)

    tnh ra (I.41) ta cn tm ra cng thc tnh g(a) vy

    En

    .

    tnh c cho c nt n, ta cn s dng cng thc tnh o hm

    ring:

    58

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    59/122

    =

    k j

    k

    k

    n

    j

    n

    j a

    a

    a

    E

    a

    E (I.42)

    Trong gi tr tng c tnh trn cc nt k m nt j kt ni n. Vic

    sp xp cc nt cng nh cc trng s c minh ho trong Hnh 6.

    Hnh 6: Minh ha vic tnh j cho vic tnh nt n j

    Ch rng cc nt c nhn k ny c th bao gm c nt nhp v nt xut.

    By gi chng ta c cng thc lan truyn ngc nh sau:

    ( )k

    kkjjj wag '

    (I.43)

    Cng thc ny ni ln rng gi tr ca i vi mt nt n c th c

    tnh t vic lan truyn ngc cc gi tr ca cc nt n cao hn trong mng,

    nh c minh ho trong hnh 5. Bi v chng ta bit c cc gi tr ca

    cc nt xut nn ta c th p dng (I.43) mt cch quy nhm tnh ra cc gi tr

    cho tt c cc nt n trong mng, m khng quan tm n cu hnh ca n.

    59

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    60/122

    Chng ta c th tng kt li gii thut lan truyn ngc nhm tnh o hm

    hm li En theo cc trng s trong 4 bc:

    a vector nh p xn vo mng v lan truyn tin n trong mng s

    dng (I.35) v (I.36) tm ra gi tr xut cho tt c cc nt n cng nh nt

    xut.

    Tnh cho tt c cc nt xut s dng cng thc (I.41)

    Lan truyn ngc cc d bng cng thc (I.43) thu c cho

    mi nt n trong mng.

    p dng ijji

    nz

    wE

    = tnh cc o hm.

    o hm ca li tng E c th thu c bng cch l p i l p li cc bc

    trn i vi trng mu trong t p hun luyn v sau tnh tng trn tt c cc

    li.

    Trong qu trnh tnh o hm trn chng ta gi nh rng mi nt n

    cng nh xut u c chung mt hm truyn g(.). Tuy nhin iu ny hon ton

    c th tnh c vi trng hp mi nt khc nhau u c cc hm truyn ring,

    n gin bng cch nh du dng ca hm g(.) ng vi tng nt.

    3.3.2 Hiu qu ca lan truyn ngc

    Mt trong nhng c tnh quan trng nht ca lan truyn ngc chnh l

    kh nng tnh ton hiu qu ca n [1].

    t w l tng s cc trng s v trng ngng. Do mt php tnh hm

    li (cho mt mu nhp no ) cn O(w) thao tc viw ln. iu ny cho

    php s lng trng s c th ln hn s lng nt, tr nhng mng c qu t kt

    ni. Do vy, hiu qu ca vic tnh ton trong lan truyn ngc s lin quan n

    vic tnh gi tr ca tng trong cng thc (I.35), cn vic tnh ton cc hm

    60

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    61/122

    truyn th tng ph kh nh. Mi lt tnh tng trong (I.35) cn n mt php

    nhn v mt php cng, dn n chi ph tnh ton ton b s bng O(w). [1]

    Vi tt c w trng s th s c w o hm cn tnh ton. Vi mi ln tnh

    o hm nh vy cn phi thc hin tm biu thc hm li, xc nh cng thc

    tnh o hm v sau tnh ton chng theo gii thut lan truyn ngc, mi

    cng vic s i hi O(w) thao tc. Nh vy ton b qu trinh tnh ton tt c

    cc o hm s t l vi O(w2). Gii tht lan truyn ngc cho php cc o hm

    c tnh trong O(w) thao tc. iu ny cng dn n rng c hai pha lan truyn

    ngc v lan truyn tin u cn O(w) thao tc, vic tnh o hm theo cng thc

    (I.43) cng cn O(w) thao tc.Nh vy gii thut lan truyn ngc lm gim

    phc tp tnh ton t O(w2) n O(w) i vi mi vector nhp. V qu trnhluyn mng, d c s dng lan truyn ngc, c th cn rt nhiu thi gian, nn

    vic t c hiu qu nh vy l ht sc quan trng.Vi tng s N mu luyn,

    s lng cc bc tnh ton nh gi hm li trn ton b t p d liu s l N

    ln bc tnh ton ca mt mu.

    61

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    62/122

    CHNG II: TNG TH HOT NG CA H THNG V

    VN CHUN B C S D LIU

    1. Tng th s hot ng ca h thng pht hin mt ngi

    H thng pht hin khun mt ca n tin hnh da trn nm hot ng

    chnh sau y:

    Hun luyn nh khun mt v nh khng phi khun mt: y l qu

    trnh hot ng ngoi tuyn ca h thng. Qu trnh hun luyn da trn

    c ch my hc m c th l mng neural nhn to. Tp c s d liu

    c chun ha v kch thc ca s chun c cho vo mng neural hun luyn. Kt qu ca hun luyn s cho ra b tham s ca mng. B

    tham s ny s c dng cho qu trnh pht hin khun mt ca h

    thng. Do nh cn pht hin khun mt l nh mu nn tp nh hun luyn

    khun mt l nh mu v s c chuyn sang nh a mc xm trc khi

    a vo hun luyn.

    Tin x l: y l qu trnh lm gim sai khc gy ra do iu kin sngbng php cn bng lc mc xm, lc nhiuca cc nh c s

    dng hun luyn mng neural cng nh hun luyn phn vng mu da.

    Cc thut ton c s dng trong qu trnh tin x l ny bao gm cn

    bng lc mc xm, lc thng thp.

    Hun luyn phn vng mu da: y cng l hot ng ngoi tuyn ca

    h thng. Phng php phn vng mu da c la chn da trn m

    hnh ha mu da c tham s s dng phn phi Gaussian v trong khng

    gian mu YCrCb. Qu trnh hun luyn t b c s d liu cc mu mu

    da ca cc chng tc chu lc u, , M , Phi, Chu i dngKt qu

    ca qu trnh hun luyn s cho ra b tham s bao gm xc sut ngng

    nh nht m m hnh hc c, vector trung bnh v ma trn hip phng

    62

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    63/122

    sai. y l b tham s c dng tin hnh phn vng mu da nh

    trc khi nh c a vo h thng pht hin khun mt.

    Pht hin khun mt: y l hot trc tuyn ca h thng. Trong hot

    ng ny, nh mu u vo cn pht hin khun mt trc khi pht hin

    khun mt s c qua qu trnh tin x l nh lc nhiu, cn bng biu

    mc xm. Sau nh c phn vng mu da v to ra mt nh nh

    phn nh phn vng. nh gc sau qu trnh phn vng mu da s c

    chuyn sang nh a mc xm. Cui cng, s l qu trnh pht hin khun

    mt trong nh bng cch trch mi ca s ca nh theo khng gian tm

    kim ca vng da c phn vng. c th pht hin khun mt ca nh

    cc kch thc khc nhau, trong qu trnh ny, nh cng c x l aphn gii.

    X l kt qu: Sau qu trnh pht hin, cc ca s c h thng pht

    hin l khun mt trc khi cho kt qu cui cng s c x l bng mt

    vi heuristic c th cho ra nhng ca s c pht hin khun mt c

    tin cy cao nht.

    Tng th cc hot ng ca h thng c th c m t nh s thut

    ton sau y

    63

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    64/122

    64

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    65/122

    2. Chun b c s d liu

    H thng pht hin khun mt c xy da trn mng neural v phn

    vng mu da, chnh v vy vic chun b d liu cho h thng ng mt vai tr

    v cng quan trng, n quyt nh n hiu nng cui cng ca h thng. D

    liu cho h thng y s bao gm:

    D liu cho hun luyn mng neural: Bao gm tp cc d liu khun mt

    v khng phi khun mt. Tp cc nh c s dng hun luyn mng.

    D liu cho vic phn vng mu da: u l tp cc mu mu da ca nhiu

    chng tc v chu lc trn th gii, s phong ph v chnh xc ca tp

    mu ny quyt nh kt hiu qu ca qu trnh phn vng.

    D liu c dng kho st v th nghim kt qu hot ng ca h

    thng

    2.1 D liu hun luyn mng neural

    2.1.1 nh hun luyn l khun mt

    nh hun luyn khun mt c s dng trong n ny l tp nh chunc ly t website ca Dr Libor Spacek:

    http://cswww.essex.ac.uk/mv/allfaces/index.html. y l mt ngun nh mu

    chun phong ph vi 750 nh mu 24bit kch thc 480 x 640 ca 50 ngi, mi

    ngi l 15 kiu nh theo t th nhn thng hoc x dch mt lng khng ng

    k. Cc khun mt cc trng thi nh bnh thng, ci, nghim ngh, eo

    knh v khng eo knh, nhm mt v m mt.

    Ton b 750 nh ny c s dng chun ha v kch thc ca s

    25x25, y l kch thc ca s chun c chn s dng cho h thng pht

    hin khun mt. iu ny cng c ngha l, kch thc ti thiu ca khun mt

    c th c pht hin bi h thng l 25 x 25.

    65

    http://cswww.essex.ac.uk/mv/allfaces/index.htmlhttp://cswww.essex.ac.uk/mv/allfaces/index.html
  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    66/122

    Hnh 8: V d v nh trong c s d liu ca Libor Spacek

    lm phong ph thm cho ngun nh khun mt, sau khi nh cchun ha v kch thc 25 x 25, nh s c cho qua php i xng [8]. Nh

    vy, cui cng c s d liu nh khun mt m chng ta c c l 1500 nh.

    66

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    67/122

    Hnh 9: V d v nh c chun ha v kch thc ca s 25 x 25 v

    sau khi ly i xng

    Sau khi chun ha v ly i xng, cc ca s c tin hnh tin x l.

    Thc ra, qu trnh tin x l c thc hin khi nh c cho vo h thng hun

    luyn mng neural. V trc khi thc hin tin x l, cc ca s nh c

    chuyn sang a mc xm grayscale 24bit bng cch s dng khng gian mu

    YcrCb (gi tr ca mi im nh a mc xm l gi tr sng Y ca khng gian

    mu YCrCb). Sau nh c tin hnh tin x l, u tin ca s c lcnhiu bng php lc thng thp, sau tin hnh cn bng lc mc xm

    lm tng tng phn trong nh [8].

    tin hnh cn bng lc mc xm, y, s s dng mt chp mt

    n loi b nh hng ca pixel nn kch thc 25 x 25

    Hnh 10: Mt n loi b kch nh hng ca pixel nn

    Nh vy qu trnh cn bng lc ch c tin hnh cho nhng pixel

    nm trong vng trn mt n [8]

    67

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    68/122

    Hnh 11: V d nh sau qu trnh cn bng lc

    2.1.2 nh hun luyn khng khun mt

    C th ni vic hun luyn nh pht hin khun mt gp nhiu thch thc

    l do gp kh khn trong vic biu th nh khng khun mt. Khng nhau vic

    nhn dng khun mt, trong cc lp phn bit l cc khun mt khc nhau.

    Hai lp gi l phn bit trong d tm khun mt l nh c cha khun mt vnh khng cha khun mt [6]. D dng ly c mu nh cha khun mt

    in hnh, nhng vic ly mu nh khng cha khun mt in hnh v c gi tr

    l kh hn rt nhiu. C th thy, i vi mt h thng c th, th nhng nh

    khng khun mt c xem l c gi tr nht khi n b pht hin nhm l nh

    khun mt. Trong n ny, do u vo l cc nh mu, v hn na nh trc

    khi c pht hin khun mt c cho qua b phn vng mu da, chnh v vy,nhng nh khng khun mt c gi tr thng thng l nh c cha vng c mu

    tng t mu da. Chnh v vy, tp nh khng khun mt c mu tng t mu

    da, c bit l tp nh c cha b phn c th con ngi nh tay, chn, cng nh

    cc b phn trn khun mt l ng ch nht.

    Tuy nhin m bo tnh tng qut ca h thng, tp nh khng khun

    mt c chun b khng ch c nhng nh c mu tng t mu da m l tp

    nh t nhin bt k. Nh nh hoa l cy c, nh ca.

    Trong n ny, qu trnh hun luyn nh khng khun mt bao gm

    hun luyn th ng v hun luyn ch ng c hc. Hun luyn th ng c

    ngha l hun luyn khng khun mt t tp nh to sn. Cn hun luyn ch

    ng c hc l tin hnh cp nht nhng ca s b pht hin nhm l khun mt

    68

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    69/122

    vo c s d liu nh khng khun mt. Ton b qu trnh hun luyn ny s

    c cp n trong chng III ca n. Trong phn ny, ch cp n c

    s d liu to sn ban u, nh l mt bc chun b cho qu trnh hun luyn

    nh khng khun mt th ng.

    Tp nh ban u ny bao gm hai phn v cha khong 200 ca s. Trong

    , 100 ca s c to ngu nhin t mt s bc nh t nhin khng cha mt

    ngi. 100 nh cn li l tp cc nh c trch chn th cng t cc tp nh c

    sn. Nhng ca s ny tp trung vo nhng vng tong t mu da, cc b phn

    c th con ngi cng nh b phn ca khun mt. 200 nh ny sau qu trnh

    trch chn cng c tin hnh lc nhiu v cn bng lc xm.

    Hnh 12: Hnh minh ha cc ca s c trch chn ngu nhin trong c s

    d liu nh hun luyn khng khun mt.

    Bn cnh tp 200 nh to sn ny, chng ta cng chun b sn khong 50

    bc nh c s dng tin hnh hun luyn ch ng c hc cho nh khng

    khun mt .y l ngun nh c ly bt k trn mng Internet. 50 nh ny l

    69

  • 8/2/2019 HA thAng pht hiAn khun mAt dAa trn mAng neural v phuong php vn vng mu da

    70/122

    tp cc nh mu kch thc 480 x 360, l cc nh tp th, gia nh, t nhin. Tp

    50 nh ny cng c tin hnh lc nhiu v cn bng lc xm.

    Hnh 13: V d v nh dng hun luyn ch ng nh khng khun mt

    2.2 nh hun luyn phn vng mu da

    M hnh phn vng mu da c s dng da trn m hnh c tham s

    da trn phn phi Gaussian, s dng trong khng gian mu YCrCb.

    c th hc tt v to ra b tham s hiu qu, cc mu mu da c

    trch chn phi l nhng mu in hnh, bao gm tt c cc mu da ca cc chu

    lc, chng tc. ng thi phi l mu da thc, khng phi mu da c trang

    im hay x l bng k thut x l nh.

    Ton b mt trm mu mu da c trong c s d liu ca n u c

    trch chn th cng t nhiu bc nh tm kim trn Internet. Cc mu mu da

    ny bao gm kh y cho cc chng tc chu lc u, , M, Phi