Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi...
Transcript of Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi...
![Page 1: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/1.jpg)
Recommender Systems ĐặngHoàngVũ
BancôngnghệtậpđoànFPT
![Page 2: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/2.jpg)
Giới thiệu
• Recommendersystemscòngọilàcáchệkhuyếnnghị.• Mụcđíchnhằmlựachọncácsảnphẩmphùhợpnhấtvớingườidùng,cánhânhóatrảinghiệmngườidùng.• Đượcsửdụngrộngrãitrongnhiềulĩnhvực.
![Page 3: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/3.jpg)
Lợi ích
• Cảithiệntrảinghiệmngườidùng.• Tốiưuhóadoanhthuquaup-sale,cross-sale…• Tănghiệunănghoạtđộngbằngtựđộnghóa.• Biếnkháchhànggềmnăngthànhkháchhàngthật.• Hỗtrợbusinessintelligence.
![Page 4: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/4.jpg)
Tổng quan
Cácthànhphầnchính:• Tậphợpngườidùng.• Tậphợpsảnphẩm.• Thônggnvềngườidùng,sảnphẩm.• Lịchsửgiaodịch.Giảthiết:mứcđộphùhợpcủamỗisảnphẩmvớimỗingườidùngcóthểsốhóavàmôhìnhhóa.
![Page 5: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/5.jpg)
Chu trình
• Thuthậpdữliệu.• Thiếtkếfeature.• Xâydựngmôhình.• Đánhgiámôhình.• Cảigến…
![Page 6: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/6.jpg)
Đánh giá recommender systems
Đánhgiáoffline:sửdụngdữliệuđãthuthậpsẵn.• Kếtquảtốtlàkếtquảtrùngkhớpvớidữliệu.• CóthểsửdụngcácđộđonhưMAE,RMSE...• Dữliệutestcóthểcùnghoặckhácloạivớidữliệuđểxâydựngmôhình.Đánhgiáonline:thửnghiệmmôhìnhtrênthựctế.• A/Btesgngnếucóđiềukiện.• Đánhgiábằngcácđộđocóýnghĩathựctế.Chúý:chínhxácchưachắcđãtốt!
![Page 7: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/7.jpg)
Một số kỹ thuật bổ trợ recommenda@on
• Naturallanguageunderstandinglàmộtchuyênngànhlớnvớirấtnhiềuứngdụng.Cáckỹthuậtquantrọngchoứngdụngrecommendagoncónamedengtyrecognigon,topicmodeling,sengmentanalysis…• Dimensionalityreducgonphụcvụhaimụcđích:giảmkhốilượngdữliệuvàgiảmđộthưacủadữliệu.Cáckỹthuậtthôngdụngcóclustering,PCA,hashing…• Regression,classificagonlàcácbàitoáncănbảntrongmachinelearning,cóthểứngdụngtrựcgếpvàodựđoáncácsảnphẩmphùhợp.Cáckỹthuậtphổbiến:linearregression,ridgeregression,SVM,randomforests…
![Page 8: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/8.jpg)
Content-based recommenda@on
• Dựavàocácthuộc�nhcủasảnphẩm.• Mạnhvớicácsảnphẩmgiàunộidungnhưtronglĩnhvựctruyềnthông,quảngcáo,ytế…• Cóthểrecommendsảnphẩmmới,thíchhợpkhidanhsáchsảnphẩmđượccậpnhậtliêntục.
![Page 9: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/9.jpg)
Các bước chính
• Biểudiễnmỗisảnphẩmdướidạngmộtvectorthuộc�nh.• Recommendcácsảnphẩmtươngtựnhau.• Hoặcxâydựngprofilengườidùngtheocácthuộc�nhsảnphẩmvàrecommendsảnphẩmcóthuộc�nhphùhợpvớiprofilengườidùng.
![Page 10: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/10.jpg)
Thuộc Bnh và độ đo tương tự
• Cácthuộc�nhcóthểlàsốthực,sốnguyênhoặcrờirạc.• Cácđộđotươngtựkhácnhauđòihỏidạngdữliệukhácnhau.• Chuyểnđổitừsốsangrờirạcbằngcáchchiakhoảng.• Chuyểnngượclạibằngone-hotencoding.
![Page 11: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/11.jpg)
Các độ đo tương tự
![Page 12: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/12.jpg)
Các độ đo tương tự
Mahalanobisdistance
![Page 13: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/13.jpg)
Các độ đo tương tự
![Page 14: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/14.jpg)
Các độ đo tương tự
• KLdivergencegiữahaiphânbốxácsuất
![Page 15: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/15.jpg)
Collabora@ve filtering
• Dựavàolịchsửgiaodịchđể�mcácquyluậttươngtácgiữangườidùngvàsảnphẩm.• Khôngcầnbiếtthuộc�nhsảnphẩm.• Cókhảnăngkhaithácthônggnngoàiphạmvicủacácthuộc�nhsảnphẩm.• Giảthiếtcănbản:ngườidùngtươngtựnhauquantâmđếnsảnphẩmtươngtựnhau.
![Page 16: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/16.jpg)
Ưu điểm
![Page 17: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/17.jpg)
User-based vs item-based
![Page 18: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/18.jpg)
User-based collabora@ve filtering
• Biểudiễnmỗingườidùngbằngmộtvectorcácsảnphẩmđãtươngtác,cóthểcótrọngsố.• Tínhđộtươngtựgiữacácvectorđạidiệnchongườidùng.• ĐốivớingườidùngA,ước�nhđộphùhợpcủasảnphẩmdựavàolịchsửcủanhómngườidùngtươngtựnhưA.• CóthểchọnkngườidùnggầngiốngAnhất,hoặcchọntấtcảngườidùngnhưngthêmtrọngsốđểưugênnhữngngườigiốngAhơn.
![Page 19: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/19.jpg)
Công thức Bnh độ phù hợp
![Page 20: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/20.jpg)
Công thức Bnh độ phù hợp
• prx,k=độphùhợpước�nhcủasảnphẩmkvớingườidùngx• mx=độphùhợptrungbìnhcủacácsảnphẩmvớingườidùngx• ry,k=độphùhợpcủasảnphẩmkvớingườidùngy• my=độphùhợptrungbìnhcủacácsảnphẩmvớingườidùngy
![Page 21: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/21.jpg)
Công thức Bnh độ phù hợp
Trongtrườnghợpgiớihạnkngườidùnggầngiốngnhất:• sim(ux,uy)=1• Nx=tậphợpkngườidùnggầngiốngxnhất
Trongtrườnghợpkhônggiớihạnngườidùngtươngtự:• sim(ux,uy)=độtươngtựgiữacácvectorngườidùngxvày,hoặcmộthàmđồngbiếndựatrênđộtươngtự• Nx=tậphợpngườidùngcóítnhấtmộtsảnphẩmtươngtáctrùngvớix
![Page 22: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/22.jpg)
Khối lượng Bnh toán
Giảsửcómngườidùngvànsảnphẩm:• Trongtrườnghợpxấunhất,độphứctạpcủathuậttoánlàO(mn).• Trênthựctếphầnlớnngườidùngchỉtươngtácvớisốsảnphẩmgiớihạnnênkhốilượng�nhtoánchonhómnàylàO(m).• Vớisốítngườidùngtươngtácvớinhiềusảnphẩm,khốilượng�nhtoánchonhómnàylàO(n).• VậyđộphứctạptrênthựctếlàO(m+n).
![Page 23: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/23.jpg)
Kỹ thuật phụ trợ
• Vớisốlượngngườidùnglớn,cóthểphânnhómđểgiảmkhốilượng�nhtoán.• Phânnhómbằngdimensionalityreducgon:ánhxạtậphợpngườidùnghoặctậphợpsảnphẩmlênkhônggianítchiềuđểthunhỏdữliệu.• Phânnhómbằngclustering:chiatậphợpngườidùngthànhnhiềucụmnhỏ,khirecommendchongườidùngnàothìxemxétcụmđó.• Thayvìcôngthức�nhtrungbình,cóthểdùngcácmôhìnhclassificagon,regressionđể�nhđộphùhợpởbướccuốicùng.
![Page 24: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/24.jpg)
Item-based collabora@ve filtering
• Biểudiễnmỗisảnphẩmbằngmộtvectorngườidùng.• Tínhđộtươngtựgiữacácsảnphẩm.• ĐốivớingườidùngA,�mcácsảnphẩmtươngtựvớicácsảnphẩmAđãtươngtác.• RecommendsảnphẩmchoAtừcácsảnphẩmnóitrên,bằngcácgêuchínhưtrọngsốcao,nhiềungườitươngtác…
![Page 25: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/25.jpg)
Tính độ tương tự giữa các sản phẩm
VớimỗisảnphẩmA:VớimỗingườidùngXđãtươngtácvớiA:VớimỗisảnphẩmBkhácAmàXđãtươngtác:LưudữkiệnlàmộtngườidùngđãtươngtácvớicảAvàB.VớimỗisảnphẩmBkhácAđãcócùngngườidùngtươngtác:TínhđộtươngtựgiữaAvàBdựatrêncácdữkiệnđãlưu.
![Page 26: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/26.jpg)
Khối lượng Bnh toán
• Khốilượng�nhtoánlớnnhấtnằmởphần�nhđộtươngtựgiữacácsảnphẩm.• Giảsửcómngườidùngvànsảnphẩm,thìđộphứctạptrongtrườnghợpxấunhấtlàO(n2m).• TrênthựctếđộphứctạpthườnglàO(mn)vìdữliệuthưa,đạiđasốcáccặpsảnphẩmkhôngcócùngngườidùngtươngtác.• Tuynhiênbướcnàychỉcần�nhmộtlầnchotấtcảcáclượtngườidùng.
![Page 27: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/27.jpg)
Kỹ thuật phụ trợ
• Độtươngtựgiữacácsảnphẩmcóthể�nhtrướcvàthỉnhthoảngmớicậpnhật.• Cóthểbổsungthônggnvềthuộc�nhsảnphẩmkhi�nhđộtươngtựđểgiảiquyếttrườnghợpsảnphẩmíttươngtác.• Cóthểápdụngcáckỹthuậtphânnhóm,classificagon,regression…nhưvớiuser-basedcollaboragvefiltering.
![Page 28: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/28.jpg)
Matrix factoriza@on
• Ápdụngđượcchocảuser-basedvàitem-basedcollaboragvefiltering.• Thuộcloạilatentfactormodel,môtảngườidùngvàsảnphẩmbằngcácnhântốẩn.• Cótácdụnggiảmsốchiềudữliệu(dimensionalityreducgon).
![Page 29: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/29.jpg)
Các bước chính
• Lậpuser-itemmatrix.• Táchuser-itemmatrixthànhhaithừasố:usermatrixvàitemmatrix.• Mỗingườidùngtươngứngvớimộthàngtrênusermatrix.• Mỗisảnphẩmtươngứngvớimộtcộttrênitemmatrix.• Ước�nhđộphùhợpbằng�chvôhướngcủavectorngườidùngvàvectorsảnphẩm.• Ước�nhđộtươngtựbằngcáchsosánhcácvectorngườidùngvớinhau(hoặccácvectorsảnphẩmvớinhau)nếucácmatrậnthỏamãnmộtsốđiềukiệnnhấtđịnh.
![Page 30: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/30.jpg)
User-item matrix
• Mỗingườidùngtrênmộtdòng,mỗisảnphẩmtrênmộtcột.• Cóthểchuẩnhóabằngcáchtrừđigiátrịtrungbình.• Thườnglàmatrậnthưa,vìđasốcáccặpuser-itemkhôngcótươngtác.
![Page 31: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/31.jpg)
Giả thiết
• Tươngtácgiữangườidùngvàsảnphẩmchịuảnhhưởngcủahailoạitácnhân:cácquyluậttươngtácvàcácyếutốngẫunhiên(docánhânngườidùng,tácđộngngoạicảnh…)• Cácyếutốngẫunhiênkhôngthểdựđoán,nhưngtổnghiệuứngtrêntoàntậphợplànhỏ.• Cácquyluậttươngtáclàtácnhânchínhvàcóthểmôhìnhhóa.• Mụcgêulàước�nhđộphùhợptheocácquyluậttươngtác,bỏquahiệuứngcủacácyếutốngẫunhiên.
![Page 32: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/32.jpg)
Giả thiết
• User-itemmatrixR=S+N• Slàhiệuứngcủacácquyluật• Nlàhiệuứngcủacácyếutốngẫunhiên• Ncóbiênđộnhỏ.• Scóintrinsicdimensionalitynhỏ.
![Page 33: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/33.jpg)
Intrinsic dimensionality
![Page 34: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/34.jpg)
Factoriza@on
Giảsửcómngườidùngvànsảnphẩm:• User-itemmatrixR~UIkíchthướcmxn.• Ulàusermatrix,kíchthướcmxd.• Ilàitemmatrix,kíchthướcdxn.• dlàthamsố,nhỏhơnnhiềusovớim,n.• S=UIlàmatrậnxấpxỉvớiR,cóintrinsicdimensiond.
![Page 35: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/35.jpg)
Factoriza@on
![Page 36: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/36.jpg)
Ước Bnh độ phù hợp
Đểước�nhđộphùhợpcủasảnphẩmyvớingườidùngx:• VectorđạidiệnxlàdòngUxtrênmatrậnU.• VectorđạidiệnylàcộtVytrênmatrậnV.• Ước�nhđộphùhợpbằng�chvôhướng:Ux.Vy=Sxy(phầntửởdòngxcộtycủamatrậnS)• Sxy~Rxylàphầncònlạikhiđãloạibỏcáchiệuứngngẫunhiên,tứclàđộphùhợpcủayvớixtheocácquyluậttươngtác.
![Page 37: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/37.jpg)
Nhận xét
• Bằngcáchgiảmchiềudữliệu,taloạibớtthônggnđểtránhviệckếtquảchỉlặplạiuser-itemmatrix(SquágầnvớiR).• Giảthiếtquantrọnglàphươngphápfactorizagonloạibỏđúngcáchiệuứngngẫunhiên.• Mỗivectorngườidùnghoặcsảnphẩmcódchiều,ứngvớidnhântốẩn(latentfactor).
![Page 38: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/38.jpg)
SVD
• Thuậttoánchokếtquảchínhxác.• CácphầntửtrênmatrậnSxếptheothứtựgiảmdần.
![Page 39: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/39.jpg)
SVD
![Page 40: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/40.jpg)
Giảm chiều bằng SVD
• Loạibỏthônggnbằngcáchbỏbớtcácchiềucuốicùng.• PhầncònlạiđảmbảolàgầnvớiXnhấttrongtấtcảcáccáchfactorizagon.
![Page 41: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/41.jpg)
Factoriza@on bằng tối ưu hóa
• Dùngtốiưuhóađểước�nhusermatrixvàitemmatrixtrựcgếp.• Đạilượngcầntốiưulàsaisốgiữađộphùhợpước�nhvàdữliệuthậttrênuser-itemmatrix.• Dùngregularizagonđểloạibớtthônggn.• TốiưubằngSGDhoặcALS.
![Page 42: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/42.jpg)
SVD hàng nhái
![Page 43: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/43.jpg)
SVD++
• Mỗisảnphẩmcóthêmmộtvectorphụ.• Ước�nhđộphùhợpdùngcảgiátrịvectorphụcủatấtcảcácsảnphẩmngườidùngđóđãtươngtác.• Phảithêmcảcácvectorphụvàoregularizagon.
![Page 44: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/44.jpg)
SVD++
![Page 45: Recommender Systems - Duy Tan Universitykcntt.duytan.edu.vn/uploads/29d18444-3d47-4a5d... · Lợi ích • Cải thiện trải nghiệm người dùng. • Tối ưu hóa doanh](https://reader030.fdocuments.net/reader030/viewer/2022040306/5ec8a7e29a9fa51b9635492b/html5/thumbnails/45.jpg)
Độ tương tự giữa người dùng hoặc sản phẩm • Cóthểước�nhđộtươngtựgiữacácngườidùngbằngcáchsosánhcácvectorngườidùng(thườngdùngcosinesimilarity).• Tuynhiêncầnđiềukiện:itemmatrixphảilàorthogonalmatrix.• Ngượclạimuốnsosánhvectorsảnphẩmthìusermatrixphảilàorthogonalmatrix.• Mộtsốphươngphápfactorizagonkhôngđảmbảođiềukiệntrên,nhưngcóthểdùngbiếnđổiđạisốđểkhắcphục.