Probabilit µi ³i Statistic 1 Probleme propuse - math.uaic.rostoleriu/ProblemeSeminar.pdf ·...
Transcript of Probabilit µi ³i Statistic 1 Probleme propuse - math.uaic.rostoleriu/ProblemeSeminar.pdf ·...
Probabilit µi ³i Statistic
1 Probleme propuse
P1: O echip de 5 persoane ce trebuie s conµin 3 b rbaµi ³i 2 femei este aleas dintre 8 b rbaµi ³i 7femei. Câte echipe diferite pot � selectate?
R = C38 · C2
7
P2: În câte moduri pot � aranjate 3 femei ³i 4 b rbaµi împreun , într-un acela³i ³ir la teatru, astfel încâttoate cele trei femei s �e mereu a³ezate al turi una de cealalt .
R = 3! · 5!
P3: O moned ideal este aruncat de 100 de ori, iar X este variabila aleatoare ce reprezint num rulde feµe cu stema ap rute.(a) Care este probabilitatea de a obµine exact 52 de steme?(b) S se calculeze P (45 ≤ X ≤ 55).
√ (a) X este o variabil aleatoare repartizat binomial B(100, 0.5).
P = P = P (X = 52) = C52100 · (0.5)52 · (0.5)48 = 0.0735.
(b) Not m cu FX funcµia de repartiµie pentru X. Atunci,
P (45 ≤ X ≤ 55) = P (X ≤ 55)− P (X < 45)
= FX(55)− FX(44)
=55∑
k=45
Ck100 · (0.5)k · (0.5)100−k = 0.7287.
În Matlab:
P1 = nchoosek(100,52)*(0.5)^52*(0.5)^48
P2 = binocdf(55,100,0.5) - binocdf(44,100,0.5) √
P4: Cineva a înregistrat zilnic timpul între dou sosiri succesive ale tramvaiului într-o anumit staµie ³ia g sit c , în medie, acesta este de 20 de minute. Se ³tie c acest timp este distribuit exponenµial. Dac opersoan a ajuns în staµie exact când tramvaiul pleca, a�aµi care sunt ³ansele ca ea s a³tepte cel puµin 15minute pân vine urm torul tramvai.
√ Not m cu T timpul de a³teptare în staµie între dou sosiri succesive ale tramvaiului ³i cu FT funcµiasa de repartiµie. �tim c T ∼ exp(λ), unde λ = 20. A³adar, avem de calculat P (T ≥ 15), care este:
P (T ≥ 15) = 1− P (T < 15) = 1− FT (15),
³i aceasta este1 - cdf('exp',15, 20) = 0.4724,
Probleme propuse [Dr. Iulian Stoleriu] 2
ceea ce implic 47.24% ³anse. √
P5: Un sondaj preliminar a determinat c 42% dintre persoanele cu drept de vot dintr-o anumit µar ar vota candidatul C pentru pre³edinµie. Alegem la întâmplare 200 de votanµi. Care este probabilitatea caun procent dintre ace³tia, situat între 40% ³i 50%, îl vor vota pe C la pre³edinµie?
√ S not m cu p = 0.42 ³i cu X variabila aleatoare ce reprezint num rul de votanµi ce au ales candidatulC, din selecµia aleatoare de volum n = 200 considerat . Este clar c X ∼ B(n, p). Se cere probabilitateaP (80 ≤ X ≤ 100) (deoarece 40% din 200 înseamn 80 etc). Deoarece X este o variabil aleatoare discret ,avem c :
P = P (80 ≤ X ≤ 100) = P (X ≤ 100)− P (X < 80) = FX(100)− FX(79),
unde FX este funcµia de repartiµie a lui X.În Matlab:
P = binocdf(100, 200, 0.42) - binocdf(79, 200, 0.42) = 0.7303. √
P6: Care este probabilitatea de apariµie pentru prima oar a feµei cu 6 puncte la aruncarea unui zarideal în cel mult 3 arunc ri? Dar în exact 3 arunc ri?
√ Not m cu X v.a. variabil aleatoare ale c rei valori reprezint num rul de e³ecuri avute pân la primul
succes. Aceasta urmeaz repartiµia geometric Geo(1/6). În consecinµ , num rul de arunc ri necesare
obµinerii feµei pentru prima dat este Y = X + 1. Probabilitatea de a obµine pentru prima oar aceast faµ din cel mult 3 arunc ri este totuna cu probabilitatea de a avea cel mult 2 e³ecuri pân laapariµia acestei feµe. A³adar, avem:
P1 = P (Y ≤ 3) = P (X ≤ 2) = 0.4213.
Probabilitatea de a obµine pentru prima oar faµa din exact 3 arunc ri este:
P2 = P (Y = 3) = P (X = 2) = 0.1157.
În Matlab scriem:
P1 = geocdf(2,1/6);
P2 = geopdf(2,1/6); √
P7: Dintre spectatorii prezenµi pe un anumit stadion la un meci de fotbal, un procent de 20% sunt femei.La o tombola organizat pentru spectatori, un computer alege la întâmplare numerele a 7 bilete de intrare³i se premiaz posesorii.(i) Care este probabilitatea ca m car 3 dintre spectatorii premiaµi s �e femei?(ii) Care este probabilitatea ca nicio femeie s nu câ³tige la tombol ?(iii) Dac selecµia biletelor câ³tig toare ar � fost realizat prin alegerea a 7 spectatori ce erau a³ezaµi în ³ir,pe un acela³i rând ales la întâmplare, argumentaµi dac probabilit µile g site la (i) si (ii) r mân acelea³i.
√ FieX variabila aleatoare ce reprezint num rul de femei ce apar la alegerea la întâmplare a 7 spectatori.Atunci X ∼ B(7, 0.2). Fie p = 0.2.(i) P (X ≥ 3) = 1− P (X < 3) = 1− P (X ≤ 2) = 1− FX(2) = 0.1480.În Matlab,
P1 = 1-binocdf(2,7,0.2).
(ii) P (X = 0) = C07 p
0 (1− p)7 = 0.2097.
Probleme propuse [Dr. Iulian Stoleriu] 3
În Matlab,P2 = binopdf(0,7,0.2).
(iii) În acest caz, X nu ar mai � o v.a. binomial , deoarece alegerea spectatorilor nu mai este aleatorie(spectatorii a³ezaµi al turi pot � cuno³tinte, prieteni etc.). √
P8: Not m cu Sn suma numerelor ce apar în n arunc ri independente ale unui zar ideal.(a) Calculaµi probabilitatea P = P (S2 ≥ 6).(b) Calculaµi probabilitatea obµinerii unui num r par.
P9: Într-un lot de 100 piese 8 sunt defecte, iar în alt lot de 120 piese 9 sunt defecte. Din unul din acestedou loturi, ales la întâmplare, se iau 10 piese. Care este probabilitatea ca între piesele alese s �e 8 piesebune ³i 2 defecte?
P10: (i) Care e probabilitatea de a ghici toate cele 6 numere, jucand o varianta simpla la LOTTO 6/ 49?(ii) Un cetatean optimist joaca in �ecare saptamana cate o varianta simpla la LOTTO 6/ 49 .Estimati numarul mediu de saptamani pana obtine pentru prima oara 6 numere castigatoare.
[Indiciu pentru (ii):
numarul de ordine al saptamanii in care va striga pentru prima oara εúρηκα este o v.a. Y = X+ 1, cu X ∼ Geo(p)]
P11: Consideram functia f : R −→ R, data prin
f(x) =
{a e−x , x > 0;
0 , x ≤ 0.
(i) Gasiti valoarea parametrului a pentru care f(x) este o densitate de repartitie;(ii) Fie X v.a. ce are densitatea de repartitie gasita. Calculati probabilit µile P (X = 1) ³i P (X > 1);
P12: (a) Determinaµi num rul de permut ri distincte ale literelor cuvântului MISSISSIPPI.(b) Determinaµi num rul de aranjamente distincte care pot � obµinute din literelor cuvântului STATISTICS.
P13: Un cofraj conµine 10 ou , dintre care dou sunt sparte. Dac se aleg 5 ou la întâmplare, care esteprobabilitatea ca dintre cele cinci: (a) niciunul s nu �e spart; (b) un ou s �e spart.
P14: Un grup de perechi soµ-soµie este aranjat la întâmplare de un fotograf. Care este probabilitatea ca�ecare soµie s � fost a³ezate lâng soµul ei? Dar probabilitatea ca m car o soµie s nu � fost a³ezat lâng soµul ei?
P15: O moned este aruncat de 10 ori.(a) Câte secvenµe diferite care s conµin 6 steme ³i 4 capete pot ap rea?(b) Care este probabilitatea de a obµine 6 steme ³i 4 capete?
P16: Un zar corect este aruncat de 9 ori. Determinaµi probabilitatea de a obµine:(a) trei de 6; (b) cel puµin doi de 3; (c) cel mult un 5; (d) un num r par.
P17: Not m cu Sn suma numerelor ce apar în n arunc ri independente ale unui zar ideal.(a) Calculaµi probabilitatea P1 = P (S2 ≥ 6).(b) Calculaµi probabilitatea P2 = P (S3 = 5).
P18: (i) În faµa unui oponent de acela³i calibru la tenis de mas , care eveniment este mai probabil: s câ³tigi 3 partide din 4, sau s câ³tigi 5 partide din 8? Justi�caµi r spunsul.(ii) Se menµine rezultatul anterior dac , în loc de tenis de mas , cei doi s-ar întrece la ³ah? Presupunemc ³i la ³ah competenµii sunt de aceea³i valoare. Justi�caµi r spunsul.
Probleme propuse [Dr. Iulian Stoleriu] 4
P19: Un sondaj arat c , dac o persoan sufer de TBC, atunci ea este descoperit în 73.3% dintrecazuri în urma unei radiogra�i. De asemenea, sondajul arat c , chiar dac o persoan este s n toas ,radiagra�a indic semne de TBC în 2.8% dintre cazuri. Într-un studiu recent dintr-o anumit µar , s-aestimat c rata persoanelor care sunt bolnavi de TBC este de 1.7%.(a) Care este probabilitatea ca, pentru o persoan aleas la întâmplare din acea µar , testul s �e pozitiv?(b) Care este probabilitatea ca o persoan s aib TBC atunci când rezultatul testului a fost pozitiv?
P20: Doi persoane joac un joc care este câ³tigat de cel care ajunge primul la trei victorii. Dac , dinanumite motive, jocul se întrerupe la scorul de 2 : 1, cum trebuie împ rµit miza pus în joc? (miza va �împ rµit proporµional cu ³ansele �ec rui juc tor de a ajunge la trei victorii)
P21: În anumite familii, p rinµii continu s aib copii pâna au cel puµin câte un copil de �ecare sex. S presupunem c probabilitatea de a avea un copil, indiferent de sex, este 0.5. Pentru astfel de familii, careeste probabilitatea de a avea 4 copii?
P22: Trei întreprinderi trimit acela³i tip de piese într-un depozit central, în proporµie de 5, 3, 2. Celetrei întreprinderi au rebuturi în proporµie de, respectiv, 1%, 3%, 2%. Valoarea pieselor ce s-au dovedit a �rebuturi este de 3600 RON. Cum ar trebui împ rµit aceast sum între cele 3 întreprinderi?
P23: Pentru evaluarea rezultatelor obtinute la teza de Matematica de catre elevii unei anumite scoli, seface un sondaj de volum 35 printre elevii scolii, iar notele lor sunt sumarizate in Tabelul 1.
note 4 5 6 7 8 9 10
frecventa 3 6 7 8 5 4 2
Tabela 1: Medii generale si frecvente
(i) Sa se scrie si sa se reprezinte gra�c functia de repartitie pentru aceasta selectie;(ii) Notam cu X variabila aleatoare care guverneaza populatia. Utilizand selectia de mai sus, sa se apro-ximeze probabilitatea P (6 ≤ X ≤ 8).
P24: Dac un ceas se opre³te la întâmplare, care este probabilitatea ca limba care indic orele s seopreasc între 7 ³i 10?
P25: Pe segmentul AB se alege un punct P la întâmplare, în mod uniform.(i) Care este probabilitatea ca distanµa de la punctul P la A s �e cel puµin de dou ori mai mare cadistanµa de la P la B?(ii) Care este probabilitatea ca punctul P s împart segmentul în dou p rµi ce p streaz proporµia 2 : 1?
P26: Consider m funcµia f : R −→ R, dat prin
f(x) =
2
λx e−
x2
λ , x > 0;
0 , x ≤ 0.
(a) Pentru ce valori ale parametrului λ, funcµia f este o densitate de repartiµie?(S not m cu X variabila aleatoare ce are aceast densitate de repartiµie)
(b) Calculaµi EX ³i D2(X).(c) Dac λ = 2, calculaµi P (X ≥ 2).
P27: Durata de funcµionare continu a unui anumit tip de baterii este o variabil aleatoare normal ,de medie 10h ³i dispersie 3.2. Care este probabilitatea ca o baterie aleas la întâmplare s aib durata defuncµionare continu cuprins între 9.5h ³i 10.5h ?
Probleme propuse [Dr. Iulian Stoleriu] 5
P28: În drumul Mariei de acas pân la serviciu se a� dou semafoare. Not m cu X1 v.a. ce reprezint num rul de semafoare pe care Maria le prinde pe ro³u, ³i presupunem c repartiµia lui X1 este urm toarea:
x 0 1 2
p(x) 0.2 0.5 0.3
De asemenea, �e X2 num rul de semafoare pe care Maria le prinde pe ro³u pe drumul de întoarcere sprecas . Presupunem c X2 ³i X1 sunt independente ³i identic repartizate.(a) Determinaµi repartiµia, media ³i dispersia variabilei aleatoare X = X1 +X2
(b) Care e probabilitatea ca Maria s prind cel puµin 2 semafoare pe ro³u de acas la serviciu ³i retur?
P29: Distanµa X la care sunt aruncate mingile aruncate de o ma³in automat de servit mingi de teniseste o variabil aleatoare repartizat normal. Media distanµei este necunoscut , dar deviaµia standard este1.2m.(a) �tiind c P (X ≤ 20) = 0.95, s se g seasc valoarea a³teptat a distanµei (adic , E(X)).
(b) Stabiliµi repartiµia variabilei aleatoare Z =X − 18
1.2³i calculaµi probabilitatea P (Z2 ≤ 20).
P30: Presupunem ca inaltimea unei persoane este o v.a. repartizata normal. Media de inaltime ajucatorilor unei echipe de baschet masculin este 195 cm, cu deviatia standard 5 cm. Inaltimea usii de lavestiarul echipei este de 2 metri.
(a) Determinati procentul dintre jucatorii echipei care sunt prea inalti pentru a trece de aceasta usa farasa se aplece. (Presupunem ca se apleaca doar daca inaltimea lor este mai mare de 2m).
(b) Sa se determine probabilitatea ca inaltimile jucatorilor sa �e intre 190 cm si 210 cm.
P31: Masa (in grame) a unui anumit tip de franzele produse de o masina intr-o brutarie este o variabilaaleatoare N (400, 10). Pentru a controla daca masina respecta standardele cantitative, s-au cantarit laintamplare 50 dintre franzelele produse de respectiva masina intr-o zi.Painile care au masa sub 380g sau peste 420g nu sunt conforme cu standardul CTC. Sa se gaseasca proportiade paini care nu respecta standardul masei.
P32: Doi tr g tori trag asupra unei µinte. Probabilitatea �ec ruia dintre ei de a atinge µinta este 1/3.Câ³tig cel care atinge µinta pentru prima oar . S se precizeze variabila aleatoare care modeleaz num rulde trageri necesare pentru ca µinta s �e lovit ³i s se calculeze media ³i dispersia sa.
P33: S not m cu X num rul de ou depuse de o bufniµ uliu (Bubo Bubo) într-un anumit an. X esteo variabil aleatoare ce are repartiµia:
X :
(1 2 3 4
0.1 0.1 0.3 0.5
).
Pentru �ecare ou, probabilitatea ca din el s iasa un pui este 0.8, independent de toate celelalte ou . S not m cu Y num rul de pui ce apar într-un cuib luat la întâmplare. G siµi repartiµia v. a. Y .
P34: Consider m o v.a. X ∼ U(−π
2 ,π2
). Determinaµi densitatea de repartiµie a v.a. Y = tanX.
P35: Consider m funcµia
f(x) =
{a sinx , x ∈ [0, π];
0 , x 6= [0, π].
(a) Pentru ce valori ale parametrului a, funcµia f este o densitate de repartiµie?(S not m cu X variabila aleatoare ce are aceast densitate de repartiµie)
Probleme propuse [Dr. Iulian Stoleriu] 6
(b) Calculaµi EX ³i D2(X).(c) Calculaµi P (0 ≤ X < π
6 ).(d) Determinaµi funcµia de repartiµie a lui X;(e) Calculaµi mediana Me(X).
P36: Consider m o v.a. X de tip continuu, având funcµia de repartiµie
F (x) =
0 , x ≤ 0;x
4
[1 + ln
(4
x
)], x ∈ [(0, 4];
1 , x > 4.
Calculaµi:(a) P (X ≤ 1), P (X = 1);(b) E(X);(c) P (1 ≤ X < 3).
P37: Care dintre urm toarele dou evenimente are probabilitatea mai mare: s obµinem m car o dat faµa cu 6 puncte din 4 arunc ri succesive ale unui zar ideal, sau s obµinem cel puµin o dubl (6, 6) aruncânddou zaruri ideale simultan de 24 de ori?
Anexa 1 [Dr. Iulian Stoleriu] 7
2 Anexa 1
Repartiµii probabilistice în Matlab
Funcµia de probabilitate (pentru v.a. discrete) ³i densitatea de repartiµie (pentru v.a. continue) (ambelenotate anterior prin f(x)) se introduc în Matlab cu ajutorul comenzii pdf, astfel:
pdf('LEGE', x, <param>) sau LEGEpdf(x, <param>).
Funcµia de repartiµie F (x) a unei variabile aleatoare se poate introduce în Matlab cu ajutorul comenziicdf, astfel:
cdf('LEGE', x, <param>) sau LEGEcdf(x, <param>).
Inversa funcµiei de repartiµie pentru repartiµii continue, F−1(y), se introduce cu comanda icdf, astfel:
icdf('LEGE', y, <param>) sau LEGEinv(y, <param>).
În comenzile de mai sus, LEGE poate � oricare dintre legile de repartiµie din Tabelul 2, x este un scalar sauvector pentru care se calculeaz f(x) sau F (x), y este un scalar sau vector pentru care se calculeaz F−1(y),iar <param> este un scalar sau un vector ce reprezint parametrul (parametrii) repartiµiei considerate.
Observaµia 1 Fie X o variabil aleatoare ³i F (x, θ) funcµia sa de repartiµie, θ �ind parametrul repartiµiei.Pentru un x ∈ R, relaµia matematic
P (X ≤ x) = F (x)
o putem scrie astfel în Matlab:
cdf('numele repartiµiei lui X',x,θ). (1)
Problema poate aparea la evaluarea în Matlab a probabilit µii P (X < x). Dac repartiµia considerat este una continu , atunci corespondentul în Matlab este tot (1), deoarece în acest caz
P (X ≤ x) = P (X < x) + P (X = x) = P (X < x).
De exemplu, dac X ∼ N (5, 2), atunci
P (X < 4) = cdf('norm', 4, 5, 2).
Dac X este de tip discret, atunci
P (X < x) =
{P (X ≤ [x]) , x nu e întreg
P (X ≤ m− 1) , x = m ∈ Z,
Anexa 1 [Dr. Iulian Stoleriu] 8
unde [x] este partea întreag a lui x.De exemplu, dac X ∼ B(10, 0.3), atunci
P (X < 5) = P (X ≤ 4)
= cdf('bino', 4, 10, 0.3) = 0.8497.
Tabelul 2 conµine câteva repartiµii uzuale ³i funcµiile corespunz toare în Matlab.
repartiµii probabilistice discrete repartiµii probabilistice continue
norm: repartiµia normal N (µ, σ)bino: repartiµia binomial B(n, p) unif: repartiµia uniform continu U(a, b)nbin: repartiµia binomial negativ BN(n, p) exp: repartiµia exponenµial exp(λ)poiss: repartiµia Poisson P(λ) gam: repartiµia Gamma Γ(a, λ)unid: repartiµia uniform discret U(n) beta: repartiµia Beta β(m,n)geo: repartiµia geometric Geo(p) logn: repartiµia lognormal logN (µ, σ)hyge: repartiµia hipergeometric H(n, a, b) chi2: repartiµia χ2(n)
t: repartiµia student t(n)f: repartiµia Fisher F(m, n)
wbl: repartiµia Weibull Wbl(k, λ)
Tabela 2: Repartiµii uzuale în Matlab
Anexa 1 [Dr. Iulian Stoleriu] 9
3 Anexa 2
Scurt introducere în Matlab
Matlab este un pachet comercial de programe de înalt performanµ produs de The MathWorks, Inc.,dedicat calculului numeric ³i reprezent rilor gra�ce în domeniul ³tiinµelor ³i ingineriei. Elementul de baz cu care opereaz Matlab-ul este matricea (Matlab este acronim de la MATrix LABoratory). Matlabeste un software standard în mediile universitare, precum ³i în domeniul cercet rii ³i rezolv rii practice aproblemelor legate de procesarea semnalelor, identi�carea sistemelor, calculul statistic, prelucrarea datelorexperimentale, matematici �nanciare, matematici aplicate în diverse domenii etc. Cea mai important caracteristic aMatlab-ului este u³urinµa cu care poate � extins. La programele deja existente înMatlab,utilizatorul poate ad uga propriile sale coduri, dezvoltând aplicaµii speci�ce domeniului în care lucreaz .Matlab-ul include aplicaµii speci�ce, numite Toolbox-uri. Acestea sunt colecµii extinse de funcµiiMatlab(�³iere M) care dezvolt mediul de programare de la o versiune la alta, pentru a rezolva probleme din domeniivariate. Structural,Matlab-ul este realizat sub forma unui nucleu de baz , cu interpretor propriu, în jurulc ruia sunt construite toolbox-urile.
Prezent m mai jos o scurt introducere în Matlab a principalelor funcµii ³i comenzi folosite în aceast lucrare. Pentru o tratare mai detaliat , puteµi consulta un manual de utilizare sau [9]. Mai menµion m aici³i lucrarea [1], unde puteµi g si diverse modalit µi de implementare în Matlab ale unor noµiuni de TeoriaProbabilit µilor ³i Statistic matematic .Folosind comanda demo din Matlab, puteµi urm ri o demonstraµie a principalelor facilit µi din Matlab,cât ³i a pachetelor de funcµii (toolbox) de care aµi putea � interesaµi. Dintre acestea, amintim Statistics
Toolbox, care este o colecµie de funcµii folosite pentru analiza, modelarea ³i simularea datelor. Conµine:analiza gra�celor (GUI), diverse repartiµii probabilistice (beta, binomial , Poisson, χ2), generarea numereloraleatoare, analiza regresional , descrieri statistice.
• Comenzile Matlab pot � scrise în �³iere cu extensia .m, ce urmeaz apoi a � compilate. Un �³ier-mconst dintr-o succesiune de instrucµiuni, cu posibilitatea apel rii altor �³iere-M precum ³i a apel riirecursive. De asemenea, Matlab poate � folosit ca pe un mediu computaµional interactiv, caz încare �ecare linie este prelucrat imediat. Odat introduse expresiile, acestea pot � vizualizate sauevaluate imediat. De exemplu, introducând la linia de comand
>> a = sqrt((sqrt(5)+1)/2)
Matlab de�ne³te o variabil de memorie a, c reia îi atribuie valoareaa =
1.2720
• Variabilele sunt de�nite cu ajutorul operatorului de atribuire, =, ³i pot � utilizate f r a declara dece tip sunt. Valoarea unei variabile poate �: o constant , un ³ir de caractere, poate reie³i din calcululunei expresii sau al unei funcµii.
• Pentru a g si informaµii imediate despre vreo funcµie prede�nit , comanda help va vine în ajutor. Deexemplu,
Anexa 1 [Dr. Iulian Stoleriu] 10
>> help length
a�³eaz urm toarele:
LENGTH Length of vector.
LENGTH(X) returns the length of vector X. It is equivalent
to MAX(SIZE(X)) for non-empty arrays and 0 for empty ones.
See also numel.
• Comanda help poate � utilizat doar dac se cunoa³te exact numele funcµiei. Altfel, folosirea comen-zii lookfor este recomandat . De exemplu, comanda
>> lookfor length
produce:
NAMELENGTHMAX Maximum length of MATLAB function or variable name.
VARARGIN Variable length input argument list.
VARARGOUT Variable length output argument list.
LENGTH Length of vector.
• Matlab este un mediu computaµional orientat pe lucru cu vectori ³i matrice. O linie de cod de forma
>> v = [1,3,5,7,9] % sau v = [1 3 5 7 9]
de�ne³te un vector linie ce are componentele 1, 3, 5, 7, 9. Aceasta poate � realizat ³i folosind co-manda v = 1:2:9 adic a�³eaz numerele de la 1 la 9, cu pasul 2. Pentru un vector coloan , folosimpunct-virgul între elemente, adic
>> v = [1;3;5;7;9] % vector coloana
O alt variant de a de�ni un vector este
>> v = linspace(x1,x2,n)
adic v este un vector linie cu n componente, la intervale egale între x1 ³i x2.
• De�nirea matricelor se poate face prin introducerea explicit a elementelor sale sau prin instrucµiuni³i funcµii. La de�nirea explicit , trebuie µinut cont de urm toarele: elementele matricei sunt cuprinseîntre paranteze drepte ([ ]), elementele unei linii trebuie separate prin spaµii libere sau virgule, liniilese separ prin semnul punct-virgul . De exemplu, comanda
>> A = [1 2 3; 4, 5, 6]
Anexa 1 [Dr. Iulian Stoleriu] 11
de�ne³te matriceaA =
1 2 3
4 5 6
• Apelul elementelor unei matrice se poate face prin comenzile A(i,j) sau A(:,j) (elementele decoloan j) sau A(i,:) (elementele de linia i);
• FuncµiaMatlab ones(m,n) de�ne³te o matrice m×n, având toate componentele egale cu 1. Funcµiazeros(m,n) de�ne³te o matrice zero m× n. Funcµia eye(n) de�ne³te matricea unitate de ordin n.
• Dup cum vom vedea mai jos, Matlab permite de�nirea unor funcµii foarte complicate prin scriereaunui cod. Dac funcµia ce o avem de de�nit este una simpl , atunci avem varianta utiliz rii comenziiinline. Spre exemplu, de�nim funcµia f(x, y) = e5x sin 3y:
>> f = inline('exp(5*x).*sin(3*y)')
f =
Inline function:
f(x,y) = exp(5*x).*sin(3*y)
Putem apoi calcula f(7, π) prin
>> f(7,pi)
0.5827
• Un program Matlab poate � scris sub forma �³ierelor script sau a �³ierelor de tip funcµie. Ambeletipuri de �³iere sunt scrise în format ASCII. Aceste tipuri de �³iere permit crearea unor noi funcµii, carele pot completa pe cele deja existente. Un �³ier script este un �³ier extern care conµine o secvenµ decomenzi Matlab. Prin apelarea numelui �³ierului, se execut secvenµa Matlab conµinut în acesta.Dup execuµia complet a unui �³ier script, variabilele cu care acesta a operat r mân în zona dememorie a aplicaµiei. Fi³ierele script sunt folosite pentru rezolvarea unor probleme care cer comenzisuccesive atât de lungi, încât ar putea deveni greoaie pentru lucrul în mod interactiv, adic în modullinie de comand .
Pentru a introduce date în Matlab, putem copia datele direct într-un �³ier Matlab, prin de�nirea unuivector sau a unei matrice de date. De exemplu, urm toarele date au fost introduse prin "copy-paste" înmatricea data:
>> data = [ % atribuirea valorilor matricei data
21.3 24.1 19.9 21.0 % prima linie a datelor copiate
18.4 20.5 17.5 23.2
22.1 16.6 23.5 19.7 % ultima linie a datelor copiate
]; % inchidem paranteza ce defineste matricea de date
Datele din Matlab pot � salvate astfel:
Anexa 1 [Dr. Iulian Stoleriu] 12
>> cd('c:\fisierul_de_lucru'); % alegem fisierul unde salvam datele
>> save Timpi_de_reactie data; % salveaza in fisierul Timpi_de_reactie.mat
Datele pot � reînc rcate folosind comanda
load Timpi_de_reactie % incarca datele din fisier
Timpi_de_reactie % afiseaza datele incarcate
Fi³ierele funcµie
Matlab creaz cadrul propice extinderii funcµiilor sale, prin posibilitatea cre rii de noi �³iere. Astfel, dac prima linie a �³ierului .m conµine cuvântul function, atunci �³ierul respectiv este declarat ca �ind �³ierfuncµie. Variabilele de�nite ³i manipulate în interiorul �³ierului funcµie sunt localizate la nivelul acesteia.Prin urmare, la terminarea execuµiei unei funcµii, în memoria calculatorului nu r mân decât variabilele deie³ire ale acesteia. Forma general a primei linii a unui �³ier este:
function[param_iesire] = nume_functie(param_intrare)
unde:
• function este este cuvântul care declar �³ierul ca �³ier funcµie;
• nume_functie este numele funcµiei, care este totuna cu numele sub care se salveaz �³ierul;
• param_iesire sunt parametrii de ie³ire;
• param_intrare sunt parametrii de intrare.
Comenzile ³i funcµiile care sunt utilizate de nou funcµie sunt înregistrate într-un �³ier cu extensia .m.
Exemplu 2 Fisierul medie.m calculeaz media aritmetic a sumei p tratelor componentelor unui vectorX (alternativ, aceast lucru poate � realizat prin comanda mean(X.^2)):
function m2 = medie(X)
n = length(X); m2 = sum(X.^2)/n;
Matlab-ul include aplicaµii speci�ce, numite Toolbox-uri. Acestea sunt colecµii extinse de funcµiiMatlab(�³iere-m) care dezvolt mediul de programare de la o versiune la alta, pentru a rezolva probleme dindomenii variate. Statistics Toolbox reprezint o colecµie de funcµii folosite pentru analiza, modelarea ³isimularea datelor ³i conµine: generarea de numere aleatoare; distribuµii, analiza gra�c interactiv (GUI),analiza regresional , descrieri statistice, teste statistice.
În Tabelul 3 am adunat câteva comenzi utile în Matlab.
Anexa 1 [Dr. Iulian Stoleriu] 13
% % permite adaugarea de comentarii in codhelp rand % help speci�c pentru funcµia randlookfor normal % cauta intrarile în Matlab pentru normalX=[2 4 6 5 2 7 10] % vector linie cu 7 elementeX=[3; 1; 6.5 ;0 ;77] % vector coloan cu 5 elementeX = -10:2:10 % vector cu numerele intregi de la −10 la 10, din 2 în 2length(X) % lungimea vectorului Xt=0:0.01:3*pi % de�ne³te o diviziune a [0, 3π] cu diviziunea 0.01X.^2 % ridic toate componentele vectorului X la puterea a douaX.*Y % produsul a doi vectoricumsum(X) % suma cumulat a elementelor vectorului Xcumprod(X) % produsul cumulativ al elementelor vectorului Xmin(X) % realizeaz minimum dintre componentele lui Xmax(X) % realizeaz maximum dintre componentele lu Xsort(X) % ordoneaz componentele lui X în ordine crescatoaresort(X, 'descend') % ordoneaz componentele lui X în ordine descrescatoareerf(X) % funcµia eroareexp(x) % calculeaz exponenµial ex
log(x) % calculeaz logaritmul natural ln(x)sqrt(x) % calculeaz radicalul ordinului doi dintr-un num rnum2str(x) % furnizeaz valoarea numeric a lui xfactorial(n) % n!A = ones(m,n) % A e matrice m× n, cu toate elementele 1B = zeros(m,n) % matrice m× n zeroI = eye(n) % matrice unitate, n× nA = [3/2 1 3 7; 6 5 8 8; 3 6 9 12] % matrice 3× 3size(A) % dimensiunea matricei Adet(A) % determinantul matricei Ainv(A) % inversa matricei AA' % transpusa matricei AA(:,7) % coloana a 7-a a matricei AA(1:20,1) % scoate primele 20 de linii ale lui Anchoosek(n,k) % combin ri de n luate câte k1e5 % numarul 105
exp(1) % numarul ebar(X) sau barh(X) % reprezentarea prin barehist(X) % reprezentarea prin histogramehist3(x,y,z) % reprezentarea prin histograme 3-Dplot(X(1:5),'*m') % deseneaz primele 5 componente ale lui X, cu * magenta
plot(t,X,'-') % deseneaz gra�cul lui X versus t, cu linie continuaplot3(X,Y,Z) % deseneaz un gra�c în 3-Dstairs(X) % deseneaz o funcµie scarasubplot(m,n,z) % împarte gra�cul în m× n zone & deseneaz în zona zsemilogx ³i semilogy % logaritmeaz valorile de pe absci , resp., ordonatahold on % reµine gra�cul pentru a realiza o nou �guraclf % ³terge �guraclear all % ³terge toate variabilele de�nitetitle('Graficul functiei') % adaug titlu �guriifind % g se³te indicii elementelor nenule ale unui vectorlegend % ata³eaz o legend la un gra�c
Tabela 3: Funcµii Matlab utile
Anexa 2 [Dr. Iulian Stoleriu] 14
4 Anexa 3
Exemple de repartiµii discrete
În dreptul �ec rei repartiµii, în parantez , apare numele cu care aceasta care poate � apelat în Matlab.
(1) Repartiµia uniform discret , U(n) (unid)
Scriem c X ∼ U(n), dac valorile lui X sunt {1, 2, . . . , n}, cu probabilit µile
P (X = k) =1
n, k = 1, 2, . . . , n.
Media ³i dispersia sunt: E(X) = n+12 , D2(X) = n2−1
12 .Exemplu: num rul de puncte care apar la aruncarea unui zar ideal este o valoare aleatoare repartizat U(6).
(2) Repartiµia Bernoulli1, B(1, p) (bino)
Scriem X ∼ B(1, p). V.a. de tip Bernoulli poate lua doar dou valori, X = 1 (succes) sau X = 0 (insucces),cu probabilit µile P (X = 1) = p; P (X = 0) = 1− p.Media ³i dispersia sunt: E(X) = p; D2(X) = p(1− p).Exemplu: aruncarea o singur dat a unei monede ideale poate � modelat ca �ind o v.a. B(1, 0.5).
(3) Repartiµia binomial , B(n, p): (bino)
Scriem X ∼ B(n, p) (schema bilei revenite sau schema extragerilor cu repetiµie) (n > 0, p ∈ (0, 1)), dac valorile lui X sunt {0, 1, . . . , n}, cu probabilit µile
P (X = k) = Cknpk(1− p)n−k, k = 0, 1, . . . , n.
Media ³i dispersia sunt: E(X) = np; D2(X) = np(1− p).
Dac (Xk)k=1,n ∼ B(1, p) ³i (Xk)k independente stochastic, atunci X =
n∑k=1
Xk ∼ B(n, p).
Exemplu: aruncarea de 15 ori a unei monede ideale poate � modelat ca �ind o v.a. binomial B(15, 0.5).
(4) Repartiµia hipergeometric , H(n, a, b) (hyge)
X ∼ H(n, a, b) (schema bilei nerevenite sau schema extragerilor f r repetiµie) (n, a, b > 0) dac
P (X = k) =CkaC
n−kb
Cna+b
, pentru orice k ce satisface max(0, n− b) ≤ k ≤ min(a, n).
1Jacob Bernoulli (1654− 1705), matematician elveµian
Anexa 2 [Dr. Iulian Stoleriu] 15
Media ³i dispersia sunt: EX =
n∑i=0
E(Xi) = np; D2(X) = np(1− p)a+ b− na+ b− 1
.
Observaµia 3 (i) Dac (Xk)k=0,n ∼ B(1, n), cu p = aa+b (v.a. dependente stochastic), atunci
X =n∑i=1
Xi ∼ H(n, a, b).
În cazul schemei bilei nerevenite, nu mai putem scrie egalitate între D2(X) ³in∑i=0
D2(Xi), deoarece (Xi)i
nu sunt independente stochastic.(ii) Pentru N = a+ b� n, putem face aproximarea a+b−n
a+b−1 ≈a+b−na+b = 1− n
N , de unde
D2(X) ≈ np(1− p)(
1− n
N
). (2)
Observ m c repartiµiile binomial ³i hipergeometric au aceea³i medie, îns dispersiile difer prin termenulN−nN−1 . În cazul în care num rul de bile este mult mai mare decât num rul de extrageri (N � n), atunciacest termen devine aproximativ
(1− n
N
). În plus, dac N este foarte mare, atunci trecând N →∞ în (2),
g sim c ³i dispersiile celor dou repartiµii coincid. Cu alte cuvinte, când num rul de bile din urn estefoarte mare, nu mai conteaz dac extragerea bilelor se face cu repetiµie sau nu. Acest fapt îl vom utilizaîn Teoria selecµiei, când extragerile se fac dintr-o colectivitate de volum foarte mare.
(5) Repartiµia Poisson2, P(λ) (poiss)
Valorile sale reprezint num rul evenimentelor spontane (cu intensitatea λ) realizate într-un anumit intervalde timp. Pentru un λ > 0, spunem c X ∼ P(λ) (legea evenimentelor rare) dac X ia valori naturale, cuprobabilit µile
P (X = k) = e−λλk
k!, ∀k ∈ N.
E(X) = λ; D2(x) = λ.
(6) Repartiµia geometric , Geo(p) (geo)
Valorile sale reprezint num rul de insuccese avute pân la obµinerea primului succes,stiind probabilitatea de obµinere a unui succes, p.
Spunem c X ∼ Geo(p), (p ∈ (0, 1)) dac X ia valori în N, cu probabilit µile
P (X = k) = p(1− p)k, pentru orice k ∈ N, unde p ≥ 0.
E(X) =1− pp
; D2(X) =1− pp2
.
Observaµia 4 Dac X ∼ Geo(p), atunci variabila aleatoare Y = X+1 reprezint a³teptarea pân la primul
succes.2Siméon-Denis Poisson (1781− 1840), matematician ³i �zician francez, student al lui Laplace
Anexa 2 [Dr. Iulian Stoleriu] 16
(7) Repartiµia binomial cu exponent negativ, BN (m, p) (nbin)
Valorile sale reprezint num rul de insuccese obµinute înainte de a se realiza succesul de rang m.În cazul particular m = 1, obµinem repartiµia geometric .
Pentru m ≥ 1, p ∈ (0, 1), spunem c X ∼ BN (m, p) dac X ia valorile {m, m + 1, m + 2, . . . }, cuprobabilit µile
P (X = k) = Cm−1m+k−1p
m(1− p)k, ∀k ≥ m, p ≥ 0.
Media ³i dispersia sunt: E(X) =m(1− p)
p; D2(X) =
m(1− p)p2
.
Exemple de repartiµii continue
(1) Repartiµia uniform , U(a, b) (unif)
V.a. X ∼ U(a, b) (a < b) dac funcµia sa de densitate este
f(x; a, b) =
{1b−a , dac x ∈ (a, b)
0 , altfel.
E(X) =a+ b
2, D2(X) =
(b− a)2
12.
Exemplu: Alegerea la întâmplare a unei valori din intervalul (0, 1), în cazul în care orice valoare are aceea³i³ans de a � aleas , urmeaz o repartiµie U(0, 1). Comanda rand din Matlab realizeaz acest experiment(vezi capitolul urm tor).
(2) Repartiµia normal , N (µ, σ) (norm)
Spunem c X ∼ N (µ, σ), dac X are densitatea:
f(x; µ, σ) =1
σ√
2πe−
(x−µ)2
2σ2 , x ∈ R.
E(X) = µ ³i D2(X) = σ2.Se mai nume³te ³i repartiµia gaussian . În cazul µ = 0, σ2 = 1 densitatea de repartiµie devine:
f(x) =1√2πe−
x2
2 , x ∈ R. (3)
În acest caz spunem c X urmeaz repartiµia normal standard, N (0, 1).Gra�cul densit µii de repartiµie pentru repartiµia normal este clopotul lui Gauss (vezi Figura 1). Dingra�c (pentru σ = 1), se observ c majoritatea valorilor nenule ale repartiµiei normale standard se a� înintervalul (µ− 3σ, µ+ 3σ) = (−3, 3). Aceast a�rmaµie se poate demonstra cu ajutorul relaµiei (??).
Dac Z ∼ N (0, 1), atunci X = σZ +µ ∼ N (µ, σ). În mod similar, dac X ∼ N (µ, σ), atunci Z = X−µσ ∼
N (0, 1). Pentru o v.a. N (0, 1) funcµia de repartiµie este tabelat (valorile ei se g sesc în tabele) ³i are onotaµie special , Θ(x). Ea e de�nit prin:
Θ(x) =1√2π
∫ x
−∞e−
y2
2 dy. (4)
Anexa 2 [Dr. Iulian Stoleriu] 17
Figura 1: Clopotul lui Gauss pentru X ∼ N (0, σ), (σ = 1, 2, 3)
Funcµia de repartiµie a lui X ∼ N (µ, σ) este dat prin
F (x) = Θ(x− µσ
), x ∈ R. (5)
(3) Repartiµia log-normal , logN (µ, σ) (logn)
Repartiµia log-normal este foarte util în Matematicile Financiare, reprezentând o repartiµie de preµuriviitoare pentru un activ �nanciar. Dac X ∼ N (µ, σ), atunci Y = eX este o v.a. nenegativ , avânddensitatea de repartiµie
f(x; µ, σ) =
{1
xσ√
2πe−
(ln x−µ)2
2σ2 , dac x > 0
0 , dac x ≤ 0
A³adar, Y ∼ logN (µ, σ) dac lnY ∼ N (µ, σ).Media ³i dispersia sunt date de E(X) = eµ+σ2/2, D2(X) = e2µ+σ2
(eσ2 − 1).
(4) Repartiµia exponenµial , exp(λ) (exp)
Valorile sale sunt timpi realizaµi între dou valori spontane repartizate P(λ).
Spunem c X ∼ exp(λ) (λ > 0) dac are densitatea de repartiµie
f(x; λ) =
{λe−λx , dac x > 00 , dac x ≤ 0
Media ³i dispersia sunt: E(X) =1
λ³i D2(X) =
1
λ2.
Observaµia 5 Repartiµia exponenµial satisface proprietatea a³a-numitei lips de memorie, i.e.,
P ({X > x+ y}|{X > y}) = P ({X > x}), ∀x, y ≥ 0.
Anexa 2 [Dr. Iulian Stoleriu] 18
Este unica distribuµie continu cu aceast proprietate. Distribuµia geometric satisface o variant discret a acestei propriet µi. [Veri�caµi!]
(5) Repartiµia Gamma, Γ(a, λ) (gam)
O v.a. X ∼ Γ(a, λ), a, λ > 0, dac densitatea sa de repartiµie este:
f(x; a, λ) =
{λa
Γ(a)xa−1e−λx , dac x > 0,
0 , dac x ≤ 0.
unde Γ este funcµia lui Euler,
Γ : (0, ∞)→ (0, ∞), Γ(a) =
∫ ∞0
xa−1e−xdx.
Media ³i dispersia sunt: E(X) =a
λ, D2(X) =
a
λ2.
Observaµia 6 (i) Γ(1, λ) ≡ exp(λ).
(ii) Dac v.a. {Xk}k=1,n ∼ exp(λ) sunt independente stochastic, atunci suma lorn∑k=1
Xk ∼ Γ(n, λ).
(6) Repartiµia Weibull3, Wbl(k, λ) (wbl)
Aceast repartiµie este asem n toare cu repartiµia exponenµial (aceast obµinându-se în cazul particulark = 1) ³i poate modela repartiµia m rimii particulelor. Când k = 3.4, distribuµia Weibull este asem n toarecu cea normal . Când k →∞, aceast repartiµie se apropie de funcµia lui Dirac.Vom spune c X ∼Wbl(k, λ) (k > 0, λ > 0) dac are densitatea de repartiµie
f(x; k, λ) =
{kλ
(xλ
)k−1e−( xλ)
k
, dac x ≥ 00 , dac x < 0.
Media pentru repartiµia X ∼Wbl(k, λ) este E(X) = λΓ
(1 +
1
k
).
(7) Repartiµia χ2, χ2(n) (chi2)
O v.a. X ∼ χ2(n) (se cite³te repartiµia hi-p trat cu n grade de libertate) dac densitatea sa de repartiµieeste:
f(x; n) =
1
Γ(n2
)2n2xn2−1e−
x2 , dac x > 0,
0 , dac x ≤ 0.
unde Γ este funcµia lui Euler. Gra�cul acestei repartiµii (pentru diverse valori ale lui n) este reprezentat înFigura 2.Media ³i dispersia sunt: E(χ2) = n, D2(χ2) = 2n.
3Ernst Hjalmar Waloddi Weibull (1887− 1979), matematician ³i inginer suedez
Anexa 2 [Dr. Iulian Stoleriu] 19
Observaµia 7 (a) Repartiµia χ2(n) este, de fapt, repartiµia Γ(n2 ,12).
(b) Dac v.a. independente Xk ∼ N (0, 1) pentru k = 1, 2, . . . , n, atunci
X21 +X2
2 + · · ·+X2n ∼ χ2(n).
În particular, dac X ∼ N (0, 1), atunci X2 ∼ χ2(1).
Figura 2: Repartiµia χ2(n) pentru patru valori ale lui n.
(8) Repartiµia Student (W. S. Gosset4), t(n) (t)
Spunem c X ∼ t(n) (cu n grade de libertate) dac densitatea de repartiµie este:
f(x; n) =Γ(n+1
2
)√nπ Γ
(n2
) (1 +x2
n
)−n+12
, x ∈ R.
E(X) = 0, D2(X) =n
n− 2.
(9) Repartiµia Fisher5, F(m, n) (f)
Spunem c X ∼ F(m, n) (cu m, n grade de libertate) dac densitatea de repartiµie este:
f(x) =
(mn )m2 Γ(m+n
2 )Γ(m2 )Γ(n2 )
xm2−1(1 + m
n x)−m+n
2 , x > 0;
0 , x ≤ 0.
E(X) =n
n− 2, D2(X) =
2n2(n+m− 2)
m(n− 2)2(n− 4).
4William Sealy Gosset (1876− 1937), statistician britanic, care a publicat sub pseudonimul Student5Sir Ronald Aylmer Fisher (1890− 1962), statistician, eugenist, biolog ³i genetician britanic
Anexa 2 [Dr. Iulian Stoleriu] 20
(10) Repartiµia Cauchy6, C(λ, µ) (f r corespondent în Matlab)
Spunem c X ∼ C(λ, µ) dac densitatea de repartiµie este:
f(x; λ, µ) =λ
π[(x− µ)2 + λ2], x ∈ R.
NU admite medie, dispersie sau momente!!!
6Augustin Louis Cauchy (1789− 1857), matematician francez
Bibliografie [Dr. Iulian Stoleriu] 21
5 Bibliogra�e
Bibliogra�e
[1] Petru Blaga, Statistic . . . prin Matlab, Presa universitar clujean , Cluj-Napoca, 2002.
[2] David Brink, Statistics compendium, David Brink & Ventus Publishing ApS, 2008.
[3] David Brink, Statistics exercises, David Brink & Ventus Publishing ApS, 2008.
[4] Gheorghe Ciucu, Virgil Craiu, Teoria estimaµiei ³i veri�carea ipotezelor statistice, Editura Didactic ³i Pedagogic , Bucure³ti, 1968.
[5] Steve Dobbs, Jane Miller, Statistics 1, Cambridge University Press, Cambridge 2000.
[6] Jay L. DeVore, Kenneth N. Berk, Modern Mathematical Statistics with Applications (with CD-ROM),
Duxbury Press, 2006.
[7] Robert V. Hogg, Allen Craig, Joseph W. McKean, Introduction to Mathematical Statistics, PrenticeHall, 6th edition, 2004.
[8] Marius Iosifescu, Costache Moineagu, Vladimir Trebici, Emiliana Ursianu, Mic enciclopedie de sta-
tistic , Editura ³tiinµi�c ³i enciclopedic , Bucure³ti, 1985.
[9] http://www.mathworks.com
[10] Gheorghe Mihoc, N. Micu, Teoria probabilit µilor ³i statistica matematic , Bucuresti, 1980.
[11] Elena Nenciu, Lecµii de statistic matematic , Universitatea A. I. Cuza, Ia³i, 1976.
[12] Octavian Petru³, Probabilit µi ³i Statistica matematic - Computer Applications, Ia³i, 2000.
[13] Sanford Weisberg, Applied Linear Regression, Wiley series in Probability and Statistics, 3rd ed., 2005.
[14] Larry J. Stephens, Theory and problems of Beginning Statistics, Schaum's Outline Series, 2nd ed., TheMcGraw-Hill Companies, Inc., 1998.
[15] Dominick Salvatore, Derrick Reagle, Theory and problems of Statistics and Econometrics, Schaum'sOutline Series, 2nd ed., The McGraw-Hill Companies, Inc., 2002.
[16] Iulian Stoleriu, Statistic prin Matlab. MatrixRom, Bucure³ti, 2010.
[17] Gábor Székely, Paradoxes in Probability Theory and Mathematical Statistics, (Mathematics and itsApplications), Springer Verlag, 1987.
[18] David Williams, Weighing the Odds: A Course in Probability and Statistics, Cambridge UniversityPress, 2001.