slide thảo luận xác suất thống kê

37
NHÓM 4 NHÓM 4 Ước lượng các tham số của Ước lượng các tham số của ĐLNN và kiểm định giả ĐLNN và kiểm định giả thiết thống kê thiết thống kê

description

thảo luận xác suất thống kê

Transcript of slide thảo luận xác suất thống kê

Page 1: slide thảo luận xác suất thống kê

NHÓM 4NHÓM 4

Ước lượng các tham số của ĐLNN và Ước lượng các tham số của ĐLNN và kiểm định giả thiết thống kêkiểm định giả thiết thống kê

Page 2: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

5.1. Ước lượng điểm:• Giả sử cần ước lượng tham số . Từ đám đông lấy mẫu

W= (X1, X2, …, Xn) từ mẫu này ta xây dựng 1 thống kê *= f(X1, X2, …, Xn) thích hợp. Để có ước lượng điểm, ta chỉ việc điều tra 1 mẫu cụ thể w= (x1, x2, …, xn ) với kích thước người lao động đủ lớn, rồi lấy *= f(x1, x2, …, xn ).

• Có nhiều cách chọn thống kê *. Thông thường người ta xây dưng * bằng các phương pháp hàm ước lượng, tức là chon * là các đặc trưng mẫu tương ứng. Chẳng hạn lấy trung bình mẫu để ước lượng trung bình đám đông µ= E(X), lấy phương sai mẫu điều chỉnh S’2 để ước lượng phương sai của đám đông S’2=Var(X), lấy tần suất mẫu f để ước lượng tỉ lệ của đám đông p. Sau đây là các tiêu chuẩn phản ánh bản chất tốt của ước lượng

Page 3: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán5.1.1. Ước lượng không chệch. Thống kê * được gọi là ước lượng không chệch của nếu E( *)= . Nếu E( *) thì * được gọi là ước lượng chệnh của . 5.1.2. Ước lượng vững Thống kê * được gọi là ước lượng vững của nếu với mọi >0, nhỏ tùy ý ta luôn có:

1)*(lim

Pn

5.1.3. Ước lượng hiệu quả Thống kê * được gọi là ước lượng hiệu quả của tham số của ĐLNN gốc X

nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng mẫu đó.

Page 4: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán5.2. Khái niệm về ước lượng bằng khoảng tin cậy. Để ước lượng tam số của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên W= (X1, X2, …, Xn). Tiếp đến ta xây dựng thống kê G= f(X1, X2, …, Xn, ), sao cho quy luật phân phối xác suất của G hoàn toàn xác định. Với xác suất = 1- cho trước ta xác định cặp giá trị 1, 2 thỏa mãn các điều kiện 1 0, 2 0 và 1 + 2 = . Vì quy luật phân phối xác suất của G đã biết, ta tìm được phân vị g1- 1 và g 2 sao cho: P(G> g1- 1) = 1- 1 và P(G> g 2) = 2

Khi đó P(g1- 1<G< g 2) = 1- 1 - 2= 1- =

Cuối cùng bằng biến đổi tương đương, ta có: P( 1* < < 2*) = 1- =

= 1- : độ tin cậy

( 1, 2) : khoảng tin cậy I= ( 2*- 1*) : độ dài của khoảng tin cậy

Người ta thường chọn 1 = 2= 2

. Nếu chọn 1=0 và 2= hoặc chọn 2=0

và 1= thì ta sẽ có khoảng tin cậy 1 phía.

Page 5: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

5.3 Ước lượng kì vọng toán của ĐLNN

Để ước lượng kì vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy ra mẫu ngẫu nhiên W = (X1,X2,…,Xn) ( . Từ mẫu này ta tìm được trung

bình mẫu – và phương sai mẫu điều chỉnh .Ta sẽ ước lượng µ

thông qua

Page 6: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

5.3.1 ĐLNN X phân phối theo quy luật chuẩn với 2 đã biết

Vì X N( µ, ) nên N( , ) khi đó:

U =

Page 7: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

a. Khoảng tin cậy đối xứng( lấy )

Với độ tin cậy cho trước, ta tìm được phân vị chuẩn U ,

sao cho: P(lUl < U ) = 1 - =

Thay biểu thức của U từ (5.1) vào công thức trên, ta có:

P(l l < U ) = 1- =

<=> P( < < + = 1- =

Trong đó:

U là sai số ước lượng

1- = là độ tin cậy

; + ) là khoảng tin cậy ngẫu nhiên của

Page 8: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

b. khoảng tin cậy phải Ta vẫn dùng thống kê (5.1). Với độ tin cậy = cho trước ta

tìm được phân vị chuẩn u sao cho :

P(U< u ) = 1-

Thay biểu thức của U từ (5.1) ta có

P(

u

n

X

)= 1-

1)( un

XP

Như vậy, khoảng tin cậy phải của là :

);(

un

X

Page 9: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

c. Khoảng tin cậy trái : Ta vẫn dùng thống kê (5.1). Với độ tin cậy = cho trước ta

tìm được phân vị chuẩn u sao cho :

1)( UuP

Thay biểu thức của U từ (5.1) ta có

1)(1)( u

nXP

n

XuP

Như vậy, khoảng tin cậy trái của là :

);(

un

X

Page 10: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán5.3.2. ĐLNN X phân phối theo quy luật chuẩn với 2 chưa biết

Vì X có phân phối chuẩn nên :

)1(~'

nT

n

SX

T

a. Khoảng tin vậy đối xứng( lấy 221

)

Với độ tin cậy = cho trước ta tim được phân vị t sao

cho : 1)( )1(

2

ntTP

Thay biểu thức của T vào công thức trên, ta có :

P(l l < t ) = =

1)( XXP

Trong đó :

= t là sai số của ước lượng,

= Là độ tin cậy,

( ) là khoảng tin cậy ngẫu nhiên của

Page 11: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánb. Khoảng tin cậy phải( lấy 21 ,0 dùng để ước lượng giá trị

tối thiểu của ).

Vẫn dùng thống kê (5.40) với độ tin cậy = cho trước, tìm )1( nt

Sao cho :

P(T< )1( nt ) = =

Ta có khoảng tin cậy phải của là :

( )1( ntn

SX ; )

c. Khoảng tin cậy trái( lấy 21 ,0 dùng để ước lượng giá trị tối

đa của ).

Vẫn dùng thống kê (5.4) với độn tin cậy = cho trước, tìm

sao cho :

1)( )1( TtP n

Ta có khoảng tin cậy trái của là

)'

;( )1( ntn

SX

Page 12: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán5.3.3. Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n>30 :

Theo mục 2 chương 4, khi n>30 thì . Do đó ta sử dụng

thống kê:

)1,0(N

n

XU

Các phần còn lại giải quyết tương tự như trong mục 5.3.1 Chú ý 5.4 : Riêng đối với bài toán ước lượng kích thước mẫu, vì

chưa biết quy luật phân phối xác suất của X nên phải giả thiết có

phân phối chuẩn Nếu chưa biết , vì n lớn nên ta có thể lấy 's

Page 13: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

5.4 Ước lượng tỷ lệ ( Ước lượng tham số p trong phân phối A(p)) Xét một đám đông kích thước N phần tử mang dấu hiệu A. Kí hiệu tỉ lệ

phần tử mang dấu hiệu A trên đám đông là p =N

M . Để ước lượng p từ đám

đông ta lấy ra mẫu kích thước n. Kí hiệu nA là số phần tử mang dấu hiệu A

có trong n phần tử lấy ra.Khi đó f = nnA là tỉ lệ phần tử mang dấu hiệu A

trên mẫu. Ta sẽ dùng f để ước lượng p. Khi n đủ lớn, theo mục 4.3.4, chương

4 thì f N(p,n

pq ), ở đây ta kí hiệu q= 1- p. Vì vậy ta có:

U = )1,0(N

n

pq

pf

Page 14: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toána. Khoảng tin cậy đối xứng (lấy α1 = α2 =

2

)

Với độ tin cậy γ = 1- α cho trước, ta có thể tìm u2

sao cho:

P(│U│< u2

) = 1 – α = γ

Thay biểu thức U vào công thức trên, ta có:

P(│f – p│< .n

pq u2

) = 1 – α = γ

( f – < p < f + ) = 1 – α = γ

Trong đó :

= .n

pq u2

là sai số ước lượng. Nếu p chua biết, n khá lớn để tính ta lấy p f , khi đó: Khoảng tin cậy đối xứng của p là (f – ; f + ). Độ tin cậy của ước lượng là γ = 1 – α.

Page 15: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánb. Khoảng tin cậy phải ( lấy α1 = 0, α2 = α dùng để ước lượng giá trị tối thiểu của p). Ta vẫn dùng thống kê (5.5). Với độ tin cậy γ = 1 – α cho trước ta tìm được uα sao cho:

P( U < uα ) ≈ 1- α = γ Từ (5.5) ta có :

P(

n

pq

pf uα ) ≈ 1- α = γ

P (f - n

pq . uα < p) ≈ 1- α = γ

Vì p chưa biết, n lớn ta lấy p ≈ f. Ta có khoảng tin cậy phải của p là :

( f - .)1(

n

ff uα ; +∞ )

Page 16: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánc.Khoảng tin cậy trái ( lấy α1 = α , α2 = 0 dùng để ước lượng giá trị tối đa của p ). Ta vẫn dùng thống kê (5.5). Với độ tin cậy γ = 1 – α cho trước ta tìm được uα sao cho:

P ( - uα < U ) ≈ 1- α = γ Từ (5.5) ta có :

P ( - uα <

n

pq

pf ) ≈ 1- α = γ

P ( p < f + n

pq . uα ) ≈ 1- α = γ

Vì p chưa biết, n lớn ta lấy p ≈ f . Ta có khoảng tin cậy trái cua p là:

( - ∞ ; f + .)1(

n

ff uα )

Page 17: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán5.5 ước lượng phương sai của đại lượng ngẫu nhiên phân phối chuẩn Giả sử ta cần nghiên cứu một dấu hiệu X có phân phối chuẩn với Var(X)

= 2 chưa biết. Để ước lượng 2

, từ đám đông ta lấy ra mẫu W = ( X1,

X2,….Xn) . Từ mẫu này ta tìm được S2'.Theo 4.4 ta có :

2

2'2 )1( Sn ~ )1(2 n

Page 18: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toána. Khoảng tin cậy 2 phía của 2

( lấy α1 = α2 = 2

)

Vì 2~ )1(2 n

, với độ tin cậy γ = 1 – α cho trước, ta có thể tìm được

phân vị )1(2

21

n và

)1(2

2

n sao cho:

P ( )1(2

21

n < 2

< )1(2

2

n ) = 1 – α = γ

Thay biểu thức của 2 vào công thức trên và biến đổi, ta có:

P (

)1(2

21

2'2

)1(2

2

2')1()1(nnSS nn

1 – α = γ

Ở đây γ = 1 – α là độ tin cậy.

Khoảng tin cậy của 2 là ( )

)1(;

)1()1(2

21

2'

)1(2

2

2'

nnSS nn

Page 19: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánb. Khoảng tin cậy phải của 2

( lấy α1 = 0, α2 = α dùng để ước lượng giá

trị tối thiểu của 2)

Ta vẫn dùng thống kê (5.9). Với γ = 1 – α cho trước ta tìm được phân

vị

)1(2 n sao cho:

P ( 2

)1(2 n ) = 1 – α = γ

Thay biểu thức của 2 từ (5.9) vào công thức trên và biến đổi , ta có:

P ))1(

(2

)1(2

2'

nSn

= 1 – α = γ

Vậy khoảng tin cậy phải của 2 là :

;)1(

()1(2

2'

nSn

+∞ )

Page 20: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánc. Khoảng tin cậy trái của 2

( lấy α1 = α , α2 = 0 dùng để ước lượng giá

trị tối đa của 2 ).

Ta vẫn dùng thống kê (5.9). Với γ = 1 – α cho trước ta tìm được phân

vị

)1(2

1

n sao cho:

P (

)1(2

1

n< 2

) = 1 – α = γ

Thay biểu thức của 2 từ (5.9) vào công thức trên và biến đổi , ta có:

P ))1(

()1(2

1

2'2

nSn

= 1 – α = γ

Vậy khoảng tin cậy phải của 2 là :

( -∞ ; ))1(

)1(2

1

2'

nSn

Page 21: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán6.1 Các định nghĩa trong giả thuyết thống kê

6.1.1 Giả thuyết thống kê

Giả thuyết thống kê là các giả thuyết về quy luật phân phối của đại lượng ngẫu nhiên gốc X hoặc về tính độc lập của các ĐLNN.

Giả thuyết đưa ra đưa ra được gọi là giả thuyết gốc(ký hiệu là )

những giả thuyết khác với được gọi là đối thuyết (ký hiệu là .

và lập thành một cặp giả thuyết thống kê.Ta quy định :khi đã chọn

cặp giả thuyết thì nếu bác bỏ thì ta sẽ chấp nhận

6.1.2 Tiêu chuẩn kiểm định

Để kiểm định cặp giả thuyết thống kê H0 và H1,từ đám đông ta chọn

ngẫu nhiên : w (X1,X2,… ,Xn, )

Trong đó , là một tham số liên quan đến , sao cho nếu đúng thì

quy luật phân phối xac suất của G hoàn toàn xác định. Khi đó thống kê G được gọi là tiêu chuẩn kiểm định.

Page 22: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán6.1.3 Miền bác bỏ

Vì đã biết quy luật phân phối xác suất của G nên với một xác suất khá

bé cho trước ta có thể tìm được miền ,gọi là miền bác bỏ sao cho nếu

giả thuyết đúng thì xác suất để G nhận giá trị thuộc miền bằng

P(G ) =

Vì khá bé ,theo nguyên lý xác suất nhỏ ta có thể coi biến cố

( G ) không xảy ra trong một lần thực hiện phép thử .Nếu

từ một mẫu cụ thể w =( …, ) ta tìm được giá trị thực nghiệm

Gtn =( …, , ) mà gtn ta có cơ sở bác bỏ giả thuyết .

Page 23: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánKý hiệu là miền bù của . Khi đó ta có P(G ) =1 - . Vì

khá bé nên 1 - khá gần 1.Theo nguyên lý xác suất lớn :Nếu một biến

cố có xác suất khá gần 1 ta có thể coi nó sẽ xảy ra trong một lần thực hiện phép thử ,nếu trong một lần lấy mẫu ta thấy gtn thì giả

thuyết H0 tỏ ra hợp lý ,chưa có cơ sở bác bỏ H0 .Vì vậy có cơ sở kiểm định sau:

Từ đám đông ta lấy ra một mẫu cụ thể kích thước n:w=(x1,x2,…xn) và tính gtn

-Nếu gtn thì bác bỏ H0 và chấp nhận H1

-Nếu gtn không thuộc thì chưa có cơ sở bác bỏ H0.

Page 24: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

6.1.4 Các loại sai lầm

2 sai lầm dễ mắc phải

-Sai lầm bác bỏ giả thuyết H0 khi H0 đúng

-Sai lầm chấp nhận H0 khi H0 sa

Page 25: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

6.2: Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN. Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông. Ký hiệu ,)( XE 2)( XVar , trong đó chưa biết. Từ một cơ sở nào đó người ta tìm được 0 , nhưng nghi ngờ về điều này. Với mức ý nghĩa cho trước, ta cần kiểm định giả thuyết

.00 : H Từ đám đông ta lấy mẫu: W = ( ),....,, 21 nXXX và tính được các đặc trưng mẫu:

n

iiX

nX

1

1 và 2

1

2 )(1

1XX

nS

n

ii

Page 26: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

6.2.1: ĐLNN X trên đám đông có phân phối chuẩn với 2 đã biết.

Vì X có phân phối chuẩn nên: X ~ ),(2

nN

. Xây dựng tiêu

chuẩn kiểm định (XDTCKĐ):

n

XU

0

(6.2)

Nếu 0H đúng thì ).1,0(~ NU

Page 27: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánPhương pháp P-giá trị (P-Value)

1. Công thức tìm P-giá trị

a. Đối với bài toán

01

00

:

:

H

H

Ta có P-giá trị = )(2 tnuUP .

Trong đó U ~ N (0,1) và

n

xutn

0

b. Đối với bài toán

01

00

:

:

H

H

Ta có P-giá trị = )( tnuUP .

c. Đối với bài toán

01

00

:

:

H

H

Ta có P-giá trị = )( tnuUP .

Page 28: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán2. Kết luận sau khi tìm được P-giá trị a. Cách thứ nhất :

Nếu P-giá trị ≤ 0,05 : Chưa có cơ sở để bác bỏ 0H

Nếu 0,01 ≤ P-giá trị < 0,05 : Có cơ sở để bác bỏ 0H

Nếu P-giá trị < 0,01 : Có cơ sở chắc chắn để bác bỏ 0H b. Cách thứ hai : Quy định trước mức ý nghĩa . Tính P-giá trị rồi

so sánh với : Nếu P-giá trị < thì bác bỏ 0H

Nếu P-giá trị ≥ chưa có cơ sở để bác bỏ 0H Chú ý : Các công thức tìm P-giá trị trên còn được dùng cho các bài toán kiểm định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định U.

Page 29: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

6.2.2 : ĐLNN X trên đám đông có phân phối chuẩn với 2 chưa biết.

XDTCKĐ :

n

SX

T

0 (6.3)

Vì X có phân phối chuẩn, nếu 0H đúng thì 1~ nTT

Page 30: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toánCông thức P-giá trị (P-Value).

Bài toán 1 :

01

00

:

:

H

H

P-giá trị = )(2 tntTP , trong đó 1~ nTT ,

n

sx

t tn

0.

Bài toán 2 :

01

00

:

:

H

H

P-giá trị = )( tntTP .

Bài toán 3 :

01

00

:

:

H

H

P-giá trị = )( tntTP . Chú ý : Công thức tìm P-giá trị trên còn dùng cho các bài toán kiểm định khác có dùng tiêu chuẩn kiểm định T. Sau khi tìm được P-giá trị, việc kết luận được tiến hành như mục 6.2.1. Chú ý : Khi ĐLNN có phân phối chuẩn, mặc dù 2 chưa biết, nhưng nếu kích thước mẫu 30n người ta thường dùng chuẩn U, như trong mục 6.2.1. Đến khi tìm tnu ta lấy s2 .

Page 31: slide thảo luận xác suất thống kê

Lý thuyết toánLý thuyết toán

6.2.3 : Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu 30n .

Theo (4.6) khi 30n thì

nNX

2, . Ta vẫn dùng tiêu chuẩn

kiểm định :

n

XU

0

Khi đó, nếu giả thuyết 0H đúng thì U sẽ xấp xỉ phân phối chuẩn N(0,1). Phần còn lại tiến hành như mục 6.2.1. Ta cũng cần nhớ rằng : nếu 2 chưa biết, nhưng 30n ta có thể lấy s2 .

Page 32: slide thảo luận xác suất thống kê

Bài tập thực tế

Yêu cầu : Điều tra chiều cao của nam ở độ tuổi trưởng thành của VN

1. Ước lượng chiều cao của nam 2. So sánh với kết quả đưa ra trong nghiên cứu

của Tổng cục TDTT năm 1994 là chiều cao TB của nam là 163cm

Page 33: slide thảo luận xác suất thống kê

Bài tập thực tế

1. Sau khi điều tra ta lập được bảng tính toán:

xi ni xini

159 1 159 161 2 322 163 3 489 165 3 495 167 8 1336 169 9 1521 171 10 1710 173 6 1038 175 4 700 177 1 177 179 3 537

50 8484

Page 34: slide thảo luận xác suất thống kê

Bài tập thực tếTừ đó ta tính được:

68,16950

84841

1

n

iii xn

nx

Page 35: slide thảo luận xác suất thống kê

Bài tập thực tế

Page 36: slide thảo luận xác suất thống kê

Bài tập thực tế2. Gọi X là chiều cao của sinh viên nam trường ĐHTM X là chiều cao trung bình của sinh viên nam trường ĐHTM trên mẫu là chiều cao trung bình của sinh viên nam trường ĐHTM trên đám đông Do );(~);(~

22

nNXNX

Với mức ý nghĩa = 0,05. Ta cần kiểm định

01

00

:

63,1:

H

mH

Chọn TKTCKĐ:

n

XU

0

Với mức ý nghĩa 05,0 , ta tìm phân vị 58,205,0 UU thỏa mãn

)( UUP Theo phần 1. tính đc : 's 0,1658 ( Vì n=50) Theo nguyên lí xác suất bé ta có miền bác bỏ

uuuW tntn : với

n

xutn

0

Với mẫu cho sẵn n=50, ta tìm 559,2

50

1658,063.169.1

tnU

Vậy Wuuu tntn . Tạm chấp nhận H0, bác bỏ H1 KL: Với mức ý nghĩa 05,0 chưa có cơ sở để kết luận chiều cao nam thanh niên Vn > 1,63m

Page 37: slide thảo luận xác suất thống kê