THỐNG KÊ

53
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến THỐNG KÊ 1 PHẦN 2 Thống khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lý số liệu.

description

PHẦN 2. THỐNG KÊ. Thống kê là khoa học về các phương pháp thu thập , tổ chức , trình bày , phân tích và xử lý số liệu. Bài toán. Nghiên cứu chiều cao của thanh niên Việt Nam trong độ tuổi từ 15 đến 30. Điều tra một loại bệnh mới trên gia cầm ở HCM. - PowerPoint PPT Presentation

Transcript of THỐNG KÊ

Page 1: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 1

THỐNG KÊ

PHẦN 2

Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lý số liệu.

Page 2: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 2

Bài toánNghiên cứu chiều cao của thanh niên Việt Nam trong

độ tuổi từ 15 đến 30.

Điều tra một loại bệnh mới trên gia cầm ở HCM.

Đánh giá chất lượng bia của nhà máy bia Sài gòn.

Nghiên cứu về giới tính trẻ sơ sinh lương công nhân ở khu công nghiệp Sóng Thần…

Đánh giá về một dịch vụ ngân hàng mới trên địa bàn tỉnh X

Page 3: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 3

Các khái niệmTổng thể

Kích thước tổng thể

Dấu hiệu nghiên cứu

Ví dụ.

Page 4: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 4

Các khái niệmMẫu

Kích thước mẫu

Mẫu ngẫu nhiên

Mẫu tổng quát

Mẫu cụ thể

Ví dụ

Page 5: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 5

Phân phối xác suấtBiến ngẫu nhiên gốc tổng thể

Phân phối xs tổng thể

Phân phối xs mẫu

Ví dụ

Page 6: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 6

Ví dụ 1 Cho tổng thể là 200 sinh viên trong một lớp. Số liệu về cân nặng của tổng thể này như sau:

Nếu ta quan tâm dấu hiệu định lượng: “số cân nặng của một sinh viên” thì:

X: ”cân nặng của một sinh viên trong lớp”

Cân nặng 45 46 49 54 55 57 60Số sinh viên 10 20 30 50 40 30 20

Page 7: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 7

Ví dụ 1_ppxs ttKhi này phân phối của tổng thể:

Nếu ta quan tâm đến dấu hiệu định tính: ”nặng trên 50kg” thì đặt biến ngẫu nhiên:

Khi này phân phối của tổng thể:

X 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1

Y 0 1P 0,3 0,7

0 , 50

1 , 50

X kgY

X kg

Page 8: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 8

Ví dụ 1_ppxs mẫuLấy ngẫu nhiên một sinh viên trong lớp. Gọi X1 là trọng

lượng của sinh viên này.

Ppxs của X1:

Gọi X2 là cân nặng của sinh viên thứ 2. Ta cũng có:

X2 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1

X1 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1

Page 9: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 9

Ví dụ 1(tiếp theo)Tương tự cho đến sinh viên thứ n.

Ppxs của Xn:

Như vậy ta có một mẫu ngẫu nhiên cỡ n:

(X1, X2,…,Xn)

Và Xi là n biến ngẫu nhiên độc lập và có cùng ppxs với X. Ta nói đây là mẫu ngẫu nhiên tổng quát.

Xn 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1

Page 10: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 10

Mẫu ngẫu nhiên cụ thểKhi đã làm phép thử chọn sinh viên. Giả sử các kết quả

như sau:• Sinh viên 1: 45kg• Sinh viên 2: 57kg• ….• Sinh viên n: 65kg

Thì bộ n số: (45, 57,…,65) gọi là mẫu cụ thểKý hiệu tổng quát: (x1,x2,…,xn)

Page 11: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 11

Ví dụ 2Lấy mẫu ngẫu nhiên cỡ 5 từ tổng thể:

Mẫu tổng quát: (X1, X2, X3, X4, X5) trong đó Xi có phân phối B(1; 0,7) hay A(0,7)

Một mẫu cụ thể: (1, 0, 0, 1, 0)Mỗi lần lấy mẫu cho ta một mẫu cụ thể.

Y 0 1P 0,3 0,7 ~ 1;0,7 ~ 0,7Y B hay Y A

Page 12: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 12

Tóm lạiMẫu ngẫu nhiên cỡ n: n biến ngẫu nhiên có cùng ppxs

với tổng thể. Chưa thực hiện phép thử.Ký hiệu: (X1, X2,…,Xn)

Mẫu cụ thể cỡ n: n giá trị (giá trị cụ thể của các bnn). Đã thực hiện phép thử.

Ký hiệu: (x1, x2, …, xn)

Page 13: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 13

Lý thuyết mẫuNghiên cứu để đưa ra các kết quả

Suy diễn cho tổng thể

Nghiên cứu mối quan hệ giữa tổng thể và mẫu rút ra từ tổng thể đó.

Xác suất: nghiên cứu tổng thể hiểu về mẫu (cụ thể)Thống kê: nghiên cứu mẫu (cụ thể) hiểu tổng thể.

Page 14: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 14

Phân loại mẫu• Mẫu định tính

• Mẫu định lượng

• Trình bày mẫu

Page 15: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 15

Tham số tổng thể• Định nghĩa

• Các tham số thường gặp: trung bình, phương sai, tỷ lệ

Page 16: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 16

Ví dụ• Tổng thể nghiên cứu là một xí nghiệp có 40 công nhân

với dấu hiệu nghiên cứu là năng suất lao động (sản phẩm/ đơn vị thời gian)

• Tính trung bình, phương sai tổng thể• Tính tỉ lệ công nhân có năng suất cao hơn 65sp.

Năng suất lao động 50 55 60 65 70 75

Số công nhân 3 5 10 12 7 3

Page 17: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 17

Các tham số tổng thể Trung bình cộng tổng thể:

Phương sai tổng thể:

1

N

ii

xE X

N

2

2 1

N

ii

xV X

N

Page 18: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 18

Các tham số tổng thể• Xét tổng thể định tính, dấu hiệu A.• Tỉ lệ tổng thể:

• N: kích thước tổng thể.• M: số phần tử trong tổng thể có dấu hiệu A.

Mp

N

Page 19: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 19

Thống kê mẫu• Định nghĩa

• Các thống kê mẫu thường gặp: trung bình, phương sai, phương sai hiệu chỉnh, phương sai biết µ, tỷ lệ …

Page 20: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 20

Tính thống kê mẫuĐiều tra thời gian sử dụng internet trong tuần của 90

sinh viên một trường ta được bảng số liệu sau:

Hãy tính các thống kê mẫu sau:a) Trung bình mẫu, các phương sai mẫub) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5

giờ một tuần?

Thời gian (giờ) 3 4 5 6 7 8Số sv 7 8 17 24 20 14

Page 21: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 21

Các thống kê mẫu_tổng quát

• Cho mẫu định lượng tổng quát:

• Trung bình mẫu:

• Phương sai mẫu:

1 2, ,..., nX X X

2 222

1 1

1 1n n

i ii i

S X X X Xn n

1 2 ... nX X XX

n

Page 22: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 22

Các thống kê mẫu_tổng quát

• Phương sai mẫu hiệu chỉnh::

• Độ lệch mẫu:

• Độ lệch mẫu hiệu chỉnh:

2 22

1

1

1 1

n

ii

nS X X S

n n

2S S

2S S

Page 23: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 23

Các thống kê mẫu_tổng quát

• Phương sai mẫu: (đã biết trung bình tổng thể )

1

2*2 1i

n

i

S Xn

*2 2 22S X X

Page 24: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 24

Các thống kê mẫu_cụ thể• Cho mẫu định lượng cụ thể thu gọn:

• Trung bình mẫu:

1

1 k

i ii

x n xn

X x1 x2 … xk

Tần số n1 n2 … nk

Page 25: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 25

Các thống kê mẫu_cụ thể• Phương sai mẫu:

• Phương sai mẫu hiệu chỉnh:

2 222

1 1

1 1k k

i i i ii i

s n x x n x xn n

2 22

1

1

1 1

k

i ii

ns n x x s

n n

Page 26: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 26

Các thống kê mẫu_cụ thể• Độ lệch chuẩn mẫu:

• Độ lệch chuẩn mẫu hiệu chỉnh:

2s s

2s s

Page 27: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 27

Tỷ lệ mẫu_tổng quát• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính

chất A, tỉ lệ tổng thể là p. • Lấy mẫu ngẫu nhiên kích thước n: (X1, ..., Xn)• Tỉ lệ mẫu tổng quát:

• Xi là các biến ngẫu nhiên có phân phối A(p)• Tỷ lệ mẫu = trung bình của n biến ngẫu nhiên cùng

phân phối A(p)

1 2 ... nX X XkF X

n n

Page 28: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 28

Tỷ lệ mẫu_cụ thể• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính

chất A, tỉ lệ tổng thể là p. • Lấy mẫu cụ thể kích thước n: (x1, x2 ,..., xn)• Tỉ lệ mẫu cụ thể:

• k: số phần tử trong mẫu có tính chất A.• n: cỡ mẫu• Với mẫu cụ thể ta đếm cho nhanh.

1 2 ... nx x xkf

n n

Page 29: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 29

Tổng thể Mẫu TQ Mẫu cụ thể

Kích thước N n n

Trung bình

Phương sai

Độ lệch chuẩn

Tỷ lệ A

Tổng thể và mẫu

E X

2 V X

V X

p P A

X

2 22 *; ;S S S

*; ;S S S

F

x

2 22 *; ;s s s

*; ;s s s

f

Page 30: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 30

Tính thống kê mẫuĐiều tra thời gian sử dụng internet trong tuần của 90

sinh viên một trường ta được bảng số liệu sau:

Hãy tính các thống kê mẫu sau:a) Trung bình mẫu, phương sai mẫu, phương sai mẫu

hiệu chỉnh?b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5

giờ một tuần?

Thời gian (giờ) 3 4 5 6 7 8Số sv 7 8 17 24 20 14

Page 31: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 31

Cách 1_Lập bảngxi ni xini (xi)2ni

…. …. …. ….…. …. …. ….

Tổngin i ix n 2

i ix n

i ix nx

n

2

2 2i ix ns x

n 22

1

ns s

n

in n

Page 32: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 32

Cách 1_Lập bảngxi ni xini (xi)2ni

3 7 21 634 8 32 1245 17 85 4256 24 144 8647 20 140 9808 14 112 896

Tổng 90 534 3352

Page 33: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 33

Cách 1_Lập bảng• Cỡ mẫu:

• Trung bình mẫu:

• Phương sai mẫu:

• Phương sai mẫu hiệu chỉnh:

90in n 534

5,933390

i ix nx

n

2

2 2... 2,0404i ix n

s xn

22 2,06331

ns s

n

2,0633 1,4364s

Độ lệch mẫu hiệu chỉnh:

Page 34: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 34

Cách 2__dùng máy tính 570ES1. Shift + 9 + 3 + = + =: Reset máy2. Shift + Mode + + 5 + 1: bật tần số3. Mode + 3 + 1: vào tính thống kê 1 biến4. Khi này ta có bảng sau:

X FREQ123

Page 35: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 35

Cách 2__dùng máy tính 570ES• Ta nhập vào như sau:

• Nhấn AC để thoát.

X FREQ1 3 72 4 83 5 174 6 245 7 206 8 14

Page 36: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 36

Cách 2_dùng máy tính 570ES6. Lấy số liệu thống kê: Shift + 1 + 4.Ta có bảng sau:

Tương ứng:1: cỡ mẫu 2: trung bình mẫu3. Độ lệch chuẩn mẫu.4. Độ lệch chuẩn mẫu hiệu chỉnh.

1: n 2:

3: x 4: sx

x

Không phải

phương sai

Page 37: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 37

Đối với FX 500MS hoặc 570MS1. Reset máy: Shift + Mode + 3 + = + =2. Vào hệ SD:• Máy 500MS: Mode + 2• Máy 570MS: Mode + Mode + 1

3. Nhập dữ liệu: “Giá trịShift , Tần sốM+”• 3Shift , 7M+• Nhập đến hết. Nhấn AC

4. Lấy số liệu: • Shift 2 1 = : Trung bình mẫu.• Shift 2 3 = : Độ lệch chuẩn mẫu hiệu chỉnh.

Page 38: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 38

Ví dụ 1Đường kính (mm) của

100 chi tiết do một máy sản xuất kết quả cho ở bảng sau:

a) Tính thống kê mẫu?b) Tính tỷ lệ chi tiết từ

20mm trở lên trong mẫu?

Đường kính Số chi tiết19,80 – 19,85 319,85 – 19,90 519,90 – 19,95 1619,95 – 20,00 2820,00 – 20,05 2320,05 – 20,10 1420,10 – 20,15 720,15 – 20,20 4

Page 39: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 39

Ví dụ 1•Ta viết lại mẫu:

•Từ mẫu ta có:•Cỡ mẫu: n=100•Trung bình mẫu: x=20,0015•Độ lệch chuẩn mẫu hiệu chỉnh: s=0,077997≈0,0780

xi 19,825 19.875 19.925 19.975 20.025ni 3 5 16 28 23

20.075 20.125 20.17514 7 4

Page 40: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 40

Định lí Giới hạn trung tâm (CLT)1. Cho X1, X2, …, Xn là n đại lượng ngẫu nhiên độc lập

toàn phần.

2. Nếu: thì:

Với n đủ lớn.Trong thống kê ta coi n>30 là đủ lớn.

2;i iE X V X 2

1 2 ...~ ,nX X X

X Nn n

Page 41: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 41

Định lí Giới hạn trung tâm (CLT)1. Cho n biến ngẫu nhiên độc lập.2. Cùng kỳ vọng, cùng phương sai.3. Số lượng biến ngẫu nhiên đủ lớn (>30).4. Trung bình của n biến ngẫu nhiên này sẽ có phân phối

xấp xỉ phân phối chuẩn 5. Điều này đúng bất chấp phân phối của các biến ngẫu

nhiên thành phần là gì.

Page 42: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 42

Phân phối xs thống kê mẫu• Trung bình mẫu• Tỷ lệ mẫu• Phương sai mẫu

Page 43: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 43

Tính chất của trung bình mẫu• Cho tổng thể có kì vọng và phương sai 2

• Lấy mẫu ngẫu nhiên cỡ n.• Gọi là trung bình mẫu. Ta có:

2

)

)

i E X

ii V Xn

X

Page 44: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 44

Phân phối của trung bình mẫuTổng thể Trung bình mẫu Kích thước mẫu

Tùy ý

Không chuẩn n>30

Không chuẩn nhưng đối

xứng.Có thể được với

n nhỏ.

2~ ;X N 2

~ ;X Nn

2

;X Nn

2

;X Nn

Page 45: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 45

Chuẩn hóa ppxsTổng thể TB mẫu Chuẩn hóa

Chuẩn,đã biết

n>30,đã biết

n>30,chưa biết

Chuẩn, n<30chưa biết

2

~ ;X Nn

2

;X Nn

2

;X Nn

~ 0;1X n

Z N

~ 1X n

Z t nS

~ 0;1X n

Z N

2

~ ;X Nn

~ 1X n

Z t nS

Page 46: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 46

Tính chất của PS mẫu• Cho tổng thể có kì vọng và phương sai 2

• Lấy mẫu ngẫu nhiên cỡ n.• Ta có:

2 2

2 2

*2 2

1ˆ)

)

)

nE S

n

E

i

i S

E S

i

iii

Page 47: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 47

Phân phối của phương sai mẫuTổng thể Phương sai mẫu Kích thước mẫu

Phân phối chuẩn Không biết Tùy ý

Không chuẩn Không biết n>30

Page 48: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 48

Phân phối của hàm PS mẫuTổng thể PS mẫu Hàm của PS mẫu

Chuẩn,đã biết

Không chuẩn đã biết

Chuẩnchưa biết

Không chuẩnchưa biết

2*S

2*2

21

2~

ni

i

XnSZ

Z n

2 , 30S n

22

21

2

1

~ 1

ni

i

n S X XZ

Z n

2S

2* , 30S n

Page 49: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 49

Tính chất của tỷ lệ mẫu• Cho tổng thể có tỷ lệ p về tính chất A.• Lấy mẫu ngẫu nhiên cỡ n.• Gọi F là tỷ lệ mẫu. Ta có:

)

)1

i E F p

ii V Fp p

n

Page 50: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 50

Phân phối của tỷ lệ mẫuTổng thể Tỷ lệ mẫu Kích thước mẫu

Phân phối B(1,p) n>30 1

;p p

F N pn

~ 0,1(1 )

F p nZ N

p p

Page 51: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 51

Bài 1Một mẫu kích thước n được rút ra từ tổng thể phân phối chuẩn với trung bình là μ và độ lệch chuẩn 10. Hãy xác định n sao cho:

) 10 10 0,9544

) 2 2 0,9544

a P X

b P X

Page 52: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 52

Bài 2Trọng lượng một loại sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình là 20,5 và độ lệch chuẩn 2.Lấy ngẫu nhiên 4 sản phẩm để kiểm tra thì với xác suất 0,95 trọng lượng trung bình của chúng sai lệch so với trọng lượng qui định tối đa là bao nhiêu?

Page 53: THỐNG KÊ

Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 53

Bài 3Chiều cao của thanh niên ở một địa phương là biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm và độ lệch chuẩn 10cm. Chọn ngẫu nhiên 31 thanh niên ở vùng đó.a) Tìm xác suất để chiều cao trung bình của số thanh niên nói trên không vượt quá 172 cm?b)Tìm xác suất để độ lệch chuẩn hiệu chỉnh về chiều cao của số thanh niên nói trên lớn hơn 15 cm?