THỐNG KÊ
description
Transcript of THỐNG KÊ
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 1
THỐNG KÊ
PHẦN 2
Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lý số liệu.
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 2
Bài toánNghiên cứu chiều cao của thanh niên Việt Nam trong
độ tuổi từ 15 đến 30.
Điều tra một loại bệnh mới trên gia cầm ở HCM.
Đánh giá chất lượng bia của nhà máy bia Sài gòn.
Nghiên cứu về giới tính trẻ sơ sinh lương công nhân ở khu công nghiệp Sóng Thần…
Đánh giá về một dịch vụ ngân hàng mới trên địa bàn tỉnh X
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 3
Các khái niệmTổng thể
Kích thước tổng thể
Dấu hiệu nghiên cứu
Ví dụ.
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 4
Các khái niệmMẫu
Kích thước mẫu
Mẫu ngẫu nhiên
Mẫu tổng quát
Mẫu cụ thể
Ví dụ
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 5
Phân phối xác suấtBiến ngẫu nhiên gốc tổng thể
Phân phối xs tổng thể
Phân phối xs mẫu
Ví dụ
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 6
Ví dụ 1 Cho tổng thể là 200 sinh viên trong một lớp. Số liệu về cân nặng của tổng thể này như sau:
Nếu ta quan tâm dấu hiệu định lượng: “số cân nặng của một sinh viên” thì:
X: ”cân nặng của một sinh viên trong lớp”
Cân nặng 45 46 49 54 55 57 60Số sinh viên 10 20 30 50 40 30 20
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 7
Ví dụ 1_ppxs ttKhi này phân phối của tổng thể:
Nếu ta quan tâm đến dấu hiệu định tính: ”nặng trên 50kg” thì đặt biến ngẫu nhiên:
Khi này phân phối của tổng thể:
X 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Y 0 1P 0,3 0,7
0 , 50
1 , 50
X kgY
X kg
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 8
Ví dụ 1_ppxs mẫuLấy ngẫu nhiên một sinh viên trong lớp. Gọi X1 là trọng
lượng của sinh viên này.
Ppxs của X1:
Gọi X2 là cân nặng của sinh viên thứ 2. Ta cũng có:
X2 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
X1 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 9
Ví dụ 1(tiếp theo)Tương tự cho đến sinh viên thứ n.
Ppxs của Xn:
Như vậy ta có một mẫu ngẫu nhiên cỡ n:
(X1, X2,…,Xn)
Và Xi là n biến ngẫu nhiên độc lập và có cùng ppxs với X. Ta nói đây là mẫu ngẫu nhiên tổng quát.
Xn 45 46 49 54 55 57 60P 0,05 0,1 0,15 0,25 0,2 0,15 0,1
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 10
Mẫu ngẫu nhiên cụ thểKhi đã làm phép thử chọn sinh viên. Giả sử các kết quả
như sau:• Sinh viên 1: 45kg• Sinh viên 2: 57kg• ….• Sinh viên n: 65kg
Thì bộ n số: (45, 57,…,65) gọi là mẫu cụ thểKý hiệu tổng quát: (x1,x2,…,xn)
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 11
Ví dụ 2Lấy mẫu ngẫu nhiên cỡ 5 từ tổng thể:
Mẫu tổng quát: (X1, X2, X3, X4, X5) trong đó Xi có phân phối B(1; 0,7) hay A(0,7)
Một mẫu cụ thể: (1, 0, 0, 1, 0)Mỗi lần lấy mẫu cho ta một mẫu cụ thể.
Y 0 1P 0,3 0,7 ~ 1;0,7 ~ 0,7Y B hay Y A
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 12
Tóm lạiMẫu ngẫu nhiên cỡ n: n biến ngẫu nhiên có cùng ppxs
với tổng thể. Chưa thực hiện phép thử.Ký hiệu: (X1, X2,…,Xn)
Mẫu cụ thể cỡ n: n giá trị (giá trị cụ thể của các bnn). Đã thực hiện phép thử.
Ký hiệu: (x1, x2, …, xn)
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 13
Lý thuyết mẫuNghiên cứu để đưa ra các kết quả
Suy diễn cho tổng thể
Nghiên cứu mối quan hệ giữa tổng thể và mẫu rút ra từ tổng thể đó.
Xác suất: nghiên cứu tổng thể hiểu về mẫu (cụ thể)Thống kê: nghiên cứu mẫu (cụ thể) hiểu tổng thể.
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 14
Phân loại mẫu• Mẫu định tính
• Mẫu định lượng
• Trình bày mẫu
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 15
Tham số tổng thể• Định nghĩa
• Các tham số thường gặp: trung bình, phương sai, tỷ lệ
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 16
Ví dụ• Tổng thể nghiên cứu là một xí nghiệp có 40 công nhân
với dấu hiệu nghiên cứu là năng suất lao động (sản phẩm/ đơn vị thời gian)
• Tính trung bình, phương sai tổng thể• Tính tỉ lệ công nhân có năng suất cao hơn 65sp.
Năng suất lao động 50 55 60 65 70 75
Số công nhân 3 5 10 12 7 3
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 17
Các tham số tổng thể Trung bình cộng tổng thể:
Phương sai tổng thể:
1
N
ii
xE X
N
2
2 1
N
ii
xV X
N
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 18
Các tham số tổng thể• Xét tổng thể định tính, dấu hiệu A.• Tỉ lệ tổng thể:
• N: kích thước tổng thể.• M: số phần tử trong tổng thể có dấu hiệu A.
Mp
N
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 19
Thống kê mẫu• Định nghĩa
• Các thống kê mẫu thường gặp: trung bình, phương sai, phương sai hiệu chỉnh, phương sai biết µ, tỷ lệ …
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 20
Tính thống kê mẫuĐiều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:
Hãy tính các thống kê mẫu sau:a) Trung bình mẫu, các phương sai mẫub) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?
Thời gian (giờ) 3 4 5 6 7 8Số sv 7 8 17 24 20 14
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 21
Các thống kê mẫu_tổng quát
• Cho mẫu định lượng tổng quát:
• Trung bình mẫu:
• Phương sai mẫu:
1 2, ,..., nX X X
2 222
1 1
1 1n n
i ii i
S X X X Xn n
1 2 ... nX X XX
n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 22
Các thống kê mẫu_tổng quát
• Phương sai mẫu hiệu chỉnh::
• Độ lệch mẫu:
• Độ lệch mẫu hiệu chỉnh:
2 22
1
1
1 1
n
ii
nS X X S
n n
2S S
2S S
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 23
Các thống kê mẫu_tổng quát
• Phương sai mẫu: (đã biết trung bình tổng thể )
1
2*2 1i
n
i
S Xn
*2 2 22S X X
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 24
Các thống kê mẫu_cụ thể• Cho mẫu định lượng cụ thể thu gọn:
• Trung bình mẫu:
1
1 k
i ii
x n xn
X x1 x2 … xk
Tần số n1 n2 … nk
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 25
Các thống kê mẫu_cụ thể• Phương sai mẫu:
• Phương sai mẫu hiệu chỉnh:
2 222
1 1
1 1k k
i i i ii i
s n x x n x xn n
2 22
1
1
1 1
k
i ii
ns n x x s
n n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 26
Các thống kê mẫu_cụ thể• Độ lệch chuẩn mẫu:
• Độ lệch chuẩn mẫu hiệu chỉnh:
2s s
2s s
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 27
Tỷ lệ mẫu_tổng quát• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính
chất A, tỉ lệ tổng thể là p. • Lấy mẫu ngẫu nhiên kích thước n: (X1, ..., Xn)• Tỉ lệ mẫu tổng quát:
• Xi là các biến ngẫu nhiên có phân phối A(p)• Tỷ lệ mẫu = trung bình của n biến ngẫu nhiên cùng
phân phối A(p)
1 2 ... nX X XkF X
n n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 28
Tỷ lệ mẫu_cụ thể• Xét tổng thể định tính, dấu hiệu nghiên cứu là tính
chất A, tỉ lệ tổng thể là p. • Lấy mẫu cụ thể kích thước n: (x1, x2 ,..., xn)• Tỉ lệ mẫu cụ thể:
• k: số phần tử trong mẫu có tính chất A.• n: cỡ mẫu• Với mẫu cụ thể ta đếm cho nhanh.
1 2 ... nx x xkf
n n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 29
Tổng thể Mẫu TQ Mẫu cụ thể
Kích thước N n n
Trung bình
Phương sai
Độ lệch chuẩn
Tỷ lệ A
Tổng thể và mẫu
E X
2 V X
V X
p P A
X
2 22 *; ;S S S
*; ;S S S
F
x
2 22 *; ;s s s
*; ;s s s
f
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 30
Tính thống kê mẫuĐiều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:
Hãy tính các thống kê mẫu sau:a) Trung bình mẫu, phương sai mẫu, phương sai mẫu
hiệu chỉnh?b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?
Thời gian (giờ) 3 4 5 6 7 8Số sv 7 8 17 24 20 14
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 31
Cách 1_Lập bảngxi ni xini (xi)2ni
…. …. …. ….…. …. …. ….
Tổngin i ix n 2
i ix n
i ix nx
n
2
2 2i ix ns x
n 22
1
ns s
n
in n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 32
Cách 1_Lập bảngxi ni xini (xi)2ni
3 7 21 634 8 32 1245 17 85 4256 24 144 8647 20 140 9808 14 112 896
Tổng 90 534 3352
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 33
Cách 1_Lập bảng• Cỡ mẫu:
• Trung bình mẫu:
• Phương sai mẫu:
• Phương sai mẫu hiệu chỉnh:
90in n 534
5,933390
i ix nx
n
2
2 2... 2,0404i ix n
s xn
22 2,06331
ns s
n
2,0633 1,4364s
Độ lệch mẫu hiệu chỉnh:
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 34
Cách 2__dùng máy tính 570ES1. Shift + 9 + 3 + = + =: Reset máy2. Shift + Mode + + 5 + 1: bật tần số3. Mode + 3 + 1: vào tính thống kê 1 biến4. Khi này ta có bảng sau:
X FREQ123
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 35
Cách 2__dùng máy tính 570ES• Ta nhập vào như sau:
• Nhấn AC để thoát.
X FREQ1 3 72 4 83 5 174 6 245 7 206 8 14
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 36
Cách 2_dùng máy tính 570ES6. Lấy số liệu thống kê: Shift + 1 + 4.Ta có bảng sau:
Tương ứng:1: cỡ mẫu 2: trung bình mẫu3. Độ lệch chuẩn mẫu.4. Độ lệch chuẩn mẫu hiệu chỉnh.
1: n 2:
3: x 4: sx
x
Không phải
phương sai
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 37
Đối với FX 500MS hoặc 570MS1. Reset máy: Shift + Mode + 3 + = + =2. Vào hệ SD:• Máy 500MS: Mode + 2• Máy 570MS: Mode + Mode + 1
3. Nhập dữ liệu: “Giá trịShift , Tần sốM+”• 3Shift , 7M+• Nhập đến hết. Nhấn AC
4. Lấy số liệu: • Shift 2 1 = : Trung bình mẫu.• Shift 2 3 = : Độ lệch chuẩn mẫu hiệu chỉnh.
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 38
Ví dụ 1Đường kính (mm) của
100 chi tiết do một máy sản xuất kết quả cho ở bảng sau:
a) Tính thống kê mẫu?b) Tính tỷ lệ chi tiết từ
20mm trở lên trong mẫu?
Đường kính Số chi tiết19,80 – 19,85 319,85 – 19,90 519,90 – 19,95 1619,95 – 20,00 2820,00 – 20,05 2320,05 – 20,10 1420,10 – 20,15 720,15 – 20,20 4
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 39
Ví dụ 1•Ta viết lại mẫu:
•Từ mẫu ta có:•Cỡ mẫu: n=100•Trung bình mẫu: x=20,0015•Độ lệch chuẩn mẫu hiệu chỉnh: s=0,077997≈0,0780
xi 19,825 19.875 19.925 19.975 20.025ni 3 5 16 28 23
20.075 20.125 20.17514 7 4
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 40
Định lí Giới hạn trung tâm (CLT)1. Cho X1, X2, …, Xn là n đại lượng ngẫu nhiên độc lập
toàn phần.
2. Nếu: thì:
Với n đủ lớn.Trong thống kê ta coi n>30 là đủ lớn.
2;i iE X V X 2
1 2 ...~ ,nX X X
X Nn n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 41
Định lí Giới hạn trung tâm (CLT)1. Cho n biến ngẫu nhiên độc lập.2. Cùng kỳ vọng, cùng phương sai.3. Số lượng biến ngẫu nhiên đủ lớn (>30).4. Trung bình của n biến ngẫu nhiên này sẽ có phân phối
xấp xỉ phân phối chuẩn 5. Điều này đúng bất chấp phân phối của các biến ngẫu
nhiên thành phần là gì.
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 42
Phân phối xs thống kê mẫu• Trung bình mẫu• Tỷ lệ mẫu• Phương sai mẫu
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 43
Tính chất của trung bình mẫu• Cho tổng thể có kì vọng và phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n.• Gọi là trung bình mẫu. Ta có:
2
)
)
i E X
ii V Xn
X
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 44
Phân phối của trung bình mẫuTổng thể Trung bình mẫu Kích thước mẫu
Tùy ý
Không chuẩn n>30
Không chuẩn nhưng đối
xứng.Có thể được với
n nhỏ.
2~ ;X N 2
~ ;X Nn
2
;X Nn
2
;X Nn
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 45
Chuẩn hóa ppxsTổng thể TB mẫu Chuẩn hóa
Chuẩn,đã biết
n>30,đã biết
n>30,chưa biết
Chuẩn, n<30chưa biết
2
~ ;X Nn
2
;X Nn
2
;X Nn
~ 0;1X n
Z N
~ 1X n
Z t nS
~ 0;1X n
Z N
2
~ ;X Nn
~ 1X n
Z t nS
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 46
Tính chất của PS mẫu• Cho tổng thể có kì vọng và phương sai 2
• Lấy mẫu ngẫu nhiên cỡ n.• Ta có:
2 2
2 2
*2 2
1ˆ)
)
)
nE S
n
E
i
i S
E S
i
iii
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 47
Phân phối của phương sai mẫuTổng thể Phương sai mẫu Kích thước mẫu
Phân phối chuẩn Không biết Tùy ý
Không chuẩn Không biết n>30
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 48
Phân phối của hàm PS mẫuTổng thể PS mẫu Hàm của PS mẫu
Chuẩn,đã biết
Không chuẩn đã biết
Chuẩnchưa biết
Không chuẩnchưa biết
2*S
2*2
21
2~
ni
i
XnSZ
Z n
2 , 30S n
22
21
2
1
~ 1
ni
i
n S X XZ
Z n
2S
2* , 30S n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 49
Tính chất của tỷ lệ mẫu• Cho tổng thể có tỷ lệ p về tính chất A.• Lấy mẫu ngẫu nhiên cỡ n.• Gọi F là tỷ lệ mẫu. Ta có:
)
)1
i E F p
ii V Fp p
n
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 50
Phân phối của tỷ lệ mẫuTổng thể Tỷ lệ mẫu Kích thước mẫu
Phân phối B(1,p) n>30 1
;p p
F N pn
~ 0,1(1 )
F p nZ N
p p
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 51
Bài 1Một mẫu kích thước n được rút ra từ tổng thể phân phối chuẩn với trung bình là μ và độ lệch chuẩn 10. Hãy xác định n sao cho:
) 10 10 0,9544
) 2 2 0,9544
a P X
b P X
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 52
Bài 2Trọng lượng một loại sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình là 20,5 và độ lệch chuẩn 2.Lấy ngẫu nhiên 4 sản phẩm để kiểm tra thì với xác suất 0,95 trọng lượng trung bình của chúng sai lệch so với trọng lượng qui định tối đa là bao nhiêu?
Bài giảng Xác suất Thống kê 2014 Nguyễn Văn Tiến 53
Bài 3Chiều cao của thanh niên ở một địa phương là biến ngẫu nhiên phân phối chuẩn với trung bình 170 cm và độ lệch chuẩn 10cm. Chọn ngẫu nhiên 31 thanh niên ở vùng đó.a) Tìm xác suất để chiều cao trung bình của số thanh niên nói trên không vượt quá 172 cm?b)Tìm xác suất để độ lệch chuẩn hiệu chỉnh về chiều cao của số thanh niên nói trên lớn hơn 15 cm?