🔙 Quay lại trang tải sách pdf ebook Giáo trình lý thuyết xác suất và thống kê ứng dụng
Ebooks
Nhóm Zalo
TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING BỘ MÔN TOÁN THỐNG KÊ
Giáo Trình
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ ỨNG DỤNG (Dành cho chương trình chất lượng cao)
Mã số : GT – 15 – 21
Nhóm biên soạn:
Nguyễn Huy Hoàng (Chủ biên) Nguyễn Trung Đông
Nguyễn Văn Phong
Dương Thị Phương Liên
Nguyễn Tuấn Duy
Võ Thị Bích Khuê
THÀNH PHỐ HỒ CHÍ MINH - 2021
MỤC LỤC
Trang
Lời mở đầu ..................................................................................................................6 Một số ký hiệu.............................................................................................................8 Chương 1. Biến cố ngẫu nhiên và xác suất...................................................................9 1.1. Phép thử và các loại biến cố .............................................................................9 1.1.1. Sự kiện ngẫu nhiên và phép thử................................................................9 1.1.2. Các loại biến cố........................................................................................9 1.1.3. Các phép toán giữa các biến cố.…………………………………………10 1.1.4. Quan hệ giữa các biến cố........................................................................11 1.2. Xác suất của biến cố.......................................................................................12 1.2.1. Khái niệm chung về xác suất..................................................................12 1.2.2. Định nghĩa cổ điển .................................................................................13 1.2.3. Định nghĩa xác suất bằng tần suất...........................................................13 1.2.4. Định nghĩa hình học về xác suất.............................................................15 1.2.5. Định nghĩa tiên đề về xác suất................................................................16 1.2.6. Nguyên lý xác suất nhỏ và xác suất lớn ..................................................16 1.3. Xác suất có điều kiện ....................................................................................17 1.3.1. Định nghĩa..............................................................................................18 1.3.2. Công thức nhân xác suất.........................................................................18 1.3.3. Công thức xác suất đầy đủ......................................................................19 1.3.4. Công thức Bayes ....................................................................................21 1.3.5. Sự độc lập của các biến cố......................................................................22 1.4. Công thức Bernoulli ......................................................................................23 1.5. Tóm tắt chương 1 ..........................................................................................25 1.6. Bài tập............................................................................................................26 1.7. Tài liệu tham khảo..........................................................................................35 Thuật ngữ chính chương 1 .........................................................................................36 Chương 2. Đại lượng ngẫu nhiên và phân phối xác suất.............................................37 2.1. Đại lượng ngẫu nhiên ....................................................................................37 2.1.1. Khái niệm...............................................................................................37 2.1.2. Phân loại ................................................................................................37 2.2. Phân phối xác suất của đại lượng ngẫu nhiên .................................................38 2.2.1. Đại lượng ngẫu nhiên rời rạc ..................................................................38
2
2.2.2. Đại lượng ngẫu nhiên liên tục.................................................................41 2.3. Các số đặc trưng của đại lượng ngẫu nhiên ....................................................43 2.3.1. Kỳ vọng .................................................................................................43 2.3.2. Trung bình..............................................................................................43 2.3.3. Phương sai..............................................................................................43 2.3.4. Mệnh đề .................................................................................................44 2.3.5. Độ lệch chuẩn.........................................................................................44 2.3.6. Ý nghĩa của kỳ vọng và phương sai........................................................45 2.3.7. Mốt và trung vị.......................................................................................48 2.3.8. Giá trị tới hạn .........................................................................................49 2.3.9. Hệ số đối xứng và hệ số nhọn.................................................................49 2.4. Một số quy luật phân phối xác suất quan trọng...............................................50 2.4.1. Phân phối nhị thức B(n;p) .....................................................................50 2.4.2. Phân phối siêu bội H(N,K,n) ................................................................52 2.4.3. Phân phối Poisson P( ) μ .........................................................................53 2.4.4. Phân phối đều U a,b [ ]............................................................................55 2.4.5. Phân phối mũ ........................................................................................56 2.4.6. Phân phối chuẩn tắc N 0,1 ( ) ...................................................................57 2.4.7. Phân phối chuẩn ( ) 2 N , μ σ ....................................................................58 2.4.8. Phân phối Gamma và phân phối Chi bình phương .................................60 2.4.9. Phân phối Student: St(n) ......................................................................61 2.4.10. Phân phối Fisher: F(n,m) ...................................................................62 2.5. Tóm tắt chương 2 ..........................................................................................62 2.6. Bài tập............................................................................................................65 2.7. Tài liệu tham khảo..........................................................................................76 Thuật ngữ chính chương 2 .........................................................................................77 Chương 3. Mẫu ngẫu nhiên và bài toán ước lượng.....................................................78 3.1. Mẫu ngẫu nhiên .............................................................................................78 3.1.1. Tổng thể nghiên cứu...............................................................................78 3.1.2. Mẫu ngẫu nhiên .....................................................................................80 3.1.3. Các đặc trưng quan trọng của mẫu..........................................................81 3.2. Trình bày kết quả điều tra...............................................................................84 3.2.1. Trình bày kết quả điều tra dưới dạng bảng..............................................84 3.2.2. Trình bày kết quả điều tra bằng biểu đồ..................................................86
3
3.2.3. Tính giá trị của các đặc trưng mẫu qua số liệu điều tra ...........................87 3.3. Ước lượng tham số.........................................................................................93 3.3.1. Phương pháp ước lượng điểm.................................................................93 3.3.2. Phương pháp ước lượng bằng khoảng tin cậy ........................................95 3.3.3. Bài toán ước lượng khoảng tin cậy cho giá trị trung bình........................95 3.3.4. Bài toán ước lượng khoảng tin cậy cho phương sai .............................. 101 3.3.5. Bài toán ước lượng khoảng tin cậy cho tỷ lệ......................................... 105 3.4. Bài toán xác định cỡ mẫu ............................................................................. 106 3.5. Tóm tắt chương 3 ........................................................................................ 108 3.6. Bài tập.......................................................................................................... 111 3.7. Tài liệu tham khảo........................................................................................ 120 Thuật ngữ chính chương 3 ....................................................................................... 121 Chương 4. Kiểm định giả thuyết thống kê.……………………….… ………………122 4.1. Bài toán kiểm định giả thuyết thống kê ........................................................ 122 4.1.1. Đặt vấn đề, giả thuyết, đối thuyết, kiểm định giả thuyết thống kê . ……122 4.1.2. Các loại sai lầm trong kiểm định giả thuyết thống kê…………………. 124 4.1.3. Giải quyết vấn đề ................................................................................. 125 4.2. Kiểm định giả thuyết về giá trị trung bình .................................................... 126 4.2.1. Kiểm định giả thuyết về giá trị trung bình, nếu biết 2 σ0 ........................ 126 4.2.2. Kiểm định giả thuyết về giá trị trung bình, nếu chưa biết 2 σ0 ................ 128 4.3. Kiểm định giả thuyết về tỷ lệ ....................................................................... 132 4.4. Kiểm định giả thuyết về phương sai..................... ..........................................134 4.5. Bài toán so sánh …….…………......................……………..…….………...136 4.5.1. So sánh hai trung bình μX và μY của hai tổng thể.................................136 4.5.2. So sánh hai tỷ lệ Xp và Yp của hai tổng thể...…………………….....141
4.5.3. So sánh hai phương sai 2 σX và 2 σY của hai tổng thể...............................143 4.6. Kiểm định phi tham số……………..….......... ... ............................................145 4.6.1. Kiểm định về tính độc lập..................................... ..................................145 4.6.2. Kiểm định về tính phù hợp................................... ..................................154 4.6.3. Kiểm định dấu và hạng Wilconxon..................... ...................................158 4.6.4. Kiểm định tổng và hạng Wilconxon.................. .....................................167 4.6.5. Kiểm định Kruskal – Wallis ............................ ... ...................................170 4.7. Tóm tắt chương 4 ........................................................................................ 173 4.8. Bài tập.......................................................................................................... 178
4
4.9. Tài liệu tham khảo........................................................................................ 186 Thuật ngữ chính chương 4……………………….…..... ………………………........187 Chương 5. Phân tích phương sai…………………….… ……………………….......188 5.1. Phân tích phương sai một yếu tố …….................. ……………….……..…..188 5.2. Phân tích phương sai hai yếu tố ............................. ........................................195 5.2.1. Phân tích phương sai hai yếu tố không lặp.…...............……..………...195 5.2.2. Phân tích phương sai hai yếu tố có lặp............ .......................................202 5.3. Tóm tắt chương 5 ........................................................................................ 211 5.4. Bài tập.......................................................................................................... 213 5.5. Tài liệu tham khảo........................................................................................ 219 Thuật ngữ chính chương 5..........................................………….………..…………..220 Chương 6. Phân tích dãy số thời gian……………………….…............……………221 6.1. Dãy số thời gian………...……….……………………………………. …….221 6.1.1. Khái niệm và phân loại...…………………………………………... ….221 6.1.2. Các chỉ tiêu phân tích dãy số thời gian.…………………………..... ….223 6.2. Hàm xu thế……...………………………...…… .............................. ………230 6.2.1. Hàm xu thế tuyến tính .......................................................................... 230 6.2.2. Hàm số bậc 2 ..........................................................................................232 6.2.3. Hàm số mũ ............................................................. ................................233 6.2.4. Hàm hypebol ..........................................................................................235 6.3. Dự báo theo dãy số thời gian........................................................................ 236 6.3.1. Dự báo dựa vào lượng tăng giảm tuyệt đối trung bình...... ..... ...............236 6.3.2. Dự báo dựa vào tốc độ phát triển trung bình............................ ..............237 6.3.3. Dự báo dựa vào hàm xu thế tuyến tính.................................... ..............238 6.4. Tóm tắt chương 6 ........................................................................................ 239 6.5. Bài tập.......................................................................................................... 241 6.6. Tài liệu tham khảo........................................................................................ 248 Thuật ngữ chính chương 6……………………….…..... ………………………........249 Một số đề tham khảo……………………….…............. ………………………........250 Phụ lục 1. Giải tích tổ hợp……………………….…..... ………………………........261 Phụ lục 2. Các bảng giá trị tới hạn của các phân phối xác suất……………………...265
5
LỜI MỞ ĐẦU
Các bạn đang có trong tay cuốn “Lý thuyết xác suất và thống kê ứng dụng” dành cho sinh viên hệ chất lượng cao, trường đại học Tài chính – Maketing. Đây là giáo trình dành cho sinh viên khối ngành kinh tế và quản trị kinh doanh với thời lượng 3 tín chỉ (45 tiết giảng); chính vì vậy chúng tôi cố gắng lựa chọn các nội dung căn bản, trọng yếu và có nhiều ứng dụng trong kinh tế và quản trị kinh doanh; chú trọng ý nghĩa và khả năng áp dụng của kiến thức; giáo trình được biên tập trên cơ sở tham khảo nhiều giáo trình quốc tế cũng như trong nước (xem phần tài liệu tham khảo), cũng như kinh nghiệm giảng dạy nhiều năm của các tác giả; giáo trình dành cho hệ đào tạo chất lượng cao nên chúng tôi cũng rất quan tâm việc giới thiệu thuật ngữ Anh – Việt, giúp sinh viên có thể tự đọc, tự nghiên cứu các tài liệu viết bằng tiếng Anh.
Nội dung giáo trình đã được thiết kế phù hợp với chương trình đào tạo và trình độ của sinh viên khối ngành kinh tế và quản trị kinh doanh. Giáo trình bao gồm 6 chương và một số phụ lục;
Chương 1. Trình bày về biến cố ngẫu nhiên và xác suất.
Chương 2. Trình bày về đại lượng ngẫu nhiên và phân phối xác suất. Chương 3. Trình bày về mẫu ngẫu nhiên và bài toán ước lượng khoảng tin cậy. Chương 4. Trình bày về bài toán kiểm định giả thuyết thống kê.
Chương 5. Trình bày về nội dung phân tích phương sai.
Chương 6. Trình bày về phân tích dãy số thời gian.
Cuối mỗi chương, chúng tôi có giới thiệu một số thuật ngữ Anh – Việt và tài liệu tham khảo.
Phần cuối, chúng tôi biên soạn một số đề tham khảo để sinh viên có cơ hội thử sức, tự rèn luyện và một số phụ lục để tiện cho sinh viên có thể tự tra cứu.
Do đối tượng người đọc là sinh viên chuyên ngành kinh tế và quản trị kinh doanh nên chúng tôi chọn cách tiếp cận đơn giản không quá đi sâu về lý thuyết mà chủ yếu quan tâm vào ý nghĩa và áp dụng trong kinh tế quản trị kinh doanh của khái niệm và kết quả lý thuyết xác suất và thống kê toán, chúng tôi cũng sử dụng nhiều ví dụ để người học
6
dễ hiểu, dễ áp dụng; Giáo trình do Giảng viên cao cấp TS. Nguyễn Huy Hoàng và ThS. Nguyễn Trung Đông biên tập phần lý thuyết, TS. Nguyễn Tuấn Duy, TS. Võ Thị Bích Khuê, ThS. Nguyễn Văn Phong và ThS. Dương Thị Phương Liên biên tập phần bài tập các chương, đề tham khảo và phần phụ lục; đây là các giảng viên của Bộ môn Toán – Thống kê, trường đại học Tài chính – Marketing, đã có nhiều năm kinh nghiệm nghiên cứu và giảng dạy Lý thuyết xác suất và Thống kê ứng dụng cho sinh viên khối ngành kinh tế và quản trị kinh doanh.
Lần đầu biên soạn, nên giáo trình này không tránh khỏi sai sót. Rất mong nhận được sự góp ý của các độc giả để lần sau giáo trình được hoàn thiện hơn.
Mọi ý kiến đóng góp xin gởi về địa chỉ email:
[email protected] và [email protected].
Xin trân trọng cảm ơn Trường đại học Tài chính – Marketing đã hỗ trợ kinh phí và tạo điều kiện cho giáo trình sớm đến với bạn đọc!
Các tác giả
7
MỘT SỐ KÝ HIỆU
1. Ω: Không gian mẫu.
2. w : Biến cố sơ cấp.
3. P A : ( ) Xác suất biến cố A.
4. μ = X E X : ( ) Kỳ vọng (trung bình) của biến cố X. 5. X : Trung bình mẫu của X.
6. ( ) ( ) 2X σ = = var X D X : Phương sai của biến cố X. 7. 2 S : X Phương sai ngẫu cóa hiệu chỉnh của X.
8. X : Biến ngẫu nhiên X.
9. X B(n;p) : Biến ngẫu nhiên X có phân phối nhị thức. 10. X H(N,K,n) : Biến ngẫu nhiên X có phân phối siêu bội. 11. X P( ) : μ Biến ngẫu nhiên X có phân phối Poisson. 12. X U a,b : [ ] Biến ngẫu nhiên X có phân phối đều. 13. X Exp : (λ) Biến ngẫu nhiên X có phân phối mũ. 14. X N 0,1 : ( ) Biến ngẫu nhiên X có phân phối chuẩn tắc. 15. ( ) 2 X N , : μ σ Biến ngẫu nhiên X có phân phối chuẩn. 16. X , : Γ α β ( ) Biến ngẫu nhiên X có phân phối Gamma. 17. 2 X (r) : χ Biến ngẫu nhiên X có phân phối Chi bình phương. 18. X St(n) : Biến ngẫu nhiên X có phân phối Student. 19. X F(n,m) : Biến ngẫu nhiên X có phân phối Fisher. 20. δ : Lượng tăng giảm tuyệt đối liên hoàn.
21. Δ : Lượng tăng giảm tuyệt đối định gốc.
22. Σ : Ký hiệu tổng.
23. Π : Ký hiệu tích.
24. H : 0 Giả thuyết H . 0
25. H : 1 Đối thuyết (nghịch thuyết) H .1
8
Chương 1 BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT
----------------------------------------------------------------------------------------------------------- Mục tiêu chương 1
Chương này giúp sinh viên:
- Phân biệt được sự kiện ngẫu nhiên (đối tượng môn xác suất) và sự kiện tất định (đối tượng của vật lý và hóa học). Nắm được các khái niệm về phép thử, không gian mẫu, biến cố và biến cố sơ cấp cũng như các biến cố đặc biệt.
- Hiểu được thế nào là xác suất và biết một số định nghĩa về xác suất. - Biết và áp dụng được công thức xác suất đầy đủ và công thức xác suất Bayes. - Biết áp dụng công thức Bernoulli để tính xác suất.
----------------------------------------------------------------------------------------------------------- 1.1. Phép thử và các loại biến cố
1.1.1. Sự kiện ngẫu nhiên và phép thử
Sự kiện ngẫu nhiên là những sự kiện dù được thực hiện trong cùng một điều kiện như nhau vẫn có thể cho nhiều kết quả khác nhau. Chẳng hạn, tung một con xúc xắc, ta không thể chắc chắn rằng mặt nào sẽ xuất hiện; lấy ra một sản phẩm từ một lô hàng gồm cả hàng chính phẩm lẫn phế phẩm, ta không chắc chắn sẽ nhận được hàng chính phẩm hay phế phẩm. Sự kiện ngẫu nhiên là đối tượng khảo sát của lý thuyết xác suất.
Mỗi lần cho xảy ra một sự kiện ngẫu nhiên được gọi là thực hiện một phép thử, còn sự kiện có thể xảy ra trong kết quả của phép thử đó gọi là biến cố. Khi đó, dù ta không thể dự đoán được kết quả nào sẽ xảy ra nhưng thường ta có thể liệt kê tất cả các kết quả có thể xảy ra. Tập hợp tất cả các kết quả có thể xảy ra của một phép thử được gọi là không gian mẫu. Ký hiệu Ω.
Ví dụ 1.1. Xét phép thử “tung một con xúc xắc”. Ta có thể nhận được mặt 1 chấm, mặt 2 chấm, …, mặt 6 chấm. Vậy không gian mẫu có thể liệt kê và ký hiệu như sau: Ω = {1,2,3,4,5,6 . }
1.1.2. Các loại biến cố
- Biến cố chắc chắn là biến cố luôn luôn sẽ xảy ra khi thực hiện một phép thử, biến cố chắc chắn thường ký hiệu là U.
- Biến cố không thể có là biến cố không bao giờ xảy ra khi thực hiện một phép thử, biến cố không thể có thường ký hiệu là V.
- Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra khi thực hiện phép
9
thử. Ta có thể xem biến cố ngẫu nhiên là một tập con của không gian mẫu, các biến cố ngẫu nhiên thường ký hiệu là A, B, C,.... . ⊂ Ω
- Biến cố sơ cấp là một kết quả (kết cục) của không gian mẫu, ký hiệu w . ∈Ω Do đó, không gian mẫu là tập hợp tất cả các biến cố sơ cấp.
Ví dụ 1.2. Thực hiện phép thử tung một con xúc xắc. Ta có:
- Không gian mẫu: Ω =. 1,2,3,4,5,6 { }
- Biến cố: “nhận được mặt có số chấm ≤ 6 ” là biến cố chắc chắn.
- Biến cố: “nhận được mặt có 7 chấm” là biến cố không thể có.
- Biến cố: “nhận được mặt có số chấm là chẵn” là biến cố ngẫu nhiên. - Biến cố: “nhận được mặt 1 chấm” là biến cố sơ cấp.
1.1.3. Các phép toán giữa các biến cố
1.1.3.1. Tổng các biến cố
Cho hai biến cố bất kỳ A, B ⊂ Ω, ta có thể thành lập biến cố:
A B A B ∪ ≡ + là chỉ biến cố “A xảy ra hay B xảy ra khi thực hiện phép thử”.
Hình 1.1. Hình vẽ minh họa tổng hai biến cố.
Tổng quát, cho B ,B ,...,B 1 2 n ⊂ Ω, ta có thể thành lập biến cố:
n n
≡ ∑ là chỉ biến cố “có ít nhất một trong n biến cố đó xảy ra khi thực
B B
i i
i 1 i 1
= =
hiện phép thử”.
1.1.3.2. Tích các biến cố
Cho hai biến cố bất kỳ A, B ⊂ Ω, ta có thể thành lập biến cố:
A B A B ∩ ≡ ⋅ là chỉ biến cố “A và B cùng xảy ra khi thực hiện phép thử”. Hình 1.2. Hình vẽ minh họa tích hai biến cố.
10
Tổng quát, cho B ,B ,...,B 1 2 n ⊂ Ω, ta có thể thành lập biến cố:
n n
≡∏ là chỉ biến cố “cả n biến cố đó cùng xảy ra khi thực hiện phép thử”.
B B
i i
i 1 i 1
= =
Ví dụ 1.3. Khảo sát một lớp học về sự yêu thích môn xác suất thống kê và môn kinh tế học. Chọn ngẫu nhiên một sinh viên trong lớp này.
Gọi A là biến cố “nhận được sinh viên thích môn xác suất thống kê” và B là biến cố “nhận được sinh viên thích môn kinh tế học”. Suy ra
Biến cố “sinh viên thích ít nhất một môn” là biến cố: A B. +
Biến cố “sinh viên thích cả hai môn” là biến cố: AB.
1.1.4. Quan hệ giữa các biến cố
1.1.4.1. Hai biến cố độc lập
Hai biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra của biến cố A không phụ thuộc vào việc biến cố B xảy ra hay không xảy ra và ngược lại.
Nếu hai biến cố A và B không độc lập với nhau thì ta gọi là hai biến cố phụ thuộc. Tổng quát,
- B ,B ,...,B 1 2 n là họ các biến cố độc lập với nhau từng đôi nếu hai biến cố bất kỳ trong n biến cố đó độc lập với nhau.
- B ,B ,...,B 1 2 n là họ các biến cố độc lập toàn phần nếu mỗi biến cố đó độc lập với một tổ hợp bất kỳ của các biến cố còn lại.
1.1.4.2. Hai biến cố xung khắc
Hai biến cố A và B gọi là xung khắc với nhau nếu chúng không thể đồng thời xảy ra trong cùng một phép thử.
A và B xung khắc khi và chỉ khi A B . ∩ = ∅
Tổng quát, cho B ,B ,...,B 1 2 n là họ các biến cố xung khắc từng đôi một nếu bất kỳ 2 biến cố nào trong nhóm này cũng xung khắc với nhau, nghĩa là
B B i j ∩ = ∅ với i j ≠ và i, j = 1,n.
Ví dụ 1.4. Trong một giỏ hàng có hai loại sản phẩm: Sản phẩm loại 1 và sản phẩm loại 2. Lấy ngẫu nhiên từ giỏ hàng đó ra một sản phẩm.
Gọi A là biến cố “nhận được sản phẩm loại 1”.
Gọi B là biến cố “nhận được sản phẩm loại 2”.
⇒ A và B là 2 biến cố xung khắc.
11
Ví dụ 1.5. Gieo đồng thời hai con xúc xắc.
Gọi C là biến cố “Con xúc xắc thứ nhất xuất hiện mặt 6 chấm”.
Gọi D là biến cố “Con xúc xắc thứ hai xuất hiện mặt 6 chấm”.
⇒ C và D không xung khắc.
1.1.4.3. Họ đầy đủ các biến cố
B ,B ,...,B 1 2 n là họ đầy đủ các biến cố nếu thỏa mãn hai điều kiện sau: i) B B ... B 1 2 n ∪ ∪ ∪ = Ω và
ii) B B , i j. i j ∩ = ∅ ≠
Ví dụ 1.6. Gieo một con xúc xắc.
Gọi Bi là biến cố “nhận được mặt có i chấm”, i 1,6. =
Các biến cố B ,B ,...,B 1 2 6 tạo nên một họ đầy đủ các biến cố.
1.1.4.4. Hai biến cố đối lập
Hai biến cố A và A gọi là hai biến cố đối lập với nhau nếu chúng tạo nên một họ đầy đủ các biến cố.
A và A là hai biến cố đối lập ⇔ ∪ = Ω A A và A A . ∩ = ∅
Hình 1.3. Hình vẽ minh họa hai biến cố đối lập.
1.2. Xác suất của biến cố
1.2.1. Khái niệm chung về xác suất
Quan sát các biến cố đối với một phép thử, mặc dù không thể khẳng định một biến cố có xảy ra hay không nhưng người ta có thể phỏng chừng cơ may xảy ra của các biến cố này là ít hay nhiều. Chẳng hạn, với phép thử "tung xúc xắc", biến cố "nhận được mặt 1" ít xảy ra hơn biến cố "nhận được mặt chẵn". Do đó, người ta tìm cách định lượng khả năng xuất hiện khách quan của một biến cố mà ta sẽ gọi là xác suất của biến cố đó.
Xác suất của một biến cố là một con số đặc trưng cho khả năng xảy ra khách quan của biến cố đó.
Xác suất của biến cố A, ký hiệu là P A( ), có thể được định nghĩa bằng nhiều cách.
12
1.2.2. Định nghĩa cổ điển
Xét một phép thử τ với n kết quả có thể xảy ra, nghĩa là không gian mẫu Ω có n biến cố sơ cấp, và biến cố A ⊂ Ω có k phần tử. Nếu các biến cố sơ cấp có cùng khả năng xảy ra thì xác suất của Ađược định nghĩa là
( ) A k P A .n = = Ω (1.1)
Trong đó A , Ω là số khả năng của biến cố A và số khả năng của Ω.
Ví dụ 1.7.
a) Xét phép thử “tung một con xúc xắc” với các biến cố
A ≡ "nhận được mặt 6",
B ≡ "nhận được mặt chẵn".
Theo công thức (1.1), ta có
( ) 1 P A6 = và ( ) 3 P B 0,5. 6 = =
b) Xét phép thử "lấy ngẫu nhiên một sản phẩm trong một giỏ hàng đựng 4 sản phẩm loại 1 và 6 sản phẩm loại 2" với các biến cố
C ≡ “nhận được sản phẩm loại 1”,
D ≡ “nhận được sản phẩm loại 2”.
Theo công thức (1.1), ta có
( ) 4 P C 0,4 10
= = và ( ) 6 P D 0,6. 10
= =
Lưu ý rằng, đối với định nghĩa cổ điển, ta cần hai điều kiện:
Số kết quả của phép thử là hữu hạn,
Các kết quả đồng khả năng xảy ra.
Khi một trong hai điều kiện trên không xảy ra, ta không thể dùng định nghĩa cổ điển để xác định xác suất của một biến cố. Ta có thể định nghĩa xác suất bằng phương pháp thống kê như sau.
1.2.3. Định nghĩa xác suất bằng tần suất
Giả sử phép thử τ có thể lập lại nhiều lần trong điều kiện giống nhau. Nếu trong n lần thực hiện phép thử mà biến cố A xảy ra k lần thì tỷ số knđược gọi là tần suất xảy ra của A trong n phép thử.
13
Người ta chứng minh được rằng, khi n đủ lớn, tần suất của biến cố A sẽ dao động xung quanh một giá trị cố định nào đó mà ta gọi là xác suất của A, ký hiệu P A( ). Ta có ( ) nk P A lim→∞ n =
Trong thực tế, với n đủ lớn, người ta lấy tần suất của A làm giá trị gần đúng cho xác suất của biến cố A, nghĩa là
( ) k P An ≈ . (1.2)
Ví dụ 1.8.
a) Thống kê trên 10000 người dân thành phố cho thấy có 51 người bị bệnh cao huyết áp, theo công thức (1.2), ta nói xác suất của biến cố “bị bệnh cao huyết áp” là 51 0,005. 10000 ≈
b) Một nhà máy gồm ba phân xưởng A, B, C. Kiểm tra một lô hàng của nhà máy gồm 1000 sản phẩm, người ta thấy có 252 sản phẩm của phân xưởng A, 349 của phân xưởng B và 399 của phân xưởng C. Theo công thức (1.2), ta nói xác suất nhận được sản phẩm từ phân xưởng A là ( ) 252 P A 0,25, 10000
= ≈
nhận được sản phẩm từ phân xưởng B là ( ) 349 P B 0,35, 10000
= ≈ và
nhận được sản phẩm từ phân xưởng C là ( ) 399 P C 0,4. 10000
= ≈
Ta còn nói, các phân xưởng A, B, C tương ứng làm ra 25%, 35% và 40% tổng sản lượng nhà máy.
Tương tự, để tìm xác suất làm ra sản phẩm hỏng của phân xưởng A, người ta thống kê trên một số sản phẩm của phân xưởng A và quan sát số sản phẩm hỏng. Chẳng hạn, nếu trong 400 sản phẩm của phân xưởng A nêu trên có 4 sản phẩm hỏng, theo công thức (1.2), ta nói xác suất làm ra một sản phẩm hỏng của phân xưởng A là 4 0,01. 400 =
Ví dụ 1.9. Xét phép thử τ : “tung đồng xu”, một cách trực giác, ta cho rằng các biến cố sơ cấp w1: “nhận được mặt sấp” và w2 : “nhận được mặt ngửa” là đồng khả năng xảy ra, nên do định nghĩa cổ điển, ( ) ( ) P w P w 0,5. 1 2 = = Khi đó, người ta nói đồng xu này là “công bằng”, “đồng chất đẳng hướng”, .... Bằng thực nghiệm, một số nhà khoa học đã
14
tung một đồng xu nhiều lần và nhận được kết quả sau:
Người thực hiện Số lần thảy Số lần mặt ngửa Tần suất
Buffon 4040 2048 0,5069
Pearson 12000 6019 0,5016
Pearson 24000 12012 0,5005
và khi đó, ta nói xác suất nhận được mặt ngửa ≈ 0,5.
1.2.4. Định nghĩa hình học về xác suất
Định nghĩa hình học về xác suất có thể sử dụng khi xác suất để một điểm ngẫu nhiên rơi vào một phần nào đó của một miền cho trước tỷ lệ với độ đo của miền đó (độ dài, diện tích, thể tích…) và không phụ thuộc vào dạng thức của miền đó.
Nếu độ đo hình học của toàn bộ miền cho trước là S, còn độ đo hình học của một phần A nào đó của nó là SA thì xác suất để điểm ngẫu nhiên rơi vào A sẽ bằng: SA PS = (1.3)
trong đó: A 0 S, S . < < +∞
Ví dụ 1.10. Giả sử hai người X và Y hẹn gặp nhau trong khoảng thời gian là 60 phút, với điều kiện người tới trước sẽ đợi người tới sau tối đa 15 phút, sau đó đi khỏi. Tính xác suất để X và Y gặp nhau.
Giải. Gọi x là thời gian đến của X, y là thời gian đến của Y. Khi đó không gian các biến cố sơ cấp sinh ra khi X và Y tới gặp nhau có dạng:
{( ) } 2 Ω = ∈ ≤ ≤ ≤ ≤ x, y : 0 x 60,0 y 60
Gọi A là biến cố hai người gặp nhau, khi đó
{( ) } 2 A x, y : x y 15 = ∈ − ≤
Hình 1.4. Hình vẽ minh họa biến cố hai người gặp nhau.
15
Theo công thức xác suất hình học (1.3), ta có
( ) 60 60 45 45 7 P C .
⋅ − ⋅ = = ⋅
60 60 16
1.2.5. Định nghĩa tiên đề về xác suất
Vào những năm 30 của thế kỷ 20, nhà Toán học người Nga là Kolmogorov đã xây dựng hệ tiên đề làm cơ sở cho việc định nghĩa một cách hoàn chỉnh khái niệm xác suất về mặt lý thuyết. Hệ tiên đề được xây dựng trên cơ sở khái niệm về không gian biến cố sơ cấp w , w ,...,w 1 2 n , thực tế là tập hợp tất cả các trường hợp có thể xảy ra của một phép thử. Lúc đó mỗi biến cố A có thể quan niệm như một tập hợp của không gian đó.
Tiên đề 1. Với mọi biến cố A đều có 0 P A 1. ≤ ≤ ( )
Tiên đề 2. Nếu w ,w ,..., w 1 2 n tạo nên không gian các biến cố sơ cấp thì: ( ) ( ) ( ) P w P w P w 1. 1 2 n + + + =
Tiên đề 3. Nếu các biến cố A ,A ,...,A ,... 1 2 n là các tập hợp con không giao nhau của các biến cố sơ cấp thì:
∞ ∞
⎛ ⎞ ⎜ ⎟ =
⎝ ⎠ ∑ ∑
i i ( )
P A P A .
i 1 i 1
= =
Tiên đề 4. Với A, B là hai biến cố bất kỳ, ta có
P A B P(A) P(B) P(AB) ( + = + − ) .
Tiên đề 5. Với hai biến cố A và A, ta có
P A 1 P A . ( ) = − ( )
1.2.6. Nguyên lý xác suất nhỏ và xác suất lớn
Trong nhiều bài toán thực tế, ta thường gặp các biến cố có xác suất rất nhỏ, gần bằng 0. Qua nhiều lần quan sát, người ta thấy rằng: các biến cố có xác suất nhỏ gần như không xảy ra khi thực hiện phép thử. Trên cơ sở đó có thể đưa ra “Nguyên lý không thực tế không thể có của các biến cố có xác suất nhỏ” sau đây: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử, biến cố đó sẽ không xảy ra.
Việc quy định một mức xác suất được coi là “rất nhỏ” tuỳ thuộc vào từng bài toán cụ thể. Chẳng hạn: Nếu xác suất để một loại dù không mở khi nhảy dù là 0,01 thì mức xác suất này chưa thể coi là nhỏ và ta không nên sử dụng loại dù đó. Song nếu xác suất để một chuyến tàu đến ga chậm 10 phút là 0,01 thì ta có thể coi mức xác suất đó là nhỏ, tức là có thể cho rằng xe lửa đến ga đúng giờ.
16
Một mức xác suất nhỏ mà với nó ta có thể cho rằng: biến cố đang xét không xảy ra trong một phép thử được gọi là mức ý nghĩa. Tuỳ theo từng bài toán cụ thể, mức ý nghĩa thường được lấy trong khoảng từ 0,01 đến 0,05.
Tương tự như vậy ta có thể nêu ra “Nguyên lý thực tế chắc chắn xảy ra của các biến cố có xác suất lớn” như sau: Nếu một biến cố có xác suất gần bằng 1 thì thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử.
Cũng như trên, việc quy định mức xác suất được coi là lớn hay nhỏ tuỳ thuộc vào bài toán cụ thể. Thông thường người ta lấy trong khoảng từ 0,95 đến 0,99. 1.3. Xác suất có điều kiện
Xét ví dụ sau: “Tung hai con xúc xắc” với không gian mẫu là
Ω = {(1,1 , 1,2 ,..., 1,6 , 2,1 , 2,2 ,..., 5,6 , 6,6 ) ( ) ( ) ( ) ( ) ( ) ( )}
(tổng cộng có 36 khả năng (phần tử)) và xét các biến cố
A: “tổng số nút xuất hiện cộng lại bằng 6”,
B: “số nút của xúc xắc thứ nhất là số lẻ”.
Ta có:
A 1,5 , 2,4 , 3,3 , 4,2 , 5,1 = {( ) ( ) ( ) ( ) ( )},
B 1,1 ,..., 1,6 , 3,1 ,..., 3,6 , 5,1 ,..., 5,6 = {( ) ( ) ( ) ( ) ( ) ( )},
nên từ định nghĩa cổ điển,
( ) A 5 P A36 = = Ωvà ( ) B 18 P B 0,5. 36 = = = Ω
Bây giờ, ta tung hai con xúc xắc và giả sử ta nhận được thông tin thêm là số nút của xúc xắc thứ nhất đã là số lẻ (nghĩa là biến cố B đã xảy ra). Khi đó, phép thử trên trở thành phép thử: “tung hai con xúc xắc khác nhau với số nút của xúc xắc thứ nhất là số lẻ”. Do đó, không gian mẫu Ω bị thu hẹp lại là
{( ) ( ) ( ) ( ) ( ) ( )} / Ω = 1,1 ,..., 1,6 , 3,1 , ..., 3,6 , 5,1 ,..., 5,6
và hiện tượng biến cố A xảy ra khi biết biến cố B đã xảy ra trở thành hiện tượng biến cố {( ) ( ) ( )} / A 1,5 , 3,3 , 5,1 AB = =
xảy ra đối với phép thử τ′ và do đó có xác suất là
/
A 3 1 P A18 6 = = = Ω .
/
( )
/
17
Ta ký hiệu / A A B = và ( ) ( ) / P A P A B = được gọi là xác suất để biến cố A xảy ra khi biết biến cố B xảy ra. Từ nhận xét
( ) ( )
1 P AB
P A B .
6 P B = =
( )
1.3.1. Định nghĩa
Xét biến cố B với P B 0. ( ) > Xác suất của biến cố A, khi biết biến cố B xảy ra là ( ) ( )
P AB
P B = (1.4)
P A B .
( )
Ví dụ 1.11. Trong một bình có 5 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên lần lượt 2 quả cầu theo phương thức không hoàn lại.
Giải
Gọi Ai là biến cố “nhận được quả cầu trắng lần thứ i”, i = 1, 2.
Theo định nghĩa xác suất cổ điển, xác suất để lần thứ nhất lấy được cầu trắng là: ( 1 ) 5 P A = 8
Nếu lần thứ nhất lấy được quả cầu trắng (tức là biến cố A1 đã xảy ra) thì trong bình còn lại 7 quả cầu, trong đó có 4 quả cầu trắng. Vậy xác suất để lần thứ hai lấy được cầu trắng với điều kiện lần thứ nhất đã lấy được cầu trắng là:
( 2 1 ) 4 P A A .7 =
Nếu lần thứ nhất lấy được quả cầu đen (tức là biến cố A1 đã xảy ra) thì trong bình còn lại 7 quả cầu, trong đó có 5 quả cầu trắng. Vậy xác suất để lần thứ hai lấy được cầu trắng với điều kiện lần thứ nhất đã lấy được cầu đen là:
( 2 1 ) 5 P A A .7 =
1.3.2. Công thức nhân xác suất
Với hai biến cố A và B bất kỳ, ta có
P AB P A P B A . ( ) = ( ) ( ) (1.5)
Tổng quát, với n biến cố bất kỳ A ,A ,...,A , 1 2 n ta có
P A A ...A P A P A A P A A A P A A A ...A . ( 1 2 n 1 2 1 3 1 2 n 1 2 n 1 ) = ⋅⋅⋅ ( ) ( ) ( ) ( − ) (1.6)
18
Ví dụ 1.12. Một thủ quỹ có một chùm chìa khóa gồm 9 chiếc chìa giống hệt nhau trong đó chỉ có 2 chìa có thể mở được tủ sắt. Anh ta thử ngẫu nhiên từng chìa (chìa không trúng được bỏ ra trong lần thử kế tiếp). Tìm xác suất để anh ta mở được tủ vào đúng lần thứ ba.
Giải
Đặt Ai là biến cố “lần thứ i, mở được tủ”. Với quy ước rằng khi biến cố Ai xảy ra thì các biến cố A ,A ,...,A 1 2 i 1− vẫn có thể đã xảy ra, biến cố “mở được tủ vào đúng lần thứ ba” là A A A 1 2 3 và do quy tắc nhân xác suất, ta có
P A A A P A P A A P A A A ( 1 2 3 1 2 1 3 1 2 ) = ( ) ( ) ( ).
Do
( 1 1 ) ( ) 2 7 P A 1 P A 1 , 9 9 = − = − =
( 2 1 2 1 ) ( ) 2 6 P A A 1 P A A 1 , 8 8 = − = − =
( 3 1 2 ) 2 P A A A , 7 =
ta suy ra:
( 1 2 3 ) 7 6 2 1 P A A A .
9 8 7 6 = ⋅ ⋅ =
1.3.3. Công thức xác suất đầy đủ (công thức xác suất toàn phần) Với hai biến cố A, B bất kỳ, ta có
P A P B P A B P B P A B ( ) = + ( ) ( ) ( ) ( ). (1.7) Tổng quát, cho B ,B ,...,B 1 2 n là họ đầy đủ các biến cố và với mọi biến cố A, ta có P A P B P A B P B P A B P B P A B . ( ) = + + + ( 1 1 2 2 n n ) ( ) ( ) ( ) ( ) ( ) (1.8) hay
( ) ( ) ( ) ni i
P A P B P A B . = ∑ (1.9) i=1
Chứng minh
Do BA và BA là hai biến cố xung khắc và A BA BA = + nên
( ) ( ) ( ) ( )
P A P BA BA P BA P BA
= + = +
( ) ( ) ( ) ( )
= +
P B P A B P B P A B .
19
Tổng quát, do các biến cố B A, B A,...,B A 1 2 n xung khắc từng đôi một và A B A B A B A = + + 1 2 n nên do công thức cộng xác suất:
( ) ( ) ( ) ( ) ( )
P A P B A B A B A P B A P B A P B A
= + + = + +
1 2 n 1 2 n
( ) ( ) ( ) ( ) ( ) ( )
= P B P A B P B P A B P B P A B
+ + +
1 1 2 2 n n
n
= ∑ i=1
( ) ( )
P B P A B . i i
và do công thức nhân xác suất,
P B A P B P A B ( i i i ) = ( ) ( )
với mọi i, ta suy ra
( ) ( ) ( ) ni i
P A P B P A B . = ∑
i=1
Ví dụ 1.13. Có 2 xạ thủ loại I và 8 xạ thủ loại II, xác suất bắn trúng đích của các loại xạ thủ loại I là 0,9 và loại II là 0,7.
a) Chọn ngẫu nhiên ra một xạ thủ và xạ thủ đó bắn một viên đạn. Tìm xác suất để viên đạn đó trúng đích.
b) Chọn ngẫu nhiên ra hai xạ thủ và mỗi người bắn một viên đạn. Tìm xác suất để cả hai viên đạn đó trúng đích.
Giải
a) Gọi A là biến cố “Viên đạn trúng đích”.
B1 là biến cố “Chọn xạ thủ loại I bắn”.
B2 là biến cố “Chọn xạ thủ loại II bắn”.
( 1 ) 2 P B 0,2 10
= = , P A B 0,9 ( 1 ) =
( 2 ) 8 P B 0,8 10
= = , P A B 0,7 ( 2 ) =
Ta có B , B 1 2 tạo thành họ đầy đủ các biến cố. Áp dụng công thức (1.8), ta có: P A = P B P A B + P B P A B 0,2 0,9 0,8 0,7 0,74. ( ) ( 1 1 2 2 ) ( ) ( ) ( ) = ⋅ + ⋅ = b) Gọi B là biến cố “Cả 2 viên đạn trúng đích”.
( ) B , i 1,2 i = là biến cố “Chọn được i xạ thủ loại I ”.
2
C 28 P B ; P B B 0,7.0,7 0,49 C 45 = = = =
8
( ) ( )
0 0 2
10
20
1 1
C .C 16 P B ; P B B 0,9.0,7 0,63 C 45 = = = =
2 8
( ) ( )
1 1 2
10
2
C 1 P B ; P B B 0,9.0,9 0,81. C 45 = = = =
( ) ( )
2
2 2 2
10
Ta có B , B , B 1 2 3 tạo thành họ đầy đủ các biến cố. Áp dụng công thức(1.9), ta có P B = P B P B B P B P B B P B P B B ( ) ( 0 0 1 1 2 2 ) ( ) ( ) ( ) ( ) ( )
⋅ + ⋅ + ⋅
28 16 1 0,49 0,63 0,81 0,5469. 45 45 45
= ⋅ + ⋅ + =
1.3.4. Công thức Bayes
Cho B ,B ,...,B 1 2 n là họ đầy đủ các biến cố và xét biến cố A với P A 0. ( ) > Với mỗi k 1,2,...,n, = ta có
( ) ( ) ( )
⋅ =
P B P A B
k k
P B A . k n
(1.10)
∑
i=1
Chứng minh
( ) ( )
P B P A B i i
Áp dụng công thức nhân xác suất
P A P B A P AB P B A P B P A B ( ) ( k k k k k ) = = = ( ) ( ) ( ) ( )
và công thức xác suất toàn phần
( ) ( ) ( ) ni i
P A P B P A B = ∑ ,
i=1
ta suy ra
( ) ( ) ( )
( ) ( )
⋅ ⋅ = =
P B P A B P B P A B
k k k k
P B A . k n
( )
P A P B P A B
∑ i=1
( ) ( ) i i
Ví dụ 1.14. Tỷ lệ chính phẩm của máy thứ nhất là 99%, của máy thứ hai là 98%. Một lô sản phẩm gồm 40% sản phẩm của máy thứ nhất và 60% sản phẩm của máy thứ hai. Người ta lấy ngẫu nhiên ra một sản phẩm để kiểm tra thấy là sản phẩm tốt. Tìm xác suất để sản phẩm đó do máy thứ nhất sản xuất.
Giải
Gọi A là biến cố “Sản phẩm kiểm tra là sản phẩm tốt”
B1 là biến cố “Sản phẩm do máy thứ nhất sản xuất”.
21
B2 là biến cố “Sản phẩm do máy thứ hai sản xuất”.
( ) ( ) P B 40% 0,4; P B 60% 0,6 1 2 = = = =
P A B 99% 0,99; P A B 98% 0,98 ( 1 2 ) = = = = ( )
Do B ,B1 2 là họ đầy đầy đủ các biến cố. Áp dụng công thức (1.10), ta có ( ) ( ) ( )
P B P A B
1 1
P B AP B P A B +P B P A B
1
=
( ) ( ) ( ) ( ) 1 1 2 2
⋅ = = ⋅ + ⋅
0,4 0,99 0,4. 0,4 0,99 0,6 0,98
1.3.5. Sự độc lập của các biến cố
Hai biến cố A, B được gọi là độc lập nếu xác suất để biến cố này xảy ra không phụ thuộc vào việc biến cố kia xảy ra, nghĩa là
P A B P A ( ) = ( )
và do đó
P AB P A P B . ( ) = ( ) ( ) (1.11) Tổng quát, n biến cố A , A ,...,A 1 2 n được gọi là độc lập nếu mỗi biến cố A ,i với i 1,2,...,n = , độc lập với tích bất kỳ các biến cố còn lại.
Do định nghĩa, nếu ba biến cố A, B, C là độc lập thì A độc lập với B, C và BC nên P AB P A P B , ( ) = ( ) ( )
P AC P A P C , ( ) = ( ) ( )
P A BC P A P BC , ⎡ ⎤ = ( ) ( ) ( ) ⎣ ⎦
và vì B, C cũng độc lập với nhau, nên
P BC P B P C , ( ) = ( ) ( )
và do đó
P ABC P A P B P C . ( ) = ( ) ( ) ( ) (1.12)
Chú ý. Nếu A và B là biến cố độc lập thì A và B; A và B; A và B cũng độc lập. Ví dụ 1.15. Trong một bình có 5 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên lần lượt 2 quả cầu. Tính xác suất để lấy được 2 quả cầu trắng trong hai trường hợp sau: a) Lấy hoàn lại.
b) Lấy không hoàn lại.
Giải.
22
Gọi A là biến cố “Lấy được 2 quả cầu trắng”.
Ai là biến cố “Lần thứ i lấy được cầu trắng”, i = 1, 2.
Suy ra biến cố lấy được hai của cầu trắng là: A .A1 2
( ) ( ) P A P A .A = 1 2
a) Nếu lấy 2 quả cầu theo phương thức lần lượt có hoàn lại thì hai biến cố A1 và A2 là độc lập với nhau. Theo công thức (1.5), ta có
( ) ( 1 2 1 2 ) ( ) ( ) 5 5 25 P A P A .A P A P A .
8 8 64 = = ⋅ = ⋅ =
b) Nếu lấy 2 quả cầu theo phương thức lần lượt không hoàn lại thì hai biến cố A1 và A2 là phụ thuộc với nhau. Theo công thức (1.5), ta có
( ) ( 1 2 1 2 1 ) ( ) ( ) 5 4 5 P A P A .A P A P A A .
8 7 14 = = ⋅ = ⋅ =
Ví dụ 1.16. Tung một đồng xu 3 lần. Tìm xác suất để 3 lần đều được mặt sấp. Gọi ( ) A , i 1,2,3 i = là biến cố “nhận được mặt sấp lần tung thứ i”,
Ta có
( i) 1 P A2 =
A là biến cố “Tung 3 lần đều được mặt sấp”.
A A A A = 1 2 3
Các biến cố A , A , A 1 2 3 là độc lập toàn phần. Theo công thức (1.12), ta có ( ) ( 1 2 3 1 2 3 ) ( ) ( ) ( ) 1 1 1 1 P A P A A A P A P A P A .
2 2 2 8 = = ⋅ ⋅ = ⋅ ⋅ =
1.4. Công thức Bernoulli
Trong nhiều bài toán thực tế ta thường gặp trường hợp cùng một phép thử được lặp lại nhiều lần. Trong kết quả của mỗi phép thử có thể xảy ra hoặc không xảy ra một biến cố A nào đó và ta không quan tâm đến kết quả của từng phép thử mà quan tâm đến tổng số lần xảy ra của biến cố A trong cả dãy phép thử đó. Chẳng hạn, nếu tiến hành sản xuất hàng loạt một loại chi tiết nào đó thì ta thường quan tâm đến tổng số chi tiết đạt chuẩn của cả quá trình sản xuất. Trong những bài toán như vậy cần phải biết cách xác định xác suất để biến cố A xảy ra một số lần nhất định trong kết quả của cả một dãy phép thử. Bài toán này sẽ được giải quyết khá dễ dàng nếu các phép thử là độc lập với nhau.
23
Các phép thử được gọi là độc lập với nhau nếu xác suất xảy ra một biến cố nào đó trong từng phép thử sẽ không phụ thuộc vào biến cố đó có xảy ra ở các phép thử khác hay không. Chẳng hạn, tung nhiều lần một đồng xu sẽ tạo nên các phép thử độc lập, lấy nhiều lần sản phẩm từ một lô sản phẩm theo phương thức hoàn lại cũng tạo nên các phép thử độc lập v.v…
Giả sử ta thực hiện n phép thử độc lập. Trong mỗi phép thử chỉ có hai trường hợp: hoặc biến cố A xảy ra, hoặc biến cố A không xảy ra. Xác suất xảy ra của biến cố A trong mỗi phép thử đều bằng p và xác suất không xảy ra của biến cố A trong mỗi phép thử đều bằng q 1 p = − . Những bài toán thỏa mãn cả ba giả thiết được gọi là tuân theo lược đồ Bernoulli. Khi đó xác suất để trong n phép thử độc lập biến cố A xuất hiện đúng k lần, ký hiệu P k n ( ) , được tính bằng công thức Bernoulli:
( ) k k n k P k = C p q , k = 0, 1, 2,...,n. n n− (1.13)
Đặt H : k “biến cố A xảy ra đúng k lần”, với 0 k n. ≤ ≤ Ta có
( ) ( ) ( ) k k n k P H =P k = C p 1 p . k n n− −
Chứng minh
Dùng quy nạp trên n. Hiển nhiên công thức đúng với n 1 = vì khi đó H A 0 = và H A. 1 = Do đó
( ) ( ) 0 0 1 0 P H = C p 1 p 1 p 0 1− − = −
và
( ) ( ) 1 1 1 1 P H = C p 1 p p 1 1− − = .
Giả sử công thức đúng với n 1, ≥ nghĩa là khi thực hiện n lần phép thử τ một cách độc lập thì xác suất để biến cố A xảy ra đúng k lần là
( ) ( ) k k n k P H = C p 1 p . k n− −
Bây giờ, thực hiện phép thử τ thêm một lần nữa một cách độc lập và gọi X là biến cố: “A xảy ra trong lần thử thứ n 1+ ” thì biến cố: “A xảy ra đúng k lần trong n 1+ phép thử” là
H A H A. k k 1 + −
Do các biến cố H Ak và H A k 1− là xung khắc, Hk và A cũng như Hk 1− và A là các biến cố độc lập nên
24
( ) ( ) ( )
P H A H A P H A P H A
+ = +
k k 1 k k 1
− −
( ) ( ) ( ) ( )
= +
P H P A P H P A
k k 1
−
k k k 1 k 1 n k n k 1
− − + − −
( ) ( ) ( )
= − − + −
C p 1 p 1 p C p 1 p p
n n
k k k 1 k n k 1 n k 1
− + − + −
( ) ( )
= − + −
C p 1 p C p 1 p
n n
k k 1 k n k 1
− − +
( ) ( )
= + −
C C p 1 p
n n
k k (n+1) k
( )
= −
−
C p 1 p .
n 1
+
Ví dụ 1.17. Xác suất chữa khỏi bệnh A của một phương pháp điều trị là 95%. Với 10 người bị bệnh A được điều trị bằng phương pháp này, tính xác suất để a) có 8 người khỏi bệnh.
b) có nhiều nhất 9 người khỏi bệnh.
Giải
Do việc khỏi bệnh của người này và người khác là độc lập nhau nên số người khỏi bệnh trong 10 người điều trị thỏa lược đồ Bernoulli với n 10 = và p 0,95 = . Theo công thức (1.13). Ta có
( ) ( ) k k 10 k P H = C 0,05 0,95 k 10−
a) Xác suất để có 8 người khỏi bệnh là ( ) ( ) ( ) 8 8 10 8 P H = C 0,05 0,95 0,0746 8 10− = . b) Biến cố: “có nhiều nhất 9 người khỏi bệnh” là biến cố đối của biến cố : “có 10 người khỏi bệnh” nên có xác suất là
( ) ( ) ( ) 10 10 10 10 P H = 1 C 0,05 0,95 0,4013. k 9 10−
≤ − =
1.5. Tóm tắt chương 1
1. Xác suất của biết cố A:
( ) A
P A = Ω
( A và Ω lần lượt là số khả năng thuận lợi cho A và Ω ).
2. Tính chất:
i) 0 P A 1. ≤ ≤ ( )
ii) P A 1 P A . ( ) = − ( )
3. Công thức cộng:
i) Nếu A ,A ,...,A 1 2 n xung khắc với nhau từng đôi một thì
25
( ) ( ) ( ) ( ) P A A A P A P A P A . 1 2 2 1 2 2 + + + = + + + ii) Với A và B là hai biết cố bất kỳ
P A B P A P B P AB . ( + = + − ) ( ) ( ) ( )
4. Công thức xác suất có điều kiện:
( ) ( )
( ) ( ) P AB
P A B , P B 0. P B
= >
5. Công thức nhân:
i) Nếu A ,A ,...,A 1 2 n bất kỳ thì
P A A ...A P A P A A P A A A ....A . ( 1 2 n 1 2 1 n 1 2 n 1 ) = ( ) ( ) ( − ) ii) Nếu A ,A ,...,A 1 2 n độc lập với nhau từng đôi một thì ( ) ( ) ( ) ( ) P A A A P A P A P A . 1 2 2 1 2 n =
6. Công thức đầy đủ (toàn phần) và công thức Bayes: Với B ,B ,...,B 1 2 n là họ đầy đủ các biến cố và với mọi biến cố A, ta có i) Công thức đầy đủ
( ) ( ) ( ) ni i
P A P B P A B . = ∑
i=1
ii) Công thức Bayes
( ) ( ) ( )
⋅ = =
P B P A B
k k
P B A , k 1,2,...,n.
k n
∑
i=1
7. Công thức Bernoulli:
( ) ( )
P B P A B i i
Đặt H : k “biến cố A xảy ra đúng k lần”, với 0 k n,0 p 1. ≤ ≤ < < Ta có ( ) ( ) ( ) k k n k P H =P k = C p 1 p . k n n− −
1.6. Bài tập
Biểu diễn các biến cố
Bài số 1. Kiểm tra 3 sản phẩm. Gọi Ak là biến cố sản phẩm thứ k tốt. Hãy trình bày các cách biểu diễn qua Ak và qua giản đồ Venn các biến cố sau đây:
A: tất cả đều xấu,
B: có ít nhất một sản phẩm xấu,
C: có ít nhất một sản phẩm tốt,
26
D: không phải tất cả sản phẩm đều tốt,
E: có đúng một sản phẩm xấu,
F: có ít nhất 2 sản phẩm tốt.
Bài số 2. Ba người, mỗi người bắn một phát. Gọi Ai là biến cố thứ i bắn trúng. Hãy biểu diễn qua Ai các biến cố sau :
A: chỉ có người thứ nhất bắn trúng,
B: người thứ nhất bắn trúng và người thứ hai bắn trật,
C: cả 3 người đều bắn trúng,
D: có ít nhất 2 người bắn trúng,
E: chỉ có 2 người bắn trúng,
F: không ai bắn trúng,
G: không có hơn 2 người bắn trúng,
H: người thứ nhất bắn trúng, hoặc người thứ hai và người thứ ba cùng bắn trúng, I: người thứ nhất bắn trúng hay người thứ hai bắn trúng,
K: có ít nhất 1 người bắn trúng.
Bài số 3. Ba sinh viên A, B, C cùng thi môn xác suất thống kê. Xét các biến cố: A: sinh viên A đậu,
B: sinh viên B đậu,
C: sinh viên C đậu.
Hãy biểu diễn qua A, B, C các biến cố sau:
a) chỉ có A đậu,
b) A đậu và B rớt,
c) có ít nhất một người đậu,
d) cả 3 cùng đậu,
e) có ít nhất 2 người đậu,
f) chỉ có 2 người đậu,
g) không ai đậu,
h) không có quá 2 người đậu.
Bài số 4. Quan sát 4 sinh viên làm bài thi. Kí hiệu B (j 1,2,3,4) j = là biến cố sinh viên j làm bài thi đạt yêu cầu. Hãy viết các biến cố sau đây
a) Có đúng một sinh viên đạt yêu cầu,
b) có đúng 3 sinh viên đạt yêu cầu,
27
c) có ít nhất 1 sinh viên đạt yêu cầu,
d) không có sinh viên nào đạt yêu cầu.
Định nghĩa xác suất, xác suất có điều kiện, công thức cộng, công thức nhân Bài số 5. Thống kê 2000 sinh viên một khóa của trường đại học theo giới tính và ngành học thu được các số liệu sau:
Nam Nữ
Học tài chính ngân hàng 400 500
Học quản trị kinh doanh 800 300
Lấy ngẫu nhiên một sinh viên khóa đó. Tìm xác suất để nhận được:
a) Sinh viên là Nam.
b) Sinh viên học tài chính ngân hàng.
c) Sinh viên nam và tài chính ngân hàng.
d) Hoặc sinh viên nam, hoặc học tài chính ngân hàng.
e) Nếu đã chọn được một sinh viên nam thì xác suất để người đó học tài chính ngân hàng bằng bao nhiêu?
Đáp số: a) 0,6; b) 0,45; c) 0,2; d) 0,85; e) 1/3.
Bài số 6. Một công ty liên doanh cần tuyển một kế toán trưởng, một trưởng phòng tiếp thị, có 40 người dự tuyển trong đó có 15 nữ. Tính xác suất trong 2 người được tuyển có: a) kế toán trưởng là nữ,
b) ít nhất 1 nữ.
Đáp số: a) 0,375;b) 0,6154.
Bài số 7. Một lô hàng có 10 sản phẩm, trong đó có 7 sản phẩm tốt, 3 sản phẩm xấu. Lấy ngẫu nhiên từ lô hàng ra 4 sản phẩm. Tính xác suất để 4 sản phẩm lấy ra có 3 sản phẩm tốt. Đáp số: 0,5.
Bài số 8. Một lớp học có 50 học sinh trong kỳ thi giỏi Toán và Văn, trong đó có 20 người giỏi Toán, 25 người giỏi Văn, 10 người giỏi cả Toán lẫn Văn. Chọn ngẫu nhiên 1 học sinh của lớp này. Tính xác suất để học sinh được chọn giỏi Toán hoặc Văn. Đáp số: 0,7.
Bài số 9. Trong 1 khu phố, tỷ lệ người mắc bệnh tim là 6%; mắc bệnh phổi là 8% và mắc cả hai bệnh là 5%. Chọn ngẫu nhiên 1 người trong khu phố đó. Tính xác suất để người đó không mắc cả 2 bệnh tim và bệnh phổi.
Đáp số: 0,91.
28
Bài số 10. Trong 100 người phỏng vấn có 40 người thích dùng nước hoa A, 28 người thích dùng nước hoa B, 10 người thích dùng cả 2 loại A, B. Chọn ngẫu nhiên 1 người trong số 100 người trên. Tính xác suất người này :
a) thích dùng ít nhất 1 loại nước hoa trên,
b) không dùng loại nào cả.
Đáp số: a) 0,58; b) 0,42.
Bài số 11. Một cơ quan có 210 người, trong đó có 100 người ở gần cơ quan, 60 người trong 100 người gần cơ quan là nữ, biết rằng số nữ chiếm gấp đôi số nam trong cơ quan. Chọn ngẫu nhiên 1 người trong cơ quan. Tính xác suất :
a) người này là nam,
b) người này ở gần cơ quan,
c) người này phải trực đêm (người trực đêm phải ở gần cơ quan hoặc là nam). Đáp số: a) 1/3; b) 0,4762; c) 0,619.
Bài số 12. Cho A và B là 2 biến cố sao cho ( ) ( ) ( ) 1 1 1 P A , P B , P AB 2 3 6 = = = . Hãy tính: 1) P A B ( + ) 2) P A B ( + ) 3) P A B ( + )
4) P AB ( ) 5) P AB ( ) 6) P AB ( )
7) P A B ( + ) 8) P A B ( ) 9) P A B ( )
10) P AB B ( ) 11) P AB B ( ) 12) P AB B ( )
Bài số 13. Đội tuyển cầu lông của Trường Đại học Tài chính - Marketing có 3 vận động viên, mỗi vận động viên thi đấu một trận. Xác suất thắng trận của các vận viên A, B, C lần lượt là: 0,9; 0,7; 0,8. Tính xác suất :
a) Đội tuyển thắng ít nhất 1 trận,
b) Đội tuyển thắng 2 trận,
c) C thua, biết rằng đội tuyển thắng 2 trận.
Đáp số: a) 0,994; b) 0,398; c) 0,3166.
Bài số 14. Cho 3 biến cố A, B, C sao cho
P(A) = 0,5; P(B) = 0,7; P(C) = 0,6; P(AB) = 0,3; P(BC) = 0,4; P(AC) = 0,2 và P(ABC) = 0,1.
a) Tìm xác suất để cả 3 biến cố A, B, C đều không xảy ra.
b) Tìm xác suất để có đúng 2 trong 3 biến cố đó xảy ra.
29
c) Tìm xác suất để chỉ có đúng 1 biến cố trong 3 biến cố đó xảy ra.
Đáp số: a) 0; b) 0,6; c) 0,3.
Bài số 15. Một người có 5 con gà mái, 2 con gà trống nhốt chung trong một cái lồng. Một người đến mua, người bán gà bắt ngẫu nhiên 1 con. Người mua chấp nhận con đó. a) Tính xác suất để người đó mua được con gà mái.
Người thứ hai lại đến mua, người bán gà lại bắt ngẫu nhiên ra 1 con. b) Tìm xác suất để người thứ hai mua được con gà trống.
c) Xác suất này sẽ bằng bao nhiêu nếu người bán gà quên mất rằng con gà bán cho người thứ nhất là gà trống hay gà mái.
Đáp số: a) 5;7 b) 1;3 c) 2.7
Bài số 16. Hai công ty A, B cùng kinh doanh một mặt hàng. Xác suất để công ty A thua lỗ là 0,2; xác suất để công ty B thua lỗ là 0,4. Tuy nhiên trên thực tế, khả năng cả 2 công ty cùng thua lỗ là 0,1. Tìm xác suất để
a) chỉ có một công ty thua lỗ,
b) có ít nhất một công ty làm ăn không thua lỗ.
Đáp số: a) 0,4; b) 0,9.
Bài số 17. Một thủ quỹ có một chùm chìa khóa gồm 12 chiếc bề ngoài giống hệt nhau, trong đó có 4 chìa mở được cửa chính của thư viện. Cô ta thử từng chìa một một cách ngẫu nhiên, chìa nào không trúng thì bỏ ra. Tìm xác suất để cô ta mở được cửa chính của thư viện ở lần mở thứ 5.
Đáp số : 0,071.
Bài số 18. Một lô hàng có 6 sản phẩm tốt, 4 sản phẩm xấu. Lấy ngẫu nhiên không hoàn lại từng sản phẩm cho đến khi lấy được 2 sản phẩm tốt thì ngừng,
a) Tính xác suất để ngừng lại ở lần lấy sản phẩm thứ 2,
b) Biết đã ngừng lại ở lần lấy sản phẩm thứ 4. Tính xác suất để lần lấy thứ nhất lấy được sản phẩm tốt.
Đáp số a) 1;3 b) 1.3
Bài số 19. Một chàng trai viết 4 lá thư cho 4 cô gái; nhưng vì đãng trí nên anh ta bỏ 4 lá thư vào 4 phong bì một cách ngẫu nhiên, dán kín rồi mới ghi địa chỉ gửi, a) Tính xác suất để không có cô nào nhận đúng thư viết cho mình,
b) Tính xác suất để có ít nhất 1 cô nhận đúng thư của mình,
30
c) Tổng quát hóa với n cô gái. Tính xác suất có ít nhất 1 cô nhận đúng thư. Xấp xỉ giá trị xác suất này khi cho n . → ∞
Đáp số a) 0,625; b) 0,375; c) 1 e . −
Bài số 20. Trong 1 lô hàng 10 sản phẩm có 2 sản phẩm xấu, chọn không hoàn lại để phát hiện ra 2 sản phẩm xấu, khi nào chọn được sản phẩm xấu thứ 2 thì dừng lại. a) Tính xác suất dừng lại ở lần chọn thứ 4.
b) Biết rằng đã chọn được sản phẩm xấu ở lần chọn thứ nhất, tính xác suất dừng lại ở lần chọn thứ 4.
c) Nếu việc kiểm tra dừng lại ở lần chọn thứ 3, tính xác suất lần chọn đầu được sản phẩm xấu.
Đáp số : a) 1; 15 b) 1;9 c) 1 .2
Bài số 21. Đội tuyển bóng bàn Thành phố có 4 vận động viên A, B, C, D . Mỗi vận động viên thi đấu 1 trận, với xác suất thắng trận lần lượt la : 0,6, 0,7, 0,8, 0,9. Tính a) xác suất đội tuyển thắng ít nhất 1 trận,
b) xác suất đội tuyển thắng 2 trận,
c) xác suất đội tuyển thắng 3 trận,
d) xác suất D thua, trong trường hợp đội tuyển thắng 3 trận.
Đáp số: a) 0,9976; b) 0,2144; c) 0,4404; d) 0,763.
Bài số 22. Ở một cơ quan nọ có 3 chiếc ôtô. Khả năng có sự cố của mỗi xe ôtô lần lượt là 0,15 ; 0,20 ; 0,10.
a) Tìm khả năng 3 ôtô cùng bị hỏng.
b) Tìm khả năng có ít nhất 1 ôtô hoạt động tốt.
c) Tìm khả năng cả 3 ôtô cùng hoạt động được.
d) Tìm xác suất có không quá 2 ôtô bị hỏng.
Công thức xác suất đầy đủ và công thức Bayes
Đáp số: a) 0,003; b) 0,997; c) 0,612; d) 0,997.
Bài số 23. Một nhà máy sản xuất bóng đèn, máy A sản xuất 25%, máy B: 35%, máy C: 40% số bóng đèn. Tỉ lệ sản phẩm hỏng của mỗi máy trên số sản phẩm do máy đó sản xuất lần lượt là 3%, 2%, 1%. Một người mua 1 bóng đèn do nhà máy sản xuất. a) Tính xác suất để sản phẩm này tốt.
b) Biết rằng sản phẩm này là xấu. Tính xác suất để sản phẩm do máy C sản xuất. Đáp số: a) 0,9815;b) 0,2162.
31
Bài số 24. Trong một trạm cấp cứu bỏng : 80% bệnh nhân bỏng do nóng, 20% bỏng do hóa chất. Loại bỏng do nóng có 30% bi biến chứng, loại bỏng do hóa chất có 50% bị biến chứng.
a) Chọn ngẫu nhiên một bệnh án. Tính xác suất để gặp một bệnh án của bệnh nhân bị biến chứng.
b) Rút ngẫu nhiên được một bệnh án của một bệnh nhân bị biến chứng. Tính xác suất để bệnh án đó là của bệnh nhân bị biến chứng do nóng gây ra? do hóa chất gây ra? Đáp số: a) 0,34; b) 0,7059; 0,2941.
Bài số 25. Một lô hạt giống được phân thành ba loại. Loại 1 chiếm 2/3 số hạt cả lô, loại 2 chiếm 1/4, còn lại là loại 3. Loại 1 có tỉ lệ nẩy mầm 80%, loại 2 có tỉ lệ nẩy mầm 60% và loại 3 có tỉ lệ nẩy mầm 40%. Hỏi tỉ lệ nẩy mầm chung của lô hạt giống là bao nhiêu? Đáp số: 0,72.
Bài số 26. Hai nhà máy cùng sản xuất 1 loại linh kiện điện tử. Năng suất nhà máy hai gấp 3 lần năng suất nhà máy một. Tỷ lệ hỏng của nhà máy một và hai lần lượt là 0,1% và 0,2%. Giả sử linh kiện bán ở Trung tâm chỉ do hai nhà máy này sản xuất. Mua 1 linh kiện ở Trung tâm.
a) Tính xác suất để linh kiện ấy hỏng.
b) Giả sử mua linh kiện và thấy linh kiện bị hỏng. Theo ý bạn thì linh kiện đó do nhà máy nào sản xuất.
Đáp số: a) 0,175%; b) nhà máy 2.
Bài số 27. Có 8 bình đựng bi, trong đó có :
2 bình loại 1: mỗi bình đựng 6 bi trắng 3 bi đỏ,
3 bình loại 2: mỗi bình đựng 5 bi trắng 4 bi đỏ,
3 bình loại 3: mỗi bình đựng 2 bi trắng 7 bi đỏ.
Lấy ngẫu nhiên một bình và từ bình đó lấy ngẫu nhiên 1 bi.
a) Tính xác suất để bi lấy ra là bi trắng.
b) Biết rằng bi lấy ra là bi trắng. Tính xác suất để bình lấy ra là bình loại 3. Đáp số: a) 0,4583; b) 0,182.
Bài số 28. Một chuồng gà có 9 con gà mái và 1 con gà trống. Chuồng gà kia có 1 con mái và 5 con trống. Từ mỗi chuồng lấy ngẫu nhiên 1 con đem bán. Các con gà còn lại được dồn vào chuồng thứ ba. Nếu ta lại bắt ngẫu nhiên 1 con gà nữa từ chuồng này ra thì xác suất để bắt được con gà trống là bao nhiêu?
Đáp số: 0,3619.
32
Bài số 29. Có 2 hộp áo; hộp một có 10 áo trong đó có 1 phế phẩm; hộp hai có 8 áo trong đó có 2 phế phẩm. Lấy ngẫu nhiên 1 áo từ hộp một bỏ sang hộp hai; sau đó từ hộp này chọn ngẫu nhiên ra 2 áo. Tìm xác suất để cả 2 áo này đều là phế phẩm. Đáp số: 1/30.
Bài số 30. Có 3 xạ thủ cùng bắn vào một con thú, mỗi người bắn 1 viên đạn, với xác suất bắn trúng lần lượt là 0,6; 0,7; 0,8. Biết rằng nếu trúng 1 phát đạn thì xác suất để con thú bị tiêu diệt là 0,5; trúng 2 phát thì xác suất để con thú bị tiêu diệt là 0,8; còn nếu trúng 3 phát đạn thì chắc chắn con thú bị tiêu diệt.
a) Tính xác suất con thú bị tiêu diệt.
b) Giả sử con thú bị tiêu diệt. Tính xác suất nó bị trúng 2 phát đạn.
Đáp số: a) 0,7916; b) 0,4568.
Bài số 31. Có 3 hộp bi; hộp một có 10 bi trong đó có 3 bi đỏ; hộp hai có 15 bi trong đó có 4 bi đỏ; hộp ba có 12 bi trong đó có 5 bi đỏ. Gieo một con xúc xắc. Nếu xuất hiện mặt 1 thì chọn hộp một, xuất hiện mặt hai thì chọn hộp 2, xuất hiện các mặt còn lại thì chọn hộp ba. Từ hộp được chọn, lấy ngẫu nhiên 1 bi
a) Tính xác suất để được bi đỏ,
b) Giả sử lấy được bi đỏ. Tính xác suất để bi đỏ này thuộc hộp hai.
Đáp số: a) 0,3722; b) 0,1194.
Bài số 32. Một hộp có 15 quả bóng bàn, trong đó có 9 mới 6 cũ, lần đầu chọn ra 3 quả để sử dụng, sau đó bỏ vào lại, lần hai chọn ra 3 quả.
a) Tính xác suất 3 quả bóng chọn lần hai là 3 bóng mới.
b) Biết rằng lần hai chọn được 3 bóng mới, tính xác suất lần đầu chọn được 2 bóng mới. Đáp số: a) 0,0893; b) 0,4089.
Bài số 33. Có 3 cái thùng. Thùng 1 có 6 bi trắng, 4 bi đỏ; thùng 2 có 5 bi trắng, 5 bi đỏ và thùng 3 có 10 bi trắng. Giả sử người ta lấy ngẫu nhiên 2 bi từ thùng 1 bỏ vào thùng 2. Sau đó, lại lấy ngẫu nhiên 1 bi từ thùng 2 bỏ vào thùng 3 rồi từ thùng 3 lấy ngẫu nhiên ra 1 bi. Tìm xác suất để bi lấy ra là đỏ.
Đáp số: 0,0439.
Công thức Bernoulli
Bài số 34. Một bác sĩ chữa khỏi bệnh A cho một người với xác suất là 95%. Giả sử có 10 người bị bệnh A đến chữa một cách độc lập nhau. Tính xác suất để
a) Có 8 người khỏi bệnh,
b) Có nhiều nhất 9 người khỏi bệnh.
33
Đáp số: a) 0,0746; b) 0,4013.
Bài số 35. Một thiết bị có 10 chi tiết với độ tin cậy của mỗi chi tiết là 0,9. (Xác suất làm việc tốt trong khoảng thời gian nào đó).
Tính xác suất để trong khoảng thời gian ấy :
a) Có đúng một chi tiết làm việc tốt,
b) Có ít nhất 2 chi tiết làm việc tốt.
Đáp số: a) 9 9 10 0; − ⋅ ≈ b) 1.
Bài số 36. Một cầu thủ đá thành công quả phạt 11m với xác suất 80%. - Đá 4 thành công 2.
- Đá 6 thành công 3.
Công việc nào dễ thực hiện ?
Đáp số: Đá 4 thành công 2 dễ hơn.
Bài số 37. Trong một thành phố có 70% dân cư thích xem bóng đá. Chọn ngẫu nhiên 10 người, tính xác suất có :
a) 5 người thích xem bóng đá,
b) ít nhất 2 người thích xem bóng đá.
Đáp số: a) 0,1029; b) 0,9999.
Bài số 38. Một nhà toán học có xác suất giải được một bài toán khó là 0,9. Cho nhà toán học này 5 bài toán khó được chọn một cách ngẫu nhiên.
a) Tính xác suất để nhà toán học này giải được 3 bài.
b) Tính xác suất để nhà toán học này giải được ít nhất 1 bài.
c) Tính số bài có khả năng nhất mà nhà toán học này giải được.
Đáp số: a) 0,0729; b) 0,99999; c) 5 bài.
Bài số 39. Tỷ lệ mắc bệnh Basedow ở một vùng rừng núi nào đó là 70%. Trong đợt khám tuyển sức khoẻ để xuất cảnh, người ta khám cho 100 người. Tìm xác suất để a) Trong 100 người có 60 người bị Basedow,
b) Trong 100 người có 75 người bị Basedow,
c) Trong 100 người có ít nhất một người bị Basedow.
Đáp số: a) 0,0085; b) 0,0496; c) 1.
Bài số 40. Một lô hàng với tỷ lệ phế phẩm là 5%. Cần phải lấy mẫu cỡ bao nhiêu sao cho xác suất để bị ít nhất một phế phẩm không bé hơn 0,95.
Đáp số: n 59. ≥
34
Bài số 41. Hai đấu thủ A, B thi đấu cờ. Xác suất thắng của người A trong một ván là 0,6 (không có hòa). Trận đấu bao gồm 5 ván, người nào thắng một số ván lớn hơn là người thắng cuộc. Tính xác suất để người B thắng cuộc.
Đáp số: 0,31744.
Bài số 42. Một máy sản xuất lần lượt từng sản phẩm. Xác suất sản xuất ra một phế phẩm của máy là 0,01.
a) Cho máy sản xuất 10 sản phẩm. Tính xác suất để có 2 phế phẩm.
b) Máy cần sản xuất ít nhất bao nhiêu sản phẩm để xác suất có ít nhất một chính phẩm trên 0,99.
Đáp số: a) 0,0042; b) 2.
Bài số 43. Một xí nghiệp có hai phân xưởng A và B cùng sản xuất một loại sản phẩm với tỉ lệ phế phẩm tương ứng là 2% và 3%. Cho mỗi phân xưởng sản xuất ra 5 sản phẩm. Tính xác suất để số phế phẩm do hai phân xưởng sản xuất là bằng nhau. Đáp số:0,7885.
1.7. Tài liệu tham khảo
[1] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ, Lý thuyết xác suất và thống kê toán, NXB Đại học Kinh tế Quốc dân, 2012.
[2] Nguyễn Cao Văn, Trần Thái Ninh, Nguyễn Thế Hệ, Bài tập xác suất và thống kê toán, NXB Đại học Kinh tế Quốc dân, 2012.
[3] Phạm Hoàng Uyên, Lê Thị Thiên Hương, Huỳnh Văn Sáu, Nguyễn Phúc Sơn, Huỳnh Tố Uyên, Lý thuyết xác suất, NXB Đại học Quốc gia Thành Phố Hồ Chí Minh, 2015.
[4] Anderson, Sweeney, and William [2010], Statistics for Business and Economics, South-Western Cengage Learning (11th Edition).
[5] Michael Barrow, Statistics for Economics, Accounting and Business Studies Prentice Hall, 2006.
[6] Newbold Paul - Statistics for Bussiness and Economics, 5th edition - Prentice Hall, 2005.
35
Thuật ngữ chính chương 1
Tiếng Anh Tiếng Việt
Axiom
Addition rule
Bayes’ formula
Countable additivity
Classical probability
Conditional probability
Define
Event
Element
Experiment
Experimental probability
Event A occurs
Independent
Infinite sequence of outcomes Monotonicity
Mutually exclusive events
Multiplication rule
Outcome
Odds in favor
Relative frequency
Probability
Posterior probability
Prior probability
Sample space
Subset
Sequence of mutually exclusive events The finite additivity of the probability The law of large numbers
The number of elements
Tiên đề
Công thức cộng
Công thức Bayes
Công thức cộng
Xác suất cổ điển
Xác suất có điều kiện
Định nghĩa
Biến cố
Phần tử
Phép thử
Xác suất thực nghiệm
Biến cố A xảy ra
Độc lập
Dãy vô hạn kết cục
Tính đơn điệu
Họ biến cố xung khắc
Công thức nhân
Kết cục
Tỷ lệ thuận lợi
Tần số tương đối
Xác suất
Xác suất hậu nghiệm
Xác suất tiên nghiệm
Không gian mẫu
Tập con
Một dãy các biến cố xung khắc từng đôi một Tính cộng hữu hạn của xác suất
Luật số lớn
Số lượng các phần tử
36
Chương 2 ĐẠI LƯỢNG NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
----------------------------------------------------------------------------------------------------------- Mục tiêu chương 2
Chương này giúp sinh viên:
- Phân biệt được thế nào là đại lượng ngẫu nhiên liên tục và đại lượng ngẫu nhiên rời rạc. - Thành lập được bảng phân phối xác suất và tính được các hàm xác suất, hàm phân phối. - Tính và nêu được ý nghĩa các tham số đặc trưng như trung bình, phương sai, mốt, trung vị,...
- Biết áp dụng các luật phân phối như: Nhị thức, Siêu bội, Poisson, Chuẩn, …. ----------------------------------------------------------------------------------------------------------- 2.1. Đại lượng ngẫu nhiên
2.1.1. Khái niệm
Xét phép thử τ với không gian mẫu Ω. Giả sử, ứng với mỗi biến số sơ cấp w , ∈Ω ta liên kết với một số thực X w , ( )∈ thì X được gọi là một biến số ngẫu nhiên. Ví dụ 2.1. Với trò chơi sấp ngửa bằng cách tung đồng xu, giả sử nếu xuất hiện mặt sấp, ta được 1 đồng; nếu xuất hiện mặt ngửa, ta mất 1 đồng. Khi đó, ta có Phép thử τ : “tung đồng xu”,
Không gian mẫu Ω = {S, N , }
Biến số ngẫu nhiên X với X S 1 ( ) = và X N 1. ( ) = −
Tổng quát, biến số ngẫu nhiên X của một phép thử τ với không gian mẫu Ω là một ánh xạ
X :
Ω →
( )
w X w
2.1.2. Phân loại
- Khi X(Ω) là một tập hợp hữu hạn {x , x ,..., x 1 2 k} hay là một dãy {x , x ,..., x ,... , 1 2 n } ta nói X là một biến số ngẫu nhiên rời rạc.
Ví dụ 2.2. Số chấm xuất hiện ở mặt trên của xúc xắc; số sinh viên vắng mặt trong một buổi học; số máy hỏng trong từng ca sản xuất,… là các biến ngẫu nhiên rời rạc.
37
- Khi X(Ω) là một khoảng của (hay cả ), ta nói X là một biến số ngẫu nhiên liên tục.
Ví dụ 2.3. Gọi X là kích thước của chi tiết do một máy sản xuất ra, X là biến ngẫu nhiên liên tục.
Do các biến số ngẫu nhiên X là các ánh xạ có giá trị trong nên với một hàm số u : , → ta có thể thành lập biến số ngẫu nhiên u X , ( ) với
( )
u X :
Ω →
( )
w u X w
⎡ ⎤ ⎣ ⎦
Chẳng hạn, với u x x , ( ) = − μ μ ∈ ta có biến số ngẫu nhiên u X X , ( ) = − μ với (X w X w . − μ = − μ )( ) ( ) với mọi w , ∈Ω và với ( ) ( )2
u x x , = − μ μ∈ ta có biến số
ngẫu nhiên ( ) ( )2 u X X , = − μ với ( ) ( ) ( ( ) ) 2 2 X w X w − μ = − μ với mọi w . ∈Ω 2.2. Phân phối xác suất của đại lượng ngẫu nhiên
2.2.1. Đại lượng ngẫu nhiên rời rạc
Để xác định một biến số ngẫu nhiên rời rạc, người ta cần xác định các giá trị i x , i 1,2,... = có thể nhận được bởi biến ngẫu nhiên này và đồng thời cũng cần xác định xác suất để X nhận giá trị này là bao nhiêu, nghĩa là, cần xác định
{ ( ) } ( ) P w : X w x P X x ∈Ω = ≡ = i i , với i 1,2,... =
2.2.1.1. Bảng phân phối xác suất
Xét biến số ngẫu nhiên rời rạc X : , Ω → với X x , x ,..., x ,... . (Ω =) { 1 2 n } Giả sử 1 2 n x x x < < < < . Ta lập bảng các giá trị tương ứng
X 1 x 2 x ... n x ...
P 1 p 2 p ... n p ...
với p P X x , i i = = ( ) được gọi là bảng phân phối xác suất của X.
Ví dụ 2.4. Trong hộp có 10 sản phẩm trong đó có 6 chính phẩm. Lấy ngẫu nhiên 2 sản phẩm. Lập bảng phân phối xác suất cho số chính phẩm được lấy ra.
Giải
Gọi X là số chính phẩm được lấy ra trong 3 sản phẩm, X 0,1,2 ∈{ }.
2
C 6 2 P X 0 = = , C 45 15 = =
( )
4
2
10
38
1 1
C .C 24 8 P X 1 = , C 45 15 = = =
( )
6 4 2
10
2
C 15 1 P X 2 = .
( )
6
C 45 3 = = =
2
10
Vậy bảng phân phối xác suất của X là:
X 0 1 2
P 2 15
8
15
1 3
Ví dụ 2.5. Một cơ quan có 3 xe ôtô : 1 xe 4 chỗ; 1 xe 50 chỗ và 1 xe tải. Xác suất để trong một ngày làm việc, các xe được xử dụng là 0,8; 0,4 và 0,9. Hãy lập bảng phân phối xác suất cho số xe được xử dụng trong một ngày của cơ quan.
Giải
Gọi X là số xe được xử dụng trong một ngày của cơ quan. Ta có X 0,1,2,3 . ∈{ } Gọi A , A , A 1 2 3 lần lượt là biến cố “xe 4 chỗ”; “xe 50 chỗ”; “xe tải” được xử dụng trong ngày của cơ quan. Khi đó, A , A , A 1 2 3 là các biến cố độc lập, P A 0,8; P A 0,4; P A 0,9 ( 1 2 3 ) = = = ( ) ( ) và
P X 0 P A A A P A P A P A ( ) ( 1 2 3 1 2 3 ) ( ) ( ) ( )
= = =
= ⋅ ⋅ =
0,2 0,6 0,1 0,012
( ) ( )
P X 1 P A A A A A A A A A
= = + +
1 2 3 1 2 3 1 2 3
( ) ( ) ( )
= + +
P A A A P A A A P A A A
1 2 3 1 2 3 1 2 3
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
= + +
P A P A P A P A P A P A P A P A P A
1 2 3 1 2 3 1 2 3
= ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ =
0,8 0,6 0,1 0,2 0,4 0,1 0,2 0,6 0,9 0,164
( ) ( )
P X 2 P A A A A A A A A A
= = + +
1 2 3 1 2 3 1 2 3
( ) ( ) ( )
= + +
P A A A P A A A P A A A
1 2 3 1 2 3 1 2 3
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
= + +
P A P A P A P A P A P A P A P A P A
1 2 3 1 2 3 1 2 3
= ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ =
0,8 0,4 0,1 0,8 0,6 0,9 0,2 0,4 0,9 0,536
P X 3 P A A A P A P A P A 0,8 0,4 0,9 0,288 ( = = = = ⋅ ⋅ = ) ( 1 2 3 1 2 3 ) ( ) ( ) ( ) Do đó, bảng phân phối xác suất của cho X là
X 0 1 2 3
P 0,012 0,164 0,536 0,288
39
2.2.1.2. Hàm xác suất
Hàm số f : → xác định bởi
p khi x x , f x0 khi x x , i.
⎧ = = ⎨⎩ ≠ ∀
( ) i i
i
được gọi là hàm xác suất của X. Từ tính chất của bảng phân phối xác suất, ta có (i) ∀ ∈ ≥ x , f x 0, ( ) và
∑f x 1. =
(ii) ( )
x
Ví dụ 2.6. Từ bảng phân phối xác suất của ví dụ 2.5. Ta có hàm xác suất của X như sau: ⎧ =
0,012 khi x 0,
⎪ = ⎪⎪ = ⎨ =
0,164 khi x 1,
( )
f x 0,536 khi x 2,
⎪ = ⎪⎪⎩ ≠
0,288 khi x 3,
0 khi x 0,1,2,3.
2.2.1.3. Hàm phân phối (tích lũy)
Cho f : → là hàm xác suất của biến ngẫu nhiên rời rạc X, hàm số F : , → được xác định bởi
= ≤ = ∑
( ) ( ) ( )
F x P X x f x ,
i
x x
≥
i
được gọi là hàm phân phối tích lũy, hay vắn tắt là hàm phân phối, của X. Bằng cách liệt kê các giá trị của X(Ω) theo thứ tự tăng dần, khi X lấy giá trị tạo thành một dãy 1 2 n x x x < < < < ta có hàm phân phối
⎧ <
0 khi x x ,
1
⎪ = + + + ≤ < ⎨⎪⎩ ≥
( ) ( ) ( ) ( )
F x f x f x f x khi x x x ,
1 2 n 1 n 1 n
− −
1 khi x x .
n
Từ tính chất của hàm xác suất và định nghĩa của hàm phân phối, ta có (i) 0 F x 1, x , ≤ ≤ ∀ ∈ ( )
(ii) ( ) xlim F x 0
= và ( ) xlim F x 1,
→−∞
→+∞
=
(iii) F là hàm tăng, và F liên tục bên phải tại mọi x . ∈
Ví dụ 2.7. Với biến số ngẫu nhiên X cho bởi ví dụ 2.6, ta có hàm phân phối
40
( )
⎧ <
0,012 khi x 0, ⎪ ≤ < ⎪⎪ = ⎨ ≤ <
0,164 khi 0 x 1,
F x 0,536 khi 1 x 2,
⎪ ≤ < ⎪⎪⎩ ≤
0,288 khi 2 x 3,
0 khi 3 x.
2.2.2. Đại lượng ngẫu nhiên liên tục
2.2.2.1. Hàm mật độ (xác suất)
Hàm số f : → được gọi là hàm mật độ xác suất, hay vắn tắt là hàm mật độ, của biến số ngẫu nhiên liên tục X nếu
b
P a X b f x dx ≤ ≤ = ∫
( ) ( )
a
với mọi a,b , a b. ∈ ≤
Từ định nghĩa, dễ dàng suy ra
(i) ∀ ∈ ≥ x , f x 0, ( ) và
+∞
= ∫
(ii) f x dx 1. ( )
−∞
Ví dụ 2.8. Cho biến số ngẫu nhiên liên tục X với hàm mật độ xác suất ( ) [ ]
⎧⎪ − ∈ = ⎨⎪ ∉ ⎩
Ax(3 x) khi x 0,3 , f x0 khi x 0,3 .
[ ]
Xác định hằng số A.
Giải
+) Do f x 0, x ( ) ≥ ∀ ∈ nên A 0 >
+) Ta có
+∞ +∞
0 3
= ⇔ + + = ∫ ∫ ∫ ∫
( ) ( ) ( ) ( )
f x dx 1 f x dx f x dx f x dx 1
−∞ −∞ 3
0 3
9 2 A 3x x dx 1 A 1 A .
2
( )
⇔ − = ⇔ = ⇔ = ∫
0
2.2.2.2. Hàm phân phối (tích lũy)
2 9
Cho f : → là hàm mật độ của biến ngẫu nhiên liên tục X, hàm số F : , → được gọi là hàm phân phối tích lũy, hay vắn tắt là hàm phân phối, của biến số ngẫu nhiên liên tục X nếu
41
x
= ≤ = ∫
( ) ( ) ( )
F x P X x f t dt
−∞
với mọi x . ∈
Trực tiếp từ định nghĩa, ta được (i) 0 F x 1, x , ≤ ≤ ∀ ∈ ( )
(ii) ( ) xlim F x 0
= và ( ) xlim F x 1,
→−∞
→+∞
=
(iii) F là hàm tăng, và F liên tục bên phải tại mọi x . ∈
Ví dụ 2.9. Cho biến số ngẫu nhiên liên tục X với hàm mật độ xác suất như ví dụ 2.8. Tìm hàm phân phối của X.
Giải
+) Trường hợp 1. Nếu x 0 < thì
x
= = ∫
( ) ( )
F x f t dt 0
−∞
+) Trường hợp 2. Nếu 0 x 3 ≤ < thì
x 0 x x
3 1 F x f t dt f t dt f t dt 3t t dt x x .
2 2 3
= = + = − = − ∫ ∫ ∫ ∫
( ) ( ) ( ) ( ) ( )
2 3 −∞ −∞
0 0
+) Trường hợp 3. Nếu 3 x ≤ thì
x 0 3 3
+∞
2
( ) ( ) ( ) ( ) ( ) ( ) = = + + = − = ∫ ∫ ∫ ∫ ∫ F x f t dt f t dt f t dt f t dt 3t t dt 1.
−∞ −∞
Vậy hàm phân phối của X là
⎧ <
0 3 0
0 khi x 0,
⎪⎪ = − ≤ < ⎨⎪⎪ ≥ ⎩
3 1 F x x x khi 0 x 3, 2 3
( ) 2 3
1 khi x 3.
Ví dụ 2.10. Cho X là biến số ngẫu nhiên liên tục có hàm phân phối xác suất ⎧ ≤ −
0 khi x 1,
⎪⎪ ⎛ ⎞ = + − − < ≤ ⎨ ⎜ ⎟ ⎪ ⎝ ⎠
1 F x a b x x khi 1 x 1, 3
( ) 3
⎪⎩ >
1 khi x 1.
Tìm các hằng số a, b.
42
Do X là biến số ngẫu nhiên liên tục nên hàm phân phối xác suất liên tục bên phải tại mọi x . ∈ Đặc biệt, tại x 1, = ± ( ) ( )
→− + = − cho
lim F x F 1
x 1
2 a b 0
⎛ ⎞ ⎜ ⎟ − = ⎝ ⎠ (*)
3
và ( ) ( )
→ + = cho
lim F x F 1
x 1
2 a b 1
⎛ ⎞ ⎜ ⎟ + = ⎝ ⎠ (**)
3
Từ (*) và (**), ta suy ra 3
a4 = và 2 b .3 =
2.3. Các số đặc trưng của đại lượng ngẫu nhiên
2.3.1. Kỳ vọng
Cho X là đại lượng ngẫu nhiên với hàm xác suất (hàm mật độ xác suất) f x( ) và u X( ) là một hàm theo biến số ngẫu nhiên X. Kỳ vọng của u X( ) được xác định là E u X u x f x ⎡ ⎤ = ⎣ ⎦ ∑ khi X là biến ngẫu nhiên rời rạc.
( ) ( i i ) ( )
i
+∞
⎡ ⎤ = ⎣ ⎦ ∫ khi X là biến ngẫu nhiên liên tục.
E u X u x f x dx ( ) ( ) ( )
−∞
2.3.2. Trung bình
Cho X là biến ngẫu nhiên với hàm xác suất (hàm mật độ xác suất) f x( ), khi u X X, ( ) = thì E X( ) được gọi là trung bình của X, ký hiệu X μ , nghĩa là E X x f x = ∑ khi X là biến số ngẫu nhiên rời rạc, và
( ) i i ( )
i
+∞
= ∫ khi X là biến ngẫu nhiên liên tục.
E X xf x dx ( ) ( )
−∞
Tính chất:
(i) E C C ( ) = với C là hằng số.
(ii) E aX bY aE X bE Y ( + = + ) ( ) ( ) (với a,b∈ và X, Y là hai đại lượng ngẫu nhiên).
2.3.3. Phương sai
Cho X là biến ngẫu nhiên với hàm xác suất (hàm mật độ xác suất) f x( ), khi đó
43
với ( ) ( )2
X u X X , = − μ thì ( )2 E X , − μX được gọi là phương sai của X, ký hiệu 2 σX hay var X , ( ) nghĩa là
( ) ( ) 2 2
σ = − μ ∑ x f x khi X là biến số ngẫu nhiên rời rạc, và
X i X i
i
+∞
( ) ( ) 2 2
σ = − μ ∫ khi X là biến ngẫu nhiên liên tục.
X X x f x dx
−∞
Tính chất:
(i) var C 0 ( ) = với C là hằng số.
(ii) ( ) ( ) ( ) 2 2 var aX bY a var X b var Y + = + (với a,b∈ và X, Y là hai đại lượng ngẫu nhiên độc lập).
2.3.4. Mệnh đề. Cho X là biến số ngẫu nhiên với trung bình E X . ( ) Ta có ( ) ( ) ( ) 2 2 var X E X E X = − ⎡ ⎤ ⎣ ⎦
Chứng minh. Do E tuyến tính, nghĩa là
E aX bY aE X bE Y ( + = + ) ( ) ( )
ta suy ra
2 2 2
⎡ ⎤ ⎡ ⎤ = − μ = − + ⎡ ⎤ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
( ) ( ) ( ) ( )
var X E X E X 2XE X E X
X
2 2 2 2
( ) ( ) ( ) ( ) ( ) ( )
= − + ⎡ ⎤ = − ⎡ ⎤ ⎣ ⎦ ⎣ ⎦
E X 2E X E X E X E X E X .
2.3.5. Độ lệch chuẩn
Độ lệch chuẩn của biến ngẫu nhiên X, ký hiệu σX là căn bậc hai của phương sai. 2 σ = σ X X
Chú ý: X, E X , ( ) σX có cùng đơn vị đo.
Ví dụ 2.11. Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất:
X 1 3 4
P 0,1 0,5 0,4
Tính trung bình, phương sai và độ lệch chuẩn của X.
Giải
Trung bình của X:
E X 1 0,1 3 0,5 4 0,4 3,2. ( ) = ⋅ + ⋅ + ⋅ =
44
Phương sai của X:
( ) ( ) ( ) ( ) 2 2 2 var X 1 3,2 0,1 3 3,2 0,5 4 3,2 0,4 0,76. = − ⋅ + − ⋅ + − ⋅ = Độ lệch chuẩn của X:
X σ = ≈ 0,76 0,872.
Ví dụ 2.12. Biến ngẫu nhiên liên tục X có hàm mật độ xác suất: ( ) [ ]
⎧⎪ ∈ = ⎨⎪ ∉ ⎩
2x khi x 0;1 , f x0 khi x 0;1 .
[ ]
Tính trung bình, phương sai và độ lệch chuẩn của X.
Giải
Trung bình của X:
+∞
1 1
2 2 E X xf x dx 2x dx x .
2 3
= = = = ∫ ∫
( ) ( )
−∞
Phương sai của X:
+∞
3 3
0 0 1 2
2 var X x f x dx x 2xdx
2
∫ ∫ ( ) ( ) ( )
⎛ ⎞
= − μ = − ⎜ ⎟ ⎝ ⎠
−∞
X
0
3
1 1 8 8 1 8 4 1 2x x x dx x x x .
⎛ ⎞ = − + = − + = ⎜ ⎟ ⎝ ⎠
3 2 4 3 2 ∫
3 9 2 9 9 18
0 0
Độ lệch chuẩn của X:
1 0,2357. 18
σ = ≈
X
2.3.6. Ý nghĩa của kỳ vọng và phương sai
Ý nghĩa kỳ vọng :
- Kỳ vọng toán phản ánh giá trị trung tâm của phân phối xác suất của biến ngẫu nhiên. - Trong kinh tế, kỳ vọng toán đồng thời mang 2 ý nghĩa:
+ Nếu xét trong 1 số lớn phép thử tương tự thì nó phản ánh giá trị trung bình + Nếu xét trong 1 phép thử đơn lẻ thì nó phản ánh giá trị mong đợi.
Ý nghĩa phương sai :
- Phương sai phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên so với giá trị trung bình. Phương sai càng lớn: phân tán càng nhiều quanh giá trị trung bình còn phương sai càng nhỏ: giá trị càng tập trung quanh giá trị trung bình.
- Trong kinh tế, phương sai phản ánh mức độ rủi ro hay độ biến động (kém ổn định).
45
Ví dụ 2.13. Nhu cầu hàng ngày về rau sạch ở một khu dân cư có bảng phân phối xác suất.
X 20 21 22 23 24 25 26
P 0,05 0,1 0,2 0,3 0,15 0,12 0,08
Mỗi kg rau mua vào giá 2 ngàn đồng, bán ra 2 ngàn rưỡi. Song nếu bị ế phải bán 1 ngàn rưỡi mới hết. Hàng ngày nên đặt mua 22 kg hay 24 kg rau để bán thì tốt hơn. Giải
Trường hợp 1. Nếu mua 22 kg thì gọi X1 là số tiền lãi. Ta có
P X 11 P X 22 0,85 ( 1 = = ≥ = ) ( )
P X 10 P X 21 0,1 ( 1 = = = = ) ( )
P X 9 P X 20 0,05 ( 1 = = = = ) ( )
Ta có bảng phân phối xác suất
X1 9 10 11
P 0,05 0,1 0,85
E X 9 0,05 10 0,1 11 0,85 10,8 ( 1 ) = ⋅ + ⋅ + ⋅ = (ngàn đồng)
( ) ( ) ( ) ( ) 2 2 2
1 var X 9 10,8 0,05 10 10,8 0,1 11 10,8 0,85 0,26 = − ⋅ + − ⋅ + − ⋅ = Trường hợp 2. Nếu mua 24 kg thì gọi X2 là số tiền lãi. Ta có
P X 12 P X 24 0,35 ( 2 = = ≥ = ) ( )
P X 11 P X 23 0,3 ( 2 = = = = ) ( )
P X 10 P X 22 0,2 ( 2 = = = = ) ( )
P X 9 P X 21 0,1 ( 2 = = = = ) ( )
P X 8 P X 20 0,05 ( 2 = = = = ) ( )
Ta có bảng phân phối xác suất
X2 8 9 10 11 12
P 0,05 0,1 0,2 0,3 0,35
E X 8 0,05 9 0,1 10 0,2 11 0,3 12 0,35 10,8 ( 2 ) = ⋅ + ⋅ + ⋅ + ⋅ + ⋅ = (ngàn đồng)
2 2 2
( ) ( ) ( ) ( )
var X 8 10,8 0,05 9 10,8 0,1 10 10,8 0,2
= − + − ⋅ + − ⋅ + 2
2 2
( ) ( )
+ − ⋅ + − ⋅ =
11 10,8 0,3 12 10,8 0,35 1,36
Vậy đặt mua 22 kg hay 24 kg đều có tiền lãi trung bình 10,8 ngàn.
46
Vì var X 0,26 var X 1,36 ( 1 2 ) = < = ( ) nên đặt mua 22 kg thì độ rủi ro thấp hơn đặt mua 24 kg.
Ví dụ 2.14. Khi đầu tư vào 2 thị trường A và B, lãi suất thu được là biến ngẫu nhiên có bảng phân phối xác suất tương ứng:
XA −1 5 8 XB −2 6 9
P 0,2 0,5 0,3 P 0,2 0,4 0,4
a) Muốn có lãi trung bình cao nên đầu tư vào đâu?
b) Muốn kinh doanh ổn định thì đầu tư vào đâu?
c) Người ta muốn giảm thiểu độ rủi ro bằng cách đầu tư vào cả hai, nên chia tỉ lệ đầu tư như thế nào biết rằng 2 thị trường A và B là độc lập.
Giải
a) Trung bình lãi suất của hai thị trường
E X 1 0,2 5 0,5 8 0,3 4,7 ( A ) = − ⋅ + ⋅ + ⋅ =
E X 2 0,2 6 0,5 9 0,3 5,6 ( B ) = − ⋅ + ⋅ + ⋅ =
Vậy muốn có lãi trung bình cao nên đầu tư vào thị trường B.
b) Phương sai lãi suất của hai thị trường
( ) ( ) ( ) 2 2 2 2
A var X 1 0,2 5 0,5 8 0,3 4,7 9,81 = − ⋅ + ⋅ + ⋅ − =
( ) ( ) ( ) 2 2 2 2
B var X 2 0,2 6 0,4 9 0,4 5,6 16,24. = − ⋅ + ⋅ + ⋅ − =
Vậy muốn kinh doanh ổn định nên đầu tư vào thị trường A.
c) Gọi a là tỷ lệ tiền lãi đầu tư vào thị trường A và (1 a − ) là tỷ lệ tiền lãi đầu tư vào thị trường B. Khi đó, tiền lãi: Z aX 1 a X = + − A B ( ) .
Ta có
( ) ( ) ( ) ( ) ( ) 2 2 2 2
A B var Z a var X 1 a var X 9,81a 16,24 1 a = + − = + −
Bài toán tìm a sao cho var Z min ( ) →
Đặt ( ) ( ) 2 2 f a 9,81a 16,24 1 a = + −
Đạo hàm cấp 1: ( ) / f a 52,1a 32,48 = −
Cho ( ) / f a 0 a 0,6234 = ⇔ =
Đạo hàm cấp 2: ( ) // f a 52,1 0 = >
47
Với a 0,6234 = thì f a( ) đạt giá trị nhỏ nhất
Vậy đầu tư 62,34% vốn vào thị trường A và 37,66% vốn vào thị trường B sẽ giảm thiểu được rủi ro.
2.3.7. Mốt và trung vị
Mốt của đại lượng ngẫu nhiên rời rạc X, ký hiệu M X , 0 ( ) là giá trị 0 x của X sao cho ( ) P X x = 0 là lớn nhất. Người ta còn nói rằng M X , 0 ( ) là giá trị tin chắc nhất của X. Trong trường hợp X là biến số ngẫu nhiên liên tục với hàm mật độ f x X ( ) thì M X , 0 ( ) là giá trị 0 x của X sao cho f x X 0 ( ) là lớn nhất.
Trung vị của đại lượng ngẫu nhiên (rời rạc hay liên tục), ký hiệu Me X( )là giá trị 0 x của X sao cho P X x P X x 0,5. ( ≤ = ≥ = 0 0 ) ( )
Chú ý rằng Mốt cũng như trung vị của một đại lượng ngẫu nhiên thì không duy nhất.
Ví dụ 2.15. Xét biến số ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau: X 0 1 2 3
P 1 8
3 8
3 8
1 8
Ta có M X 1 0 ( ) = hay M X 2 0 ( ) = và 1 Me X 2. < < ( ) Ví dụ 2.16. Cho biến số ngẫu nhiên liên tục X với hàm mật độ xác suất 2 2 3x x khi x 0,3 , f x 9
⎧⎪ − ∈ = ⎨⎪⎩ ∉
( ) ( ) [ ]
[ ]
0 khi x 0,3 .
Tính mốt và trung vị của X.
Giải
+) Tìm mốt của X
( ) ( ) 2 2 f x 3x x
9 = −
Tập xác định: D 0,3 = [ ]
Ta có: ( ) ( ) / 2 f x 3 2x
9 = −
Cho ( ) / 3 f x 0 x D
= ⇔ = ∈
2
48
Ta lại có: ( ) ( ) 3 1 f 0 f 3 0; f 2 2
⎛ ⎞ = = = ⎜ ⎟ ⎝ ⎠
Hàm mật độ đạt giá trị lớn nhất tại 3
x2 = . Vậy 0 ( ) 3 M X .2 =
+) Tìm trung vị của X
( ) ( ) 2 2 f x 3x x
9 = −
Tập xác định: D 0,3 = [ ]
Gọi Me X x [0,3] ( ) = ∈0
( ) ( ) ( ) 0 0 x x2
2 P X x 0,5 f x dx 0,5 3x x dx 0,5 9 −∞ −∞
≤ = ⇔ = ⇔ − = ∫ ∫
0
⎡ + ⎢ = ∉
3 3 3 x [0,3] 2
0
⎢⎢ ⇔ − + = ⇔ = ∈ ⎢⎢⎢ − = ∉ ⎢⎣
2 1 1 3 x x x [0,3] 27 3 2 2
3 2
0 0 0
3 3 3 x [0,3] 2
0
Vậy ( ) 3 Me X .2 =
2.3.8. Giá trị tới hạn
Giá trị tới hạn mức α của một biến ngẫu nhiên liên tục X, ký hiệu xα là giá trị của X thỏa mãn: P X x . ( > = α α )
2.3.9. Hệ số đối xứng và hệ số nhọn
Người ta còn có một số tham số liên quan đến hình dáng của hàm mật độ như sau: Với X là biến số ngẫu nhiên với trung bình μX và phương sai 2X σ , giá trị
49
( ) ( )3 ⎡ ⎤ − μ ⎣ ⎦ γ =σ
E x
X
1 3 X
X
được gọi là hệ số đối xứng của X và giá trị ( ) ( )4
⎡ ⎤ − μ ⎣ ⎦ γ =σ
E x
X
X
2 4
X
được gọi là hệ số nhọn của X.
Nếu γ = 1 (X 0 ) thì phân phối của X là đối xứng; lệch phải khi γ > 1 (X 0 ) và lệch trái khi γ < 1 (X 0. ) Ngoài ra giá trị γ2 (X) càng lớn thì phân phối của X càng nhọn. Ví dụ 2.17. Đo đường kính (X) một chi tiết máy (đơn vị mm). Ta có các số liệu : 201; 203; 209; 204; 202; 206; 200; 207; 207. Tính hệ số đối xứng và hệ số nhọn. X ( ) 1 201 203 209 207 207 204,3333 9 μ = + + + + + = ,
1 201 204 203 204 207 204 8,4444 9
(( ) ( ) ( ) ) 2 2 2 2
σ = − + − + + − = ,
X
Hệ số đối xứng
1 201 204 203 204 207 204
( ) (( ) ( ) ( ) ) 3 3 3
− + − + + −
9 X 0,3939. (9,5)
γ = =
1 3/2
Hệ số nhọn
1 201 204 203 204 207 204
( ) (( ) ( ) ( ) ) 4 4 4
− + − + + −
9 X 1,8029. (9,5)
γ = =
2 2
2.4. Một số quy luật phân phối xác suất quan trọng
2.4.1. Phân phối nhị thức B(n;p)
2.4.1.1. Định nghĩa. Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức, ký hiệu X B(n;p) nếu hàm xác suất của X có dạng sau
x x n x C p (1 p) khi x 0,1,2,...,n n f (x) 0 khi x 0,1,2,...,n
− ⎧⎪ − = = ⎨⎪⎩ ≠
Công thức xác suất
( ) k k n k P X k C p (1 p) , n− = = − với k 0,1,2,...,n. =
Ví dụ 2.18. Trong một vùng dân cư có 70% gia đình có máy giặt, chọn ngẫu nhiên 12 gia đình. Tính xác suất
50
a) có đúng 5 gia đình có máy giặt.
b) có ít nhất 2 gia đình có máy giặt.
Giải
Gọi X là số gia đình có máy giặt trong số 12 gia đình này, X B 12;0,7 . ( ) Ta có ( ) ( ) ( ) k 12 k k 12 k k k P X k C 0,7 (1 0,7) C 0,7 (0,3) 12 12
− − = = − =
a) Xác suất để nhận được đúng 5 gia đình có máy giặt là
( ) ( ) 5 12 5 5 P X 5 C 0,7 (0,3) 0,0291. 12− = = =
b) Xác suất để có ít nhất 2 gia đình có máy giặt là
( ) ( ) ( ) ( )
P X 2 1 P X 2 1 P X 0 P X 1
≥ = − < = − = − =
( ) ( ) 0 12 1 11 0 1
= − − ≈
1 C 0,7 (0,3) C 0,7 (0,3) 1.
12 12
2.4.1.2. Mệnh đề. Cho X B(n;p) , ta có
i) Trung bình: Xμ = np.
ii) Phương sai: 2X σ = npq, với q 1 p. = −
iii) Giá trị tin chắc nhất : M X k , 0 0 ( ) = với 0 k là số nguyên thỏa bất phương trình 0 np q k np q 1. − ≤ ≤ − +
Ví dụ 2.19. Một nhân viên tiếp thị bán hàng ở 5 chỗ khác nhau trong ngày. Xác suất bán được hàng ở mỗi nơi đều là 0,4.
a) Tìm xác suất để nhân viên này bán được hàng trong ngày.
b) Mỗi năm nhân viên này đi bán hàng 330 ngày. Gọi Y là số ngày bán được hàng trong năm. Tìm giá trị tin chắc nhất của Y.
Giải
Gọi X là tổng số nơi bán được hàng trong ngày, X B 5;0,4 . ( ) Ta có ( ) ( ) ( ) k 5 k k 5 k k k P X k C 0,4 (1 0,4) C 0,4 (0,6) 5 5
− − = = − =
a) Xác suất để bán được hàng trong ngày là
( ) ( ) ( )
P X 1 1 P X 1 1 P X 0
≥ = − < = − =
( ) 0 5 0
= − =
1 C 0,4 (0,6) 0,92224.
5
b) Tìm số ngày bán được hàng nhiều khả năng nhất trong một năm.
Ta có Y B 330;0,92224 ( ) và do đó, số ngày bán được hàng nhiều khả năng nhất là k M Y , 0 0 = ( ) với 0 k ∈ thỏa
51
0 330 0,92224 (1 0,92224) k 330 0,92224 (1 0,92224 ⋅ − − ≤ ≤ ⋅ − − +) 1
0 0 ⇔ ≤ ≤ ⇔ = 304,26 k 305,26 k 305.
Vậy số ngày bán được hàng có nhiều khả năng trong một năm là 305. 2.4.2. Phân phối siêu bội H(N,K,n)
2.4.2.1. Định nghĩa. Biến ngẫu nhiên rời rạc X được gọi là có phân phối siêu bội, ký hiệu X H(N,K,n) nếu hàm xác suất của X có dạng sau
x n x
−− ⎧⎪ ∈ − + = ⎨⎪ ∉ − + ⎩
C C khi x max{0,n N K},min{n,K} f (x) C
K N K n
N
[ ] [ ]
0 khi x max{0,n N K},min{n,K}
Công thức xác suất
k n k
C C P X k , C−− = = với max{0,n N K} k min{n,K}. − + ≤ ≤
( )
K N K n
N
2.4.2.2. Mệnh đề. Cho H(N,K,n), ta có
i) Trung bình: X μ = np ,
ii) Phương sai: 2XN n np(1 p) N 1
⎛ ⎞ − σ = − ⎜ ⎟ ⎝ ⎠ − .
2.4.2.3. Lưu ý : Nếu X H(N,K,n) , trong đó n N << thì X được xem như có phân phối nhị thức X B(n;p) , với K
p N = .
Ví dụ 2.20. Từ một hộp đựng 15 quả cam trong đó có 5 quả hư, lấy ra 3 quả. Gọi X là số quả hư trong 3 quả lấy ra.
a) Tính xác suất để cả 3 quả đều hư.
b) Tính trung bình và phương sai của X.
Giải
Ta có X H(15,5,3). Công thức tính xác suất
k 3 k
C C P X kC−− = =
( )
a) Xác suất để cả 3 quả đều hư 3 3
5 15 5 3
15
C C P X 3 0,021978. C = = =
( )
5 10 3
15
b) Trung bình (kỳ vọng) và phương sai của X
52
⎛ ⎞⎛ ⎞ − μ = = = σ = − = ⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠ −
5 5 5 15 3 4 np 3 1; 3 1 . 15 15 15 15 1 7
2
X X
Ví dụ 2.21. Có 8000 sản phẩm trong đó có 2000 sản phẩm không đạt tiêu chuẩn kỹ thuật. Lấy ngẫu nhiên (không hoàn lại) 10 sản phẩm. Tính xác suất để trong 10 sản phẩm lấy ra có 2 sản phẩm không đạt tiêu chuẩn.
Giải
Cách 1. Tính trực tiếp theo phân phối của nó
Ta có N 8000, K 2000, n 10 = = =
Gọi X số sản phẩm trong đạt tiêu chuẩn trong 10 sản phẩm lấy ra, X H 8000,2000,10 ( )
Công thức tính xác suất:
C C P X kC−
k 10 k
( ) = =
2000 6000 10
8000
Xác suất lấy hai sản phẩm không đạt tiêu chuẩn 2 8
C C P X 2 0,281697. C = = =
( )
2000 6000 10
8000
Cách 2. Tính xấp xỉ (tính gần đúng)
Do n 10 N 8000 = << = ; K p 0,25 N = =
X H 8000,2000,10 B 10;0,25 ( ) ≡ ( )
Xác suất lấy hai sản phẩm không đạt tiêu chuẩn
( ) 2 2 8 P X 2 C (0,25) (0,75) 0,28157. = = = 10
2.4.3. Phân phối Poisson P( ) μ
2.4.3.1. Định nghĩa. Biến ngẫu nhiên rời rạc X được gọi là có phân phối poisson, ký hiệu X P( ) μ nếu hàm xác suất của X có dạng sau
x
−μ ⎧ μ ⎪ = = ⎨⎪⎩ ≠
e khi x 0,1,2,...,n,... f (x) x!
0 khi x 0,1,2,...,n,...
Công thức xác suất
k
−μ μ = = với k 0,1,2,...,n. =
( )
P X k e , k!
53
2.4.3.2. Mệnh đề. Cho X P( ) μ , ta có
i) Trung bình: μ = μ X ,
ii) Phương sai: 2 σ = μ X ,
iii) Độ lệch chuẩn: σ = μ X .
2.4.3.3. Chú ý: Nếu X B(n,p) , trong đó p đủ nhỏ và n đủ lớn thì X được xem như có phân phối Poisson X P( ) μ , với μ = np.
Bằng cách viết
n(n 1)...(n k 1) P X k C p (1 p) p (1 p) k!
− − + = = − = −
k k n k k n k
( )
− − n
− − + = − 1 n(n 1)...(n k 1) np (1 p) k! n k n k
k
( )
−
và với np = μ không đổi, khi n → ∞ ta có p 0 → và
n(n 1)...(n k 1) lim 1,
− − + =
k n
→∞ n
−μ+ μ− − −μ −
kp 1 k
⎡ ⎤
n k p p
− = − = − = ⎢ ⎥
lim (1 p) lim(1 p) lim (1 p) e .
n p 0 p 0 →∞ → →
⎢ ⎥ ⎣ ⎦
−μ − μ − ≈ khi n khá lớn.
Từ đó, suy ra
k
e C p (1 p) k!
k k n k
n
Trong ứng dụng, khi X B n;p , ( ) trong đó n 50, p 0,01 > < và np 5 < thì ta có thể dùng xấp xỉ X P np . ( )
Ví dụ 2.22. Một máy dệt có 4000 ống sợi. Xác suất để mỗi ống sợi bị đứt trong 1 phút là 0,0005. Tính xác suất để trong 1 phút
a) có 3 ống sợi bị đứt,
b) có ít nhất 2 ống sợi bị đứt.3
Giải
Cách 1. Tính trực tiếp theo luật phân phối của nó
Ta có n 4000; p 0,0005 = =
Gọi X là số ống sợi bị đứt trong 1 phút (trong 4000 ống sợi), X B 4000;0,0005 ( ) Công thức tính xác suất:
( ) ( ) k 4000 k k P X k C 0,0005 (0,9995) 4000− = =
54
a) có 3 ống sợi bị đứt,
( ) ( ) 3 3997 3 P X 3 C 0,0005 (0,9995) 0,1804822 = = = 4000
b) có ít nhất 2 ống sợi bị đứt.
( ) ( ) ( ) ( )
P X 2 1 P X 2 1 P X 0 P X 1
≥ = − < = − = − =
( ) ( ) 0 4000 1 3999 0 1
= − −
1 C 0,0005 (0,9995) C 0,0005 (0,9995)
4000 4000
=
0,594062.
Cách 2. Tính xấp xỉ (tính gần đúng)
Ta có trung bình : μ = = ⋅ = < np 4000 0,0005 2 5 nên phân phối nhị thức được xấp xỉ bằng phân phối Poisson như sau:
X B 4000;0,0005 P 2 ( ) ≡ ( )
Công thức tính xác suất:
k
2 2 P X k ek!
− = =
( )
a) có 3 ống sợi bị đứt,
3
2 2 P X 3 e 0,180447. 3!
− = = =
( )
b) có ít nhất 2 ống sợi bị đứt.
( ) ( ) ( ) ( )
P X 2 1 P X 2 1 P X 0 P X 1
≥ = − < = − = − =
0 1
2 2 1 e e 0,59399. 0! 1!
− −
2 2
= − − =
2.4.4. Phân phối đều U a,b [ ]
2.4.4.1. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối đều, ký hiệu X U a,b [ ] nếu hàm mật độ của X có dạng sau
1 khi x [a,b] f (x) b a
⎧⎪ ∈ = ⎨ −
,
⎪⎩ ∉
0 khi x [a,b]
Công thức tính xác suất
β − α α ≤ ≤ β = −
P X ( ) b a
2.4.4.2. Mệnh đề. Cho X U a,b [ ], ta có
55
i) Trung bình: Xa b
+
μ = ,
2
2
ii) Phương sai:
(b a) . 12− σ =
2
X
Ví dụ 2.23. Một loại sản phẩm do một nhà máy sản xuất được đóng thành từng hộp. Trọng lượng của hộp là biến ngẫu nhiên phân phối đều trong khoảng [1,9;2,1] (kg). Tính trọng lượng trung bình của một hộp và tỷ lệ hộp có trọng lượng từ 1,95 kg trở lên. Giải
Gọi X là trọng lượng của mỗi hộp sản phẩm, X U 1,9;2,1 [ ]
Trọng lượng trung bình của một hộp chính là
a b 1,9 2,1 E(X) 2(kg) 2 2
+ + = = =
Tỷ lệ hộp có trọng lượng từ 1,95 kg trở lên là:
2,1 1,95 P(X 1,95) P(1,95 X 2,1) 0,75 75%. 2,1 1,9
− ≥ = ≤ ≤ = = = −
2.4.5. Phân phối mũ
2.4.5.1. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối mũ, ký hiệu X Exp (λ) nếu hàm mật độ của X có dạng sau
x e , khi x 0, f (x) 0, khi x 0.
−λ ⎧⎪λ > = ⎨⎪⎩ ≤
2.4.5.2. Mệnh đề. Cho X Exp (λ) , ta có
i) Trung bình: X1
μ = λ ,
ii) Phương sai: 2X 21
σ = . λ
Ví dụ 2.24. Tuổi thọ (tính theo giờ) của một trò chơi điện tử bấm tay là một biến số ngẫu nhiên liên tục có hàm mật độ xác suất như sau:
x
⎧ − ⎪ = ≥ ⎨⎪⎩ <
100 f (x) ke khi x 0
0 khi x 0
a) Tìm hằng số k.
b) Tính xác suất tuổi thọ của trò chơi này nằm trong khoảng từ 50 đến 150 giờ.
56
c) Tính xác suất tuổi thọ của trò chơi này ít hơn 100 giờ. Giải
a) Tìm hằng số k.
Ta có
+) Vì f x( ) là hàm mật độ nên f x 0 k 0 ( ) ≥ ⇒ >
x
+∞ +∞ −
= ⇔ = ∫ ∫
+) ( )
100
f x dx 1 ke dx 1
−∞
0
+∞ +∞ − − ⎛ ⎞
x x
1 k e dx 1 100k e 1 100k 1 k100 ⎝ ⎠ ∫
100 100
⇔ = ⇔ − = ⇔ = ⇔ = ⎜ ⎟ 0 0
b) Tính xác suất tuổi thọ của trò chơi này nằm trong khoảng từ 50 đến 150 giờ. Ta có
150 150 x
1 P 50 X 150 f x dx e dx
−
∫ ∫
( ) ( )
100
≤ ≤ = =
100
50 50
150 x 1 3
− − −
100 2 2
= − = − ≈
e e e 0,3834.
50
c) Tính xác suất tuổi thọ của trò chơi này ít hơn 100 giờ. Ta có
100 100 x
1 P X 100 f x dx e dx
−
∫ ∫
( ) ( )
100
< = = −∞
100 x
100
0
− −
100 1
= − = − ≈
e 1 e 0,632.
0
2.4.6. Phân phối chuẩn tắc N 0,1 ( )
2.4.6.1. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn tắc, ký hiệu X N 0,1 ( ) nếu hàm mật độ của X có dạng sau
2 x
2 1 f (x) e , x 2−
= − ∞ < < +∞
π ,
Với a,b , a b, ∈ ≤ ta có
2 b x
1 P a X b e dx b a .
π ∫
−
( ) ( ) ( ) ≤ ≤ = = φ − φ
20 0
2
a
57
2 x t
1 (x) e dt. 2−
Trong đó
φ =π ∫
0
0
2
2.4.6.2. Mệnh đề. Cho X N 0,1 ( ), ta có
i) Trung bình: X μ = 0 ,
ii) Phương sai: 2X σ =1,
iii) Độ lệch chuẩn: X σ =1.
2.4.7. Phân phối chuẩn ( ) 2 N , μ σ
2.4.7.1. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn, ký hiệu ( ) 2 X N , μ σ nếu hàm mật độ của X có dạng sau
( )2
2 1 f (x) e , x 2−μ − σ = − ∞ < < +∞
x
2
σ π ,
Với a,b , a b, ∈ ≤ ta có
2
−μ − σ ≤ ≤ =σ π ∫ b (x )
1 P a X b e dx
( )
2
2
a
2
2.4.7.2. Mệnh đề. Cho ( ) 2 X N , μ σ , ta có
i) Trung bình: μ = μ X ,
ii) Phương sai: 2 2 σ = σ X ,
iii) Độ lệch chuẩn: σ = σ X .
2.4.7.3. Chú ý
i) Nếu ( ) 2 X N , μ σ thì đặt X Y − μ = σ, ta có Y N(0,1) . Do đó
a b b a P a X b P Y ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ − μ − μ − μ − μ ≤ ≤ = ≤ ≤ = φ − φ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ σ σ σ σ
( ) 0 0
ii) Phân phối chuẩn dùng để khảo sát các hiện tượng bình thường. Cụ thể, nếu X B n;p ( ) với tích np lớn thì ta xấp xỉ phân phối nhị thức B n;p ( ) bằng phân phối chuẩn ( ) 2 N ; μ σ , với 2 μ = σ = np, npq . Ta có X B n;p N np,npq ( ) ≡ ( )
58
( )2 k np
1 2npq P X k e , npq 2− −
+) ( )
= ≈ π
⎛ ⎞ ⎛ ⎞ − − ≤ ≤ ≈ φ − φ ⎜ ⎟ ⎜ ⎟
b np a np P a X b .
+) ( ) 0 0
npq npq
⎝ ⎠ ⎝ ⎠
Ví dụ 2.25. Trọng lượng X (tính bằng gam) một loại trái cây có phân phối chuẩn ( ) 2 N ; , μ σ với μ = 500(gam) và 2 2 σ = 16(gam ) . Trái cây thu hoạch được phân loại theo trọng lượng như sau :
a) loại 1 : trên 505 gam,
b) loại 2 : từ 495 đến 505 gam,
c) loại 3 : dưới 495 gam.
Tính tỷ lệ mỗi loại.
Giải
Gọi X là trọng lượng trái cây thì ( ) ( ) 2 2 X N ; N 500;4 μ σ = .
a) Tỷ lệ trái cây loại 1 là
( ) 0 0 0 ( ) ( ) 505 500 P X 505 0,5 1,25 0,10565. 4
⎛ ⎞ − > = φ +∞ − φ = − φ = ⎜ ⎟ ⎝ ⎠
b) Tỷ lệ trái cây loại 2 là
505 500 495 500 P 495 X 505 0,7887. 4 4
⎛ ⎞ ⎛ ⎞ − − ≤ ≤ = φ − φ = ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠
( ) 0 0
c) Và tỷ lệ của loại 3 là
X 500 495 500 495 500 P X 495 P( ) 4 4 4
− − − ⎛ ⎞ < = < = φ − φ −∞ ⎜ ⎟ ⎝ ⎠
( ) ( )
0 0
( ) ( ) ( )
= φ − + φ +∞ = −φ + =
1,25 1,25 0,5 0,10565.
0 0 0
Vậy, trái cây thu hoạch được có khoảng 11% loại 1, 78% loại 2 và 11% loại 3. Ví dụ 2.26. Thời gian chạy 1000m của mỗi sinh viên là một biến ngẫu nhiên phân phối chuẩn có trung bình là 80 giây, độ lệch chuẩn là 10 giây. Một sinh viên phải chạy tối đa là bao nhiêu thời gian để đứng trong 10% số người đứng đầu.
Giải
Gọi X là thời gian chạy hết 1000m của mỗi sinh viên, ( ) 2 2 X N μ 80,σ 10 = = . t là thời gian chạy tối đa để đứng trong 10% số người đứng đầu, ta có:
59
P X t 0,1 P 0 X t 0,1 ( ≤ = ⇔ ≤ ≤ = ) ( )
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ − − − ⇔ φ − φ = ⇔ φ + = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
t 80 0 80 t 80 0,1 0,5 0,1 10 10 10
0 0 0
⎛ ⎞ − ⇔ φ = = φ ⇔ = ⎜ ⎟ ⎝ ⎠
0 0 ( ) 80 t 0,4 1,28 t 67,2. 10
Vậy thời gian tối đa của sinh viên hoàn thành 1000m để đứng trong 10% số người đứng đầu.
Ví dụ 2.27. Xác suất để một sản phẩm không được kiểm tra chất lượng sau khi sản xuất là 0,2. Tìm xác suất để trong 400 sản phẩm sản xuất ra có:
a) 80 sản phẩm không được kiểm tra chất lượng.
b) Có từ 70 đến 100 sản phẩm không được kiểm tra chất lượng.
Giải
Gọi X là số sản phẩm không được kiểm tra chất lượng, X B 400;0,2 ( ) Ta có: 2 2 μ = = ⋅ = σ = = ⋅ ⋅ = np 400 0,2 80; npq 400 0,2 0,8 8
nên có thể coi ( ) 2 X N 80;8
( )2 80 80
− − ⋅ = ≈ = = π π
2 64 1 1 1 P X 80 e 0,049868. 400.0,2.0,8 2 8 2
a) ( )
100 80 70 80 P 70 X 1008 8
⎛ ⎞ ⎛ ⎞ − − ≤ ≤ ≈ φ − φ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠
b) ( ) 0 0
= φ − φ − = φ + φ = 0 0 0 0 (2,5 1,25 2,5 1,25 0,8882. ) ( ) ( ) ( )
2.4.8. Phân phối Gamma và phân phối Chi bình phương
Định nghĩa: Hàm Gamma Γ ∞ → : 0, ( )
∞
− − Γ = ∫
x 1 t
(x) t e dt
0
2.4.8.1. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối Gamma, ký hiệu X , Γ α β ( ), với α β > , 0, nếu hàm mật độ của X có dạng sau
x
⎧⎪ > = ⎨Γ α β ⎪⎩ ≤,
− α− β
1 1 x e khi x 0 f (x) ( )
α
0 khi x 0
2.4.8.2. Mệnh đề. Cho X ( , ) Γ α β , ta có
60
i) Trung bình: μ = αβ X ,
ii) Phương sai: 2 2
X σ = αβ .
2.4.8.3. Định nghĩa. Biến ngẫu nhiên liên tục X được gọi là có phân phối Chi bình phương, ký hiệu 2 X (r) χ , nếu hàm mật độ của X có dạng sau
r x 1
⎧ − − ⎪ > ⎪ ⎛ ⎞ = ⎨Γ⎜ ⎟ ⎪ ⎝ ⎠ ⎪⎩ ≤,
1 x e khi x 0
r f (x) 2 2
2 2 r 2
nghĩa là r X ,2 2 ⎛ ⎞ Γ⎜ ⎟ ⎝ ⎠
0 khi x 0
2.4.8.4. Mệnh đề. Cho 2 X (r) χ , ta có
i) Trung bình: X μ = r,
ii) Phương sai: 2X σ = 2r .
2.4.9. Phân phối Student: St(n)
2.4.9.1. Định nghĩa: Biến ngẫu nhiên liên tục T được gọi là có phân phối Student, ký hiệu T St(n) , nếu hàm mật độ của T có dạng sau
⎛ ⎞ + Γ⎜ ⎟ ⎝ ⎠ =
n 1
2 f (t)
n 1
+
2 2
⎛ ⎞ ⎛ ⎞ π ⋅ Γ ⋅ + ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠
n t n 1
2 n
2.4.9.2. Mệnh đề. Cho X là biến ngẫu nhiên liên tục có phân phối Gauss, X N 0,1 ( ); Y là biến ngẫu nhiên liên tục có phân phối Chi bình phương với n bậc tự do, 2 Y (n) χ và X, Y là hai biến độc lập.
Đặt X TYn
= thì T có phân phối Student với n bậc tự do, T St(n) .
2.4.9.3. Mệnh đề. Cho T St(n) , ta có
i) Trung bình: T μ = 0 ,
ii) Phương sai: 2Tn
σ = − .
n 2
2.4.9.4. Chú ý: Nếu X St(n) , với n 30 ≥ , thì X N(0,1).
61
2.4.10. Phân phối Fisher: F(n,m)
2.4.10.1. Định nghĩa. Biến ngẫu nhiên liên tục F có phân phối Fisher, ký hiệu F F(n,m) nếu hàm mật độ của F có dạng như sau
n m
−
⎧ ⎛ ⎞ + ⎪ ⋅ ⋅Γ⎜ ⎟ ⎪ ⎝ ⎠ ⎪ > = ⎨ ⎛ ⎞ ⎪ Γ + ⎜ ⎟ ⎝ ⎠ ⎪⎪⎩ ≤
n m
n m 2
n m x
2 khi x 0, f (x) nm nx
n m
2
( )
+ 2
0 khi x 0.
với n, m là hai bậc tự do.
2.4.10.2. Mệnh đề. Cho X, Y là hai biến ngẫu nhiên liên tục có phân phối Chi bình phương, 2 X (n) χ , 2 Y (m) χ và X, Y là hai biến độc lập.
Xn F Ym
Đặt
= thì F có phân phối Fisher với n, m bậc tự do, F F(n,m) .
2.4.10.3. Mệnh đề. Cho F F(n,m) , ta có i) Trung bình: Fn , n 2 n 2 μ = > − ,
2 2
2m (n m 2) , m 4. n(m 2) (m 4)
+ −
2F 2
ii) Phương sai:
σ = > − −
2.5. Tóm tắt chương 2
A. Đại lượng ngẫu nhiên rời rạc
1. Bảng phân phối xác suất
X 1 x 2 x ... n x ...
P 1 p 2 p ... n p ...
với p P X x , i i = = ( ) được gọi là bảng phân phối xác suất của X. ∑p 1. =
Tính chất: i
i
2. Hàm xác suất của biến ngẫu nhiên X: Hàm số f : → xác định bởi p khi x x , f x0 khi x x , i.
⎧ = = ⎨⎩ ≠ ∀
( ) i i
i
∑f x 1. =
Tính chất : ∀ ∈ ≥ x , f x 0, ( ) và ( )
x
62
3. Hàm phân phối xác suất: Cho f : → là hàm xác suất của biến ngẫu nhiên rời rạc X, hàm số F : , → được xác định bởi
= ≤ = ∑
( ) ( ) ( )
F x P X x f x ,
i
x x
≥
i
B. Đại lượng ngẫu nhiên liên tục
1. Hàm mật độ (xác suất): Hàm số f : → được gọi là hàm mật của biến số
b
P a X b f x dx ≤ ≤ = ∫
ngẫu nhiên liên tục X nếu ( ) ( )
a
+∞
= ∫
với mọi a,b , a b. ∈ ≤ Ta có : ∀ ∈ ≥ x , f x 0, ( ) và f x dx 1. ( ) −∞
2. Hàm phân phối (tích lũy): Cho f : → là hàm mật độ của biến ngẫu nhiên liên tục X, hàm số F : , → được gọi là hàm phân phối của biến số ngẫu nhiên liên
x
= ≤ = ∫ với mọi x . ∈
tục X nếu ( ) ( ) ( )
F x P X x f t dt
−∞
C. Trung bình và phương sai: Cho X là biến ngẫu nhiên với hàm xác suất (hàm mật độ xác suất) f x( ),
1. Trung bình:
E X x f x = ∑ khi X là biến số ngẫu nhiên rời rạc, và
( ) i i ( )
i
+∞
= ∫ khi X là biến ngẫu nhiên liên tục.
E X xf x dx ( ) ( )
−∞
2. Phương sai
( ) ( ) 2 2
σ = − μ ∑ x f x khi X là biến số ngẫu nhiên rời rạc, và
X i X i
i
+∞
( ) ( ) 2 2
σ = − μ ∫ khi X là biến ngẫu nhiên liên tục.
X X x f x dx
−∞
3. Độ lệch chuẩn:
σ = X Se X( ) gọi là độ lệch chuẩn của X.
4. Mệnh đề. Cho X là biến số ngẫu nhiên với trung bình E X . ( ) Ta có ( ) ( ) ( ) 2 2 var X E X E X = − ⎡ ⎤ ⎣ ⎦
D. Các quy luật thường gặp
63
1. Phân phối nhị thức: X B(n;p)
i) Công thức xác suất
( ) k k n k P X k C p (1 p) , n− = = − với k 0,1,2,...,n. =
ii) Trung bình: X μ = np ,
iii) Phương sai: 2X σ = − np(1 p),
iv) Giá trị tin chắc nhất : M X k , 0 0 ( ) = với 0 k là số nguyên thỏa bất phương trình 0 np q k np q 1. − ≤ ≤ − +
2. Phân phối siêu bội: X H(N,K,n)
k n k
C C P X k , C−− = = với max{0,n N K} k min{n,K}. − + ≤ ≤
i) ( )
K N K n
N
ii) Trung bình: X μ = np ,
iii) Phương sai: 2XN n np(1 p) N 1
⎛ ⎞ − σ = − ⎜ ⎟ ⎝ ⎠ − .
3. Phân phối Poisson : X P( ) μ
i) Công thức xác suất
k
−μ μ = = với k 0,1,2,...,n. =
( )
P X k e , k!
ii) Trung bình: μ = μ X ,
iii) Phương sai: 2X σ = μ.
4. Phân phối chuẩn tắc: X N 0,1 ( )
2 x t
1 (x) e dt. 2−
i) P a X b b a , ( ≤ ≤ = φ − φ ) 0 0 ( ) ( ) với
ii) Trung bình: X μ = 0 ,
iii) Phương sai: 2X σ =1,
5. Phân phối chuẩn: ( ) 2 X N , μ σ
φ =π ∫
0
0
2
b a P a X b , ⎛ ⎞ ⎛ ⎞ − μ − μ ≤ ≤ = φ − φ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ σ σ
i) ( ) 0 0
i) Trung bình: μ = μ X ,
ii) Phương sai: 2 2
X σ = σ .
64
2.6. Bài tập
Bài số 1. Cho X là một biến số ngẫu nhiên có phân phối xác suất như sau X 1 2 3 4 5 6 7
PX a 2a 2a 3a 2 a 2 2a 2 7a a +
a) Xác định a.
b) Tính P X 5 [ ≥ ], P X 3 [ < ].
c) Tính k nhỏ nhất sao cho P X k 0,5 [ ≤ ≥] .
Đáp số: a) a 0,1 = ; b) P X 5 0,2; [ ≥ =] P X 3 0,3 [ < =] ; c) k 3 = .
Bài số 2. Xét trò chơi, tung một con xúc xắc ba lần: nếu cả ba lần được 6 nút thì thưởng 6 ngàn đồng, nếu hai lần 6 nút thì thưởng 4 ngàn đồng, một lần 6 nút thì thưởng 2 ngàn đồng, và nếu không có 6 nút thì không thưởng gì hết. Mỗi lần chơi phải đóng A ngàn đồng. Hỏi
a) A bao nhiêu thì người chơi về lâu về dài huề vốn (gọi là trò chơi công bằng), b) A bao nhiêu thì trung bình mỗi lần người chơi mất 1 ngàn đồng.
Đáp số: a) A 1; = b) A 2 = .
Bài số 3. Một nhà đầu tư có 3 dự án. Gọi X (i 1,2,3) i = là số tiền thu được khi thực hiện dự án thứ i (giá trị âm chỉ số tiền bị thua lỗ). Xi là biến số ngẫu nhiên. Qua nghiên cứu, giả sử có số liệu như sau : (Đơn vị tính : 100 triệu đồng )
X1 -20 30 60
P 0,3 0,2 0,5
X2 -20 -10 100
P 0,4 0,2 0,4
X3 -25 -30 80
P 0,2 0,3 0,5
Theo anh (chị), ta nên chọn dự án nào ?
Đáp số: Nên chọn dự án 1.
Bài số 4. Có 3 xạ thủ cùng bắn vào một mục tiêu, mỗi người bắn 1 viên, trong cùng một số điều kiện nhất định. Xác suất để mỗi xạ thủ bắn trúng mục tiêu lần lượt là 0,6; 0,7; 0,9. Gọi X là số viên đạn trúng mục tiêu. Tính E(X); Var(X) và Mod(X).
65
Đáp số: EX 2,2; Var(X) 0,54; Mod(X) 2. = = =
Bài số 5. Một phân xưởng có ba máy M ,M ,M 1 2 3 . Trong một giờ, mỗi máy sản xuất được 10 sản phẩm. Số sản phẩm không đạt tiêu chuẩn trong 10 sản phẩm của M ,M ,M 1 2 3 lần lượt là 1, 2, 1. Lấy ngẫu nhiên 1 sản phẩm từ 10 sản phẩm do mỗi máy sản xuất. Gọi X là số sản phẩm không đạt tiêu chuẩn trong 3 sản phẩm được lấy ra.
a) Lập bảng phân phối xác suất của X.
b) Tìm E(X), Var(X), Mod(X).
c) Tính P X 1 ( ≤ ).
Đáp số: a)
X 0 1 2 3
P 0,648 0,306 0,044 0,002
b) EX 0,4; Var(X) 0,34;Mod(X) 0 = = = ; c) 0,954.
Bài số 6. Tỷ lệ khách hàng phản ứng tích cực đối với một chiến dịch quảng cáo là biến số ngẫu nhiên có bảng phân phối xác suất như sau :
X (%) 0 10 20 30 40 50 P 0,1 0,2 0,35 0,2 0,1 0,05 a) Tính tỷ lệ khách hàng bình quân phản ứng tích cực đối với chiến dịch quảng cáo đó.
b) Tìm xác suất để có trên 20% khách hàng phản ứng tích cực đối với chiến dịch quảng cáo.
Đáp số: a) 21,5%; b) 0,35.
Bài số 7. Qua theo dõi trong nhiều năm kết hợp với sự đánh giá của các chuyên gia tài chính thì lãi suất đầu tư vào một công ty là biến số ngẫu nhiên có bảng phân phối xác suất như sau:
X (%) 9 10 11 12 13 14 15
P 0,05 0,15 0,3 0,2 0,15 0,1 0,05
a) Tính xác suất để khi đầu tư vào công ty đó thì sẽ đạt được lãi suất ít nhất là 12%. b) Tính lãi suất kỳ vọng khi đầu tư vào công ty đó.
c) Mức độ rủi ro khi đầu tư vào công ty đó có thể đánh giá bằng cách nào? Đáp số a) 0,5; b) EX 11,75 = ; c) 2X σ = 2,2875.
Bài số 8. Cho biến số ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau:
66
X 1 4 8
P 0,3 0,1 0,6
Tính P X E X 4 ( − < ( ) ).
Đáp số: 0,7.
Bài số 9. Lợi nhuận X thu được khi đầu tư vào một dự án có bảng phân phối xác suất như sau (đơn vị : tỷ đồng).
X -2 -1 0 1 2 3
P 0,1 0,1 0,2 0,2 0,3 0,1
a) Tìm mức lợi nhuận có khả năng nhiều nhất khi đầu tư vào dự án đó. b) Việc đầu vào dự án này có hiệu quả hay không? Tại sao?
c) Làm thế nào để đo được mức độ rủi ro của vụ đầu tư này? Hãy tìm mức độ rủi ro đó.
Đáp số: a) Mod(X) 2 = ; b) EX 0,8 = ; 2X σ = 2,16.
Bài số 10. Tại một cửa hàng bán xe máy Honda người ta thống kê được số xe máy bán ra hàng tuần (X) với bảng phân phối xác suất như sau :
X 0 1 2 3 4 5 6 7 8 9 10 11 P 0,05 0,12 0,17 0,08 0,12 0,2 0,07 0,02 0,07 0,02 0,03 0,05 a) Tìm số xe trung bình bán được mỗi tuần.
b) Tìm phương sai và độ lệch chuẩn của số xe bán được mỗi tuần và giải thích ý nghĩa của kết quả nhận được.
Đáp số: a) 4,33; b) 2X X σ = σ = 8,3411; 2,89 .
Bài số 11. Sản phẩm nhà máy được đóng thành từng hộp, mỗi hộp có 10 sản phẩm. Gọi X là số sản phẩm loại một có trong hộp. Cho biết X có bảng phân phối xác suất như sau: X 6 7
P 0,7 0,3
Khách hàng chọn cách kiểm tra để mua hàng như sau : Từ mỗi hộp lấy ngẫu nhiên ra 3 sản phẩm để kiểm tra, nếu thấy có ít nhất 2 sản phẩm loại một thì mua hộp đó. Lấy ngẫu nhiên 3 hộp để kiểm tra. Tính xác suất để có 2 hộp được mua.
Đáp số: 0,438.
Bài số 12. Thống kê số khách hàng trên một xe buýt tại một tuyến giao thông ta thu được các số liệu sau:
67
Số khách trên một chuyến 30 40 45 50 60
Tần suất tương ứng 0,15 0,2 0,3 0,25 0,1
a) Tìm kỳ vọng và phương sai của số khách hàng đi mỗi chuyến và giải thích ý nghĩa của kết quả nhận được.
b) Chi phí cho mỗi chuyến xe là 400 ngàn đồng không phụ thuộc vào số khách đi trên xe thì công ty xe buýt có thể thu lãi bình quân cho mỗi chuyến xe là 312 ngàn đồng. Công ty phải quy định giá vé là bao nhiêu?
Đáp số : a) E(X) 44,5; Var(X) 67,25 = = . b) 16 ngàn đồng.
Bài số 13. Tuổi thọ của một loại bóng đèn nào đó là một biến số ngẫu nhiên liên tục X (đơn vị năm) với hàm mật độ như sau
2 kx (4 x) khi 0 x 4 f (x) 0 khi x [0,4]
⎧⎪ − ≤ ≤ = ⎨⎪⎩ ∉
a) Tìm k và vẽ đồ thị f x . ( )
b) Tìm xác suất để bóng đèn hỏng trước khi nó được 1 năm tuổi.
Đáp số: a) 3 k64 = ; b) 0,0508.
Bài số 14. Khối lượng của một con vịt 6 tháng tuổi là một biến số ngẫu nhiên X (đơn vị tính là Kg) có hàm mật độ
2 k(x 1) khi 1 x 3 f (x) 0 khi x [1,3]
⎧⎪ − ≤ ≤ = ⎨⎪⎩ ∉
a) Tìm k.
b) Với k tìm được, tính
(i) khối lượng trung bình của vịt 6 tháng tuổi,
(ii) tỷ lệ vịt chậm lớn, biết vịt 6 tháng tuổi chậm lớn là vịt có khối lượng nhỏ hơn 2Kg, (iii) hàm phân phối xác suất của X.
Đáp số: a) 3 k20 = ; b) EX 2,4 = ; P X 2 0,2 ( < =)
⎧ ≤
0 khi x 1
⎪⎪ − +
3
x 3x 2 F(x) khi 1 x 3 20
= < ≤ ⎨⎪⎪ > ⎩
1 khi x 3
Bài số 15. Cho hàm mật độ của biến ngẫu nhiên X có dạng
68
⎧ ∈ −⎡ ⎤ ⎪ ⎣ ⎦ = ⎨⎪ ∉ −⎡ ⎤ ⎩ ⎣ ⎦
π π
a cos x khi x , ,
2 2
f (x)0 khi x , .
π π
2 2
a) Tìm a và xác định hàm phân phối xác suất của X.
⎛ ⎞ π
b) Tính xác suất để X nhận giá trị trong khoảng ,4
⎜ ⎟ π ⎝ ⎠.
⎧ π ≤ − ⎪⎪⎪ π π = + − < ≤ ⎨⎪⎪ π
0 khi x2
Đáp số: a) a 0,5; = b) 0,1465.
F(x) 0,5(sin x 1) khi x 2 2 > ⎪⎩
1 khi x2
Bài số 16. Cho X là biến số ngẫu nhiên liên tục có hàm phân phối xác suất sau: 1 1 F(x) arctan x 4
= +π
a) Tính P 0 X 1 ( < < ) .
b) Tìm hàm mật độ xác suất của X.
1 f (x)1 x =π + .
Đáp số: a) 0,25; b) ( ) 2
Bài số 17. Cho X là biến số ngẫu nhiên liên tục có hàm phân phối xác suất sau: 1 1 x F(x) arctan 2 2
= +π
Tìm giá trị 1 x thỏa mãn điều kiện: ( 1 ) 1 P X x4
> = .
Đáp số: 1 x 2 = .
Bài số 18. Thời gian xếp hàng chờ mua hàng của khách là biến số ngẫu nhiên liên tục X với hàm phân phối xác suất như sau:
⎧ ≤
0 khi x 0
⎪ = − + < ≤ ⎨⎪ > ⎩
3 2
F(x) ax 3x 2x khi 0 x 1
1 khi x 1
a) Tìm hệ số a.
b) Tìm thời gian trung bình.
69
c)Tìm xác suất để trong 3 người xếp hàng thì có không quá 2 người phải chờ quá 0,5 phút.
Đáp số: a) a 2 = ; b) EX 0,5 = ; c) 0,875.
Bài số 19. Tỷ lệ mắc một loại bệnh trong một vùng dân cư là biến số ngẫu nhiên liên tục X có hàm mật độ như sau:
1 khi x 5,25 f (x) 20
⎧⎪ ∈ = ⎨⎪⎩ ∉
[ ] [ ]
0 khi x 5,25
a) Tính P X 10 2,5 ( − > ).
b) Tính tỷ lệ mắc bệnh trung bình và phương sai của X.
Đáp số: a) 0,75; b) 2 EX 15; 33,3 = σ = X .
Bài số 20. Cho biến số ngẫu nhiên liên tục X có hàm mật độ xác suất như sau: x m e x khi x 0 f (x) m!
− ⎧⎪ ≥ = ⎨⎪⎩ <
0 khi x 0
Tính trung bình và phương sai của X.
Đáp số : 2 EX m 1 =σ = + X .
Bài số 21. Xác suất để một con gà đẻ trong ngày là 0,6. Nuôi 5 con. 1) Tính xác suất để trong một ngày :
a) không con nào đẻ,
b) cả 5 con đẻ,
c) có ít nhất 1 con đẻ,
d) có ít nhất 2 con đẻ.
2) Nếu muốn mỗi ngày có trung bình 100 trứng thì phải nuôi bao nhiêu con gà. Đáp số: 1) a) 0,01024; b) 0,07776; c) 0,98976; d) 0,91296; 2) 167 con. Bài số 22. Một sọt cam có 10 trái trong đó có 4 trái hư. Lấy ngẫu nhiên ra 3 trái. a) Tính xác suất lấy được 3 trái hư.
b) Tính xác suất lấy được 1 trái hư
c) Tính xác suất lấy được ít nhất 1 trái hư.
d) Tính xác suất lấy được nhiều nhất 2 trái hư.
Đáp số: a) 0,033; b) 0,5; c) 0,83; d) 0,967.
70
Bài số 23. Một tổng đài bưu điện có các cuộc điện thoại gọi đến xuất hiện ngẫu nhiên, độc lập với nhau và có tốc độ trung bình 2 cuộc gọi trong 1 phút. Biết rằng số cuộc gọi trong một khoảng thời gian cố định có phân phối Poisson. Tìm xác suất để a) có đúng 5 cuộc điện thoại trong 2 phút,
b) không có cuộc điện thoại nào trong khoảng thời gian 30 giây,
c) có ít nhất 1 cuộc điện thoại trong khoảng thời gian 10 giây.
Đáp số: a) 0,1563; b) 0,3679; c) 0,2835.
Bài số 24. Xác suất để một máy sản xuất ra phế phẩm là 0,02.
a) Tính xác suất để trong 10 sản phẩm do máy sản xuất có không quá 1 phế phẩm. b) Một ngày máy sản xuất được 250 sản phẩm. Tìm số phế phẩm trung bình và số phế phẩm tin chắc nhất của máy đó trong một ngày.
Đáp số: a) 0,9838; b) E X 5; Mod X 5. ( ) = = ( )
Bài số 25. Xác suất để một máy sản xuất ra sản phẩm loại A là 0,25. Tính xác suất để trong 80 sản phẩm do máy sản xuất ra có từ 25 đến 30 sản phẩm loại A. Đáp số: 0,11927.
Bài số 26. Gieo 100 hạt giống của một loại nông sản. Xác suất nảy mầm của mỗi hạt là 0,8. Tính xác suất để có ít nhất 90 hạt nảy mầm.
Đáp số: 0,0057.
Bài số 27. Giả sử xác suất trúng số là 1%. Mỗi tuần mua một vé số. Hỏi phải mua vé số liên tiếp trong tối thiểu bao nhiêu tuần để có không ít hơn 95% hy vọng trúng số ít nhất 1 lần.
Đáp số: 299.
Bài số 28. Bưu điện dùng một máy tự động đọc địa chỉ trên bì thư để phân loại từng khu vực gởi đi, máy có khả năng đọc được 5000 bì thư trong 1 phút. Khả năng đọc sai 1 địa chỉ trên bì thư là 0,04% (xem như việc đọc 5000 bì thư này là 5000 phép thử độc lập). a) Tính số bì thư trung bình mỗi phút máy đọc sai.
b) Tính số bì thư tin chắc nhất trong mỗi phút máy đọc sai.
c) Tính xác suất để trong một phút máy đọc sai ít nhất 3 bì thư.
Đáp số: a) 2; b) 2; c) 0,3233.
Bài số 29. Giả sử tỷ lệ dân cư mắc bệnh A trong vùng là 10%. Chọn ngẫu nhiên 1 nhóm 400 người.
a) Viết công thức tính xác suất để trong nhóm có nhiều nhất 50 người mắc bệnh A.
71
b) Tính xấp xỉ xác suất đó bằng phân phối chuẩn.
Đáp số: b) 0,9599.
Bài số 30. Sản phẩm sau khi hoàn tất được đóng thành kiện, mỗi kiện gồm 10 sản phẩm với tỷ lệ thứ phẩm là 20%. Trước khi mua hàng, khách hàng muốn kiểm tra bằng cách từ mỗi kiện chọn ngẫu nhiên 3 sản phẩm.
1) Lập bảng phân phối xác suất của số sản phẩm tốt trong 3 sản phẩm lấy ra. 2) Nếu cả 3 sản phẩm được lấy ra đều là sản phẩm tốt thì khách hàng sẽ đồng ý mua kiện hàng đó. Tính xác suất để khi kiểm tra 100 kiện
a) có ít nhất 80 kiện hàng được mua,
b) có ít nhất 60 kiện được mua.
Đáp số: 1)
X 0 1 2 3
P 0 0,066 0,467 0,467
2a) 12 8,2 10 ; − ⋅ 2b) 0,0052.
Bài số 31. Một trạm cho thuê xe Taxi có 3 chiếc xe. Hàng ngày trạm phải nộp thuế 8USD cho 1 chiếc xe (bất kể xe đó có được thuê hay không). Mỗi chiếc được cho thuê với giá 20USD. Giả sử số xe được yêu cầu cho thuê của trạm trong 1 ngày là đại lượng ngẫu nhiên có phân phối Poisson với μ = 2,8.
a) Tính số tiền trung bình trạm thu được trong một ngày.
b) Giải bài toán trên trong trường hợp trạm có 4 chiếc xe.
c) Theo bạn, trạm nên có 3 hay 4 chiếc xe ?
Đáp số: a) 32; b) 24; c) Thuê 3 xe .
Bài số 32. Đường kính của một loại chi tiết do một máy sản xuất có phân phối chuẩn, kỳ vọng 20mm, phương sai 2 (0,2mm) . Lấy ngẫu nhiên 1 chi tiết máy. Tính xác suất để a) có đường kính trong khoảng 19,9mm đến 20,3mm,
b) có đường kính sai khác với kỳ vọng không quá 0,3mm.
Đáp số: a) 0,6247; b) 0,8664.
Bài số 33. Trong hệ thống tỷ giá hối đoái thả nổi, sự biến động của tỷ giá hối đoái chịu sự tác động của nhiều nhân tố và có thể xem như là biến ngẫu nhiên có phân phối chuẩn. Giả sử ở giai đoạn nào đó tỷ giá của USD với VND có trung bình là 18000đ và độ lệch chuẩn là 800đ. Tìm xác suất để trong một ngày nào đó.
a) Tỷ giá sẽ cao hơn 19000đ,
72
b) Tỷ giá sẽ thấp hơn 17500đ,
c) Tỷ giá nằm trong khoảng từ 17500đ đến 19500.
Đáp số: a) 0,1057; b) 0,266; c) 0,7036.
Bài số 34. Khối lượng của một gói đường (đóng bằng máy tự động) có phân phối chuẩn. Trong 1000 gói đường có 70 gói có khối lượng lớn hơn 1015. Hãy ước lượng xem có bao nhiêu gói đường có khối lượng ít hơn 1008g. Biết rằng khối lượng trung bình của 1000 gói đường là 1012g.
Đáp số: 24,4 gói.
Bài số 35. Lãi suất (%) đầu tư vào một dự án năm 2000 được coi như 1 đại lượng ngẫu nhiên có phân phối theo quy luật chuẩn. Theo đánh giá của uỷ ban đầu tư thì lãi suất cao hơn 20% có xác suất 0,1587, và lãi suất cao hơn 25% có xác suất là 0,0228. Vậy khả năng đầu tư mà không bị thua lỗ là bao nhiêu?
Đáp số: 0,9987.
Bài số 36. Một công ty kinh doanh mặt hàng A dự định sẽ áp dụng một trong 2 phương án kinh doanh. Ký hiệu X1 là lợi nhuận thu được khi áp dụng phương án thứ 1, X2 là lợi nhuận thu được khi áp dụng phương án thứ 2. X1 , X2 đều được tính theo đơn vị triệu đồng/ tháng) và X N 140,2500 1 ( ), X N 200,3600 . 2 ( ) Nếu biết rằng, để công ty tồn tại và phát triển thì lợi nhuận thu được từ mặt hàng kinh doanh A phải đạt ít nhất 80 triệu đồng/tháng. Hãy cho biết công ty nên áp dụng phương án nào để kinh doanh mặt hàng A? Vì sao?.
Đáp số: P X 80 0,8849 P X 80 0,9772, ( 1 2 ≥ = < ≥ = ) ( ) chọn phương án thứ 2. Bài số 37. Độ dài của 1 chi tiết máy được tiện ra có phân phối chuẩn 2 N( cm;(0,2cm) ). μ Sản phẩm coi là đạt nếu độ dài sai lệch so với độ dài trung bình không quá 0,3cm.
a) Tính xác suất chọn ngẫu nhiên 1 sản phẩm thì được sản phẩm đạt yêu cầu. b) Chọn ngẫu nhiên 3 sản phẩm. Tính xác suất có ít nhất 2 sản phẩm đạt yêu cầu . c) Nếu sản phẩm tốt mà bị loại trong kiểm tra thì mắc phải sai lầm loại 1, nếu sản
phẩm không đạt mà được nhận thì mắc phải sai lầm loại 2. giả sử khả năng mắc phải sai lầm loại 1, loại 2 lần lượt là 0,1 và 0,2. Tính xác suất để trong 3 lần kiểm tra hoàn toàn không nhầm lẫn.
Đáp số a) 0,8664; b) 0,9512; c) 0,697.
73
Bài số 38. Khối lượng của 1 loại trái cây có quy luật phân phối chuẩn với khối lượng trung bình là 250g, độ lệch chuẩn về khối lượng là 5g.
a) Một người lấy 1 trái từ trong sọt trái cây ra. Tính xác suất người này lấy được trái loại 1 (trái loại 1 là trái có khối lượng > 260g).
b) Nếu lấy được trái loại 1 thì người này sẽ mua sọt đó. Người này kiểm tra 100 sọt, tính xác suất mua được 6 sọt.
Đáp số: a) 0,0228; b) 0,019.
Bài số 39. Có hai thị trường A và B, lãi suất của cổ phiếu trên hai thị trường này là các đại lượng ngẫu nhiên có phân phối chuẩn, độc lập với nhau, có kỳ vọng và phương sai được cho trong bảng dưới đây:
Trung bình Phương sai
Thị trường A 19% 36
Thị trường B 22% 100
a) Nếu mục đích là đạt lãi suất tối thiểu bằng 10% thì nên đầu tư vào loại cổ phiếu nào?
b) Để giảm rủi ro đến mức thấp nhất thì nên đầu tư vào cổ phiếu trên cả hai thị trường theo tỷ lệ như thế nào?
Đáp số: a) nên đầu tư vào cổ phiếu trên thị trường loại A.
b) 74% vào thị trường A còn lại là thị trường B.
Bài số 40. Nghiên cứu chiều cao của những người trưởng thành, người ta nhận thấy rằng chiều cao đó tuân theo quy luật phân bố chuẩn với trung bình là 175cm và độ lệch tiêu chuẩn 4cm. Hãy xác định :
a) Tỷ lệ người trưởng thành có chiều cao trên 180cm.
b) Tỷ lệ người trưởng thành có chiều cao từ 166cm đến 177cm.
c) Giá trị 0 h , nếu biết rằng 33% người trưởng thành có chiều cao dưới mức 0 h . d) Giới hạn biến động chiều cao của 90% người trưởng thành xung quanh giá trị trung bình của nó.
Đáp số: a) 0,1056; b) 0,6793; c) 173,24; d) 6,56.
Bài số 41. Chiều dài của chi tiết được gia công trên máy tự động là biến ngẫu nhiên tuân theo quy luật phân phối chuẩn với độ lệch tiêu chuẩn là 0,01mm. Chi tiết được coi là đạt tiêu chuẩn nếu kích thước thực tế của nó sai lệch so với kích thước trung bình không vượt quá 0,02mm.
74
a) Tìm tỷ lệ chi tiết không đạt tiêu chuẩn.
b) Xác định độ đồng đều (phương sai) cần thiết của sản phẩm để tỷ lệ chi tiết không đạt tiêu chuẩn chỉ còn 1%.
Đáp số: a) 0,9545; b) ( )2 3 7,752.10− .
Bài số 42. Khối lượng X của một loại trái cây ở nông trường được biết có kỳ vọng 250gr và phương sai 81( )2
gr . Trái cây được đóng thành sọt, mỗi sọt 100 trái. Mỗi sọt được gọi là loại A nếu khối lượng không dưới 25kg. Kiểm tra ngẫu nhiên 100 sọt. Tính xác suất : a) có nhiều nhất 60 sọt loại A,
b) ít nhất 45 sọt loại A.
Đáp số: a) 0,9824; b) 0,8644.
Bài số 43. Việc kiểm tra các viên bi được tiến hành như sau: nếu viên bi không lọt qua lỗ có đường kính 1 d song lọt qua lỗ có đường kính 2 d thì viên bi được coi là đạt tiêu chuẩn, nếu không thì viên bi bị loại. Biết đường kính các viên bi sản xuất ra là biến ngẫu nhiên có phân phối chuẩn với trung bình là 1 2 d d
+ và độ lệch chuẩn là 2 1 d d
2
suất để viên bi bị loại.
− . Tìm xác
4
Đáp số: 0,0456.
Bài số 44. Một đề thi trắc nghiệm có 4 câu hỏi lý thuyết và 3 bài tập độc lập nhau. Khả năng để một sinh viên trả lời đúng một câu hỏi lý thuyết là 0,7 và đúng một bài tập là 0,5. Trả lời đúng một câu hỏi lý thuyết được 1 điểm, sai được 0 điểm. Trả lời đúng mỗi bài tập được 2 điểm, sai được 0 điểm. Tìm số điểm trung bình mà sinh viên đó đạt được.
Đáp số: 5,8.
Bài số 45. Trọng lượng sản phẩm do một máy sản xuất là ĐLNN tuân theo luật phân phối chuẩn với độ lệch chuẩn là 1,6gam. Sản phẩm được coi là đạt tiêu chuẩn nếu trọng lượng của nó sai lệch so với trung bình không quá 2gam.
a) Tính tỉ lệ sản phẩm đạt tiêu chuẩn do máy đó sản xuất.
b) Cần sản xuất tối thiểu bao nhiêu sản phẩm để xác suất "có ít nhất 100 sản phẩm đạt tiêu chuẩn" không bé hơn 90%.
Đáp số : a)0,7888; b) 134.
75
2.7. Tài liệu tham khảo
[1] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ, Lý thuyết xác suất và thống kê toán, NXB Đại học Kinh tế Quốc dân, 2012.
[2] Nguyễn Cao Văn, Trần Thái Ninh, Nguyễn Thế Hệ, Bài tập xác suất và thống kê toán, NXB Đại học Kinh tế Quốc dân, 2012.
[3] Phạm Hoàng Uyên, Lê Thị Thiên Hương, Huỳnh Văn Sáu, Nguyễn Phúc Sơn, Huỳnh Tố Uyên, Lý thuyết xác suất, NXB Đại học Quốc gia Thành Phố Hồ Chí Minh, 2015.
[4] Anderson, Sweeney, and William [2010], Statistics for Business and Economics, South-Western Cengage Learning (11th Edition).
[5] Michael Barrow, Statistics for Economics, Accounting and Business Studies Prentice Hall, 2006.
[6] Newbold Paul - Statistics for Bussiness and Economics, 5th edition - Prentice Hall, 2005.
76
Thuật ngữ chính chương 2
Tiếng Anh Tiếng Việt
Binomial random variables continuous random variable Corollary
Compute
Chi-squared distribution
Cumulative distribution function continuous random variable Discrete random variable
Density function
Gamma and Beta distributions Hypergeometric Random Variable Poisson random variable
Random variable
Integration by parts
Mean
Median
Measurable
Normal distribution
Normal random variables
Expected value
Exponential random variable Standard deviation
Parameter
Probability density function Probability function
Pareto distribution
Theorem
Uniform distribution function Variance
Biến ngẫu nhiên có phân phối nhị thức Biến ngẫu nhiên liên tục
Hệ quả
Tính toán
Phân phối Chi bình phương
Hàm phân phối
Biến ngẫu nhiên liên tục
Biến ngẫu nhiên rời rạc
Hàm mật độ
Phân phối Gamma và Beta
Biến ngẫu nhiên có phân phối siêu bội Biến ngẫu nhiên có phân phối Poisson Biến ngẫu nhiên
Tích phân từng phần
Trung bình
Trung vị
Đo được
Phân phối chuẩn
Biến ngẫu nhiên có phân phối chuẩn Giá trị kỳ vọng
Biến ngẫu nhiên có phân phối mũ Độ lệch chuẩn
Tham số
Hàm mật độ xác suất
Hàm xác suất
Phân phối Pareto
Định lý
Hàm phân phối đều
Phương sai
77
Chương 3 MẪU NGẪU NHIÊN VÀ BÀI TOÁN ƯỚC LƯỢNG
----------------------------------------------------------------------------------------------------------- Mục tiêu chương 3
Chương này giúp sinh viên:
- Phân biệt được thế nào là tổng thể và mẫu ngẫu nhiên.
- Tính được các tham số đặc trưng mẫu như trung bình, phương sai, tỷ lệ... - Nắm được bài toán ước lượng điểm và ước lượng khoảng.
- Hiểu được bài toán ước lượng khoảng và tìm được lượng khoảng như ước lượng trung bình, phương sai, tỷ lệ.
----------------------------------------------------------------------------------------------------------- 3.1. Mẫu ngẫu nhiên
3.1.1. Tổng thể nghiên cứu
Trong thực tế thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó. Chẳng hạn một doanh nghiệp phải nghiên cứu tập hợp các khách hàng thì dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp.
3.1.1.1. Định nghĩa
Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng thể. Ví dụ 3.1.
a) Nghiên cứu tập hợp các khách hàng của một doanh nghiệp theo dấu hiệu định tính - mức độ hài lòng về sản phẩm, hay định lượng - nhu cầu về số lượng sản phẩm. b) Nghiên cứu tập hợp học sinh của một lớp: định tính: học lực; định lượng: chiều cao/ cân nặng.
3.1.1.2. Các phương pháp mô tả tổng thể
Giả sử trong tổng thể, dấu hiệu nghiên cứu X nhận các giá trị X ,X ,...,X 1 2 k với k
các tần số tương ứng N , N ,..., N 1 2 k ;
∑N = N (N còn gọi là kích thước tổng thể).
i
i=1
78
a. Bảng phân phối tần số của tổng thể
X X1 X2 … Xk
Tần số N1 N2 … Nk
b. Bảng phân phối tần suất
N p = (i 1,2,...,k) N = , gọi là tần suất xuất hiện giá trị Xi
Đặt i
i
X X1 X2 … Xk
Tần suất 1 p 2 p … k p
Trong đó, kp 1; 0 p 1 i i i 1∑ = ≤ ≤ =
Nhận xét : Việc mô tả dấu hiệu X trên một tổng thể bằng các phương pháp trên cho phép chúng ta có thể coi dấu hiệu X như một biến ngẫu nhiên.
Ví dụ 3.2. Điểm thi của học sinh một trường:
X 0 1 …
Tần suất 0 p 1 p …
Mặc dù kết quả thi đã có (tất nhiên) nhưng dựa trên số liệu thống kê, điểm của một thí sinh A nào đó được coi như 1 biến ngẫu nhiên.
3.1.1.3. Các tham số đặc trưng của tổng thể:
a. Trung bình tổng thể: Là trung bình số học của các giá trị của dấu hiệu trong tổng thể, ký hiệu là μ và được tính bởi công thức:
k k
1 = N X = p X N μ ∑ ∑ (3.1)
i i i i
i=1 i= 1
Nếu xem dấu hiệu nghiên cứu như biến ngẫu nhiên X thì trung bình tổng thể chính là kỳ vọng toán của biến ngẫu nhiên đó.
b. Phương sai tổng thể: Là trung bình số học của bình phương các sai lệch giữa các giá trị của các dấu hiệu trong tổng thể và trung bình tổng thể, ký hiệu 2 σ được tính bởi công thức:
k k
1 σ = N X = p X N ∑ ∑ − μ − μ (3.2)
2 2 2
( ) ( )
i i i i
i = 1 i = 1
c. Độ lệch chuẩn tổng thể: ký hiệu là σ và được tính bởi công thức:
k
2 2
σ = σ = p X ∑ − μ (3.3)
( )
i i
i = 1
79
d. Tỷ lệ tổng thể: là tỷ số giữa số phần tử mang dấu hiệu nghiên cứu, M và kích thước của tổng thể N , ký hiệu p và được xác định
M
p = . N (3.4)
3.1.2. Mẫu ngẫu nhiên
Các tham số đặc trưng của tổng thể có thể xác định được một cách trực tiếp nếu áp dụng phương pháp nghiên cứu toàn bộ tổng thể. Tuy nhiên trong thực tế việc áp dụng phương pháp này gặp phải những khó khăn chủ yếu sau:
- Phải chịu chi phí rất lớn về thời gian, nhân lực, tiền bạc và phương tiện. - Nếu quy mô của tập hợp quá lớn có thể xảy ra trường hợp trùng hoặc bỏ sót các phần tử, sai sót trong quá trình thu thập thông tin ban đầu, hạn chế độ chính xác của kết quả phân tích.
- Nếu các phần tử của tập hợp bị phá huỷ trong quá trình nghiên cứu thì phương pháp nghiên cứu toàn bộ trở thành vô nghĩa.
- Chưa thể xác định được toàn bộ N phần tử của tổng thể.
Vì thế trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng đối với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp mẫu bằng cách chọn ra từ tổng thể n phần tử và chỉ tập trung nghiên cứu các phần tử đó. Tập hợp n phần tử này được gọi là mẫu kích thước n.
Phương pháp chọn mẫu:
- Mỗi lần lấy vào mẫu chỉ một phần tử.
- Lấy phần tử nào đưa vào mẫu là hoàn toàn ngẫu nhiên.
- Các phần tử được lấy vào mẫu theo phương thức hoàn lại.
Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X ,X ,...,X 1 2 n được thành lập từ biến ngẫu nhiên X trong tổng thể và có cùng quy luật phân phối xác suất với X, ký hiệu: T T X ,X ,...,X . = ( 1 2 n ) Ta có
E X , i 1,2,...,n ( i) = μ = và ( ) 2
i var X , i 1,2,...,n. = σ =
Ví dụ 3.3. Gọi X là số chấm thu được khi gieo một xúc xắc, X là biến ngẫu nhiên với bảng phân phối xác suất :
X 1 2 3 4 5 6
80