🔙 Quay lại trang tải sách pdf ebook Giáo Trình Xác Suất Thống Kê Ebooks Nhóm Zalo TỐNG ĐÌNH QUỲ GIÁO TRÌNH XÁC SUẤT THỐNG KÊ (Tái bán lần thử năm) NHÀ XUẤT BẢN BÁCH KHOA - HÀ NỘI LỜI NÚI ĐẨU Lý thuyết xác suất và thống kê toán học là một ngành khoa học đang giữ vị trí quan trọng trong các lĩnh vực ứng dụng rộng râi và phong phú của đời sống con người. Cùng với sự phát triển mạnh mẽ của khoa học và công nghệ, nhu cầu hiểu biết và sử dụng các công cụ ngẫu nhiên trong phân tích và xử lý thông tin ngày càng trở nên đặc biệt cần thiết. Các kiến thức và phương pháp của xác suất và thống kê đă hỗ trợ hữu hiệu các nhà nghiên cứu trong nhiều lĩnh vực khoa học khác nhau như vật lý, hóa học, sinh y học, nông học, kinh tế học, xã hội học, ngôn ngữ học... Trong một chục năm gần đây, giáo trình xác suất thông kê đã trở thành cơ sở của nhiều ngành học trong các trường đại học và cao đẳng, từ đó xuất hiện nhu cầu học tập và nghiên cứu ứng dụng rất lớn, nhất là đôi với sinh viên các ngành khoa học không chuyên về toán. Để thoả mãn yêu cầu đó, giáo trình này cố gắng đáp ứng đòi hỏi của đông đảo sinh viên nhằm hiểu biết sâu sắc hơn các khái niệm và phương pháp tính xác suất và thông kê để học tập đạt hiệu quả cao hơn cũng như ứng dụng môn học vào ngành học và môn học khác. Giáo trình xác suất thống kê được viết cho thời gian giảng dạy là 60 tiết học. Do đối tượng sinh viên rất đa dạng với trình độ toán cơ bản khác nhau, chúng tôi đã cố gắng tìm những cách tiếp cận đơn giản và hợp lý, và như vậy đã buộc phải bớt đi phần nào sự chặt chẽ hình thức (vốn rất đặc trưng cho toán học) để giúp bạn đọc tiếp cận dễ dàng hơn bản chất xác suất của các vấn đề đặt ra và tăng cường kỹ năng phân tích, xử lý các tình huống, từ đó dần dần hình thành một hệ thống khái niệm khá đầy đủ để đi sâu giải quyết các bài toán ngày càng phức tạp hơn. Giáo trình được chia thành 6 chương gồm 3 chương dành cho phần xác suất và 3 chương cho phần phân tích thống kê. Nhũmg khái niệm và công thức cơ bản được trình bày tương đối đơn giản, dễ hiểu và được minh hoạ bằng nhiều thí dụ áp dụng. Các chứng minh khó được lượt bớt có chọn lọc để giáo trình không quá cổng kềnh, mặc dù vậy các công thức và vấn đề liên quan đều được nhắc đến đầy đủ để tiện không chỉ cho học tập sâu hơn, mà còn có ích cho những bạn đọc muốn tra cứu, tìm tòi phục vụ cho ứng dụng và tính toán thống kê. Cuối mỗi chương có một loạt bài tập dành để bạn đọc tự giải nhằm hiểu biết sâu sắc hơn lý thuyết và rèn luyện kỹ năng thực hành. Hy vọng rằng giáo trình có ích cho bạn đọc xa gần, các sinh viên, cán bộ giảng dạy ở các trường đại học và cao đẳng, các cán bộ khoa học và kinh tế muốn tự học và tự nghiên cứu xác suất thống kê - môn học thường được coi là khó tiếp thu. Tác giả cũng cám ơn mọi ý kiến góp ý để quyển sách sẽ ngày càng được hoàn thiện hơn để góp phần nâng cao chất lượng dạy và học môn học này. Trong lần tái bản này tại Nhà xuất bản Bách Khoa - Hà Nội, một số lỗi chế bản đã được sửa chữa. Tác giả một lần nữa tỏ lời cảm ơn đẽn những ý kiến góp ý của đông đảo bạn đọc để cải tiến giáo trình trong lần tái bản tiếp theo. TÁC GIẨ Chương I sự ■ KIỆN NGẪU NHIÊN VÀ PHÉP TÍNH XÂC SUẤT m §1.KHÁI NIỆM Mỏ ĐẦU 1.1. Sự kiện ngẫu nhiên Khái niệm thường gặp trong lý thuyết xác suất là sự kiện (mà không thể định nghĩa chặt chẽ). Sự kiện đưỢc hiểu như là một sự \âệc. một hiện tượng nào đó của cuộc sông tự nhiên và xã hội. Khi thực hiện một tập hợp điều kiện xác định, nói tắt là bộ điều kiện, gọi là một phép thử, có thể có nhiều kễt cục khác nhau. Thí dụ 1.1. Gieo một con xúc sắc đồng chât trên một mặt phẳng (phép thử). Phép thử này có 6 kết cục là: xuất hiện mặt 1, mặt 2,..., mặt 6 chấm. Mỗi kết cục này cùng với các kết quả phức tạp hơn như: xuất hiện mặt có sô" chấm chẵn, mặt có sô" chấm bội 3, đều có thể coi là các sự kiện. Như vậy kết cục của một phép thử là một trưòng hỢp riêng của sự kiện. Để cho tiện lợi sau này, ta ký hiệu sự kiện bằng các chữ cái in hoa A, c, ... Sự kiện được gọi là tất yếu, nếu nó chắc chắn xảy ra, và đưỢc gọi là bất khả. nếu nó không thể xảy ra khi thực hiện phép thử. Còn nếu sự kiện có thể xảy ra hoặc không sẽ đưỢc gọi là sự kiện ngẫu nhiên. Từ đó, theo một nghĩa nào đó, có thể coi các sự kiện tâ't yếu, ký hiệu là ư, và bât khả, ký hiệu là V, như các trường hỢp riêng của sự kiện ngẫu nhiên. Thí dụ, dưói những điều kiện xác định, nưốc đóng báng ở 0'^C là sự kiện tất yếu; khi gieo một con xúc xắc, việc xuât hiện mật bảv chà"m là sự kiện bất khả... 5 Để mô tả một phép thử người ta xác định tập hỢp các kết cục có thể có. Tập hỢp tất cả các kết cục của một phép thử (đưỢc gọi là các sự kiện sơ cấp, ký hiệu là coỊ) tạo thành không gian các sự kiện sơ cấp, ký hiệu là Q = {cúịj i e /}, I là tập chỉ sô", có thể vô hạn (đếm đưỢc hoặc không đếm đưỢc). Dễ thấy trong thí dụ 1 .1 , nếu ký hiệu Aị — sự kiện xuất hiện mặt i chấm (i = 1,6) thì Q = A2, A3, A4, A5, Ag} = {A„ i = 1,6}. Trong nhiều hiện tưỢng hàng loạt khi thực hiện nhiều lần cùng một phép thử, ta thây tần suất xuất hiện một sự kiện A nào đó chênh lệch không nhiều so vói một sô' đặc trưng cho khả năng xuất hiện A. Số đó đưỢc gọi là xác suất xuất hiện A và được ký hiệu là P(A). Như vậy nếu viết P(A) - p c6 nghĩa là xác suâ^t xảy ra sự kiệnA là bằngp. Một câu hỏi tự nhiên là. Do đâu có sự kiện ngẫu nhiên? Và chúng ta có thể nhận biêt đưỢc chúng không? Thực ra mỗi sự kiện đều xảy ra theo quv luật nào đó; song do điều kiện Lhiêu tri thức, thông tin và phương tiện cần thiết (cả về kinh phí, thiết bị lẫn thòi gian) nên ta không có khả năng nhận thức dầy dủ về sự kiện đó. Vấn đề càng trỏ nên khó khàn hơn khi chỉ cần có một sự thay dổi bâ"t ngò dù rất nhỏ của bộ điều kiện dã làm thay đổi kết cục của phép thử. Cho nên bài toán xác định bản chất xác suâ^t của một sự kiện bất kỳ trong một phép thử tùy ý là không thể giải đưỢc. 1.2. Phép toán và quan hệ của các sự kiện Về mặt toán học, việc nghiên cứu quan hệ và phép toán trên tập các sự kiện cho phép ta xác định chúng thực chất hơn. (i) Tổng của A và B, ký hiệu là A + 5 , chỉ sự kiện khi có xuất hiện ít nhất một trong hai sự kiện trên. (ii) Tích của A và B, ký hiệu là AB, chỉ sự kiện khi có xuâ"t hiện đồng thồi cả hai sự kiện trên. 6 (iii) Đối lập của A, ký hiệu là A, chỉ sự kiện không xuất hiện A. Rõ ràng đối lập có tính tương hỗ A = A và A + A = u, A Ã = V, ữ = y. (iv) Xung khắc: hai sự kiện A vầ B được gọi là xung khắc nếu chúng không thể đồng thời xảy ra, tức là AB = V. (v) Kéo theo, ký hiệu A => B, chỉ nếu xuất hiện A thì xuất hiện B. (vi) Tương đương, ký hiệu A = B, chỉ việc nếu xuất hiện A thì xuất hiện B và ngưỢc lại. (vii) Hiệu của A và B, ký hiệu A - B (hoặc A\B), chỉ sự kiện xuất hiện A nhưng không xuất hiện B, tức là A - jB = AB. Các khái niệm cho thấy tính đối lập, tổng, tích và hiệu của hai kiện tương ứng vối bù, hợp, giao và hiệu của hai tập hỢp. Như vậy có thể sử dụng các tính chất của các phép toán trên tập hỢp cho các phép toán trên sự kiện, chẳng hạn dùng sơ đồ Ven trong thí dụ sau đây. Thí dụ 1.2. Ký hiệu u là tập vũ trụ, V là tập 0 (rỗng). Khi đó A và sẽ là các tập con của u và các phép toán trên A v à B có thể minh họa bằng sơ đồ Ven (xem hình 1 .1). Tập vũ trụ Đối lập A khắc (ẬB = 0) Kéo theo A => B Tống A + B Hình 1.1 Tích AB Từ đó, dễ dàng chỉ ra các công thức sau; A + B = B + A, AB = BA (giao hoán); A + (B + Q = {A + B) + C, A(BC) = (AB)C (kết hỢp); A(B + o = AB + AC (phân phối); A + Ư = U , A + V = A , A + A = A ; AU = A , A V = V , A A = A . Thí dụ 1.3. Chọn từ một lô hàng ra 5 sản phẩm và ta quan tâm đến sô"phế phẩm trong 5 sản phẩm đó (phép thử). a) Xác định các sự kiện sơ cấp. b) Biểu diễn các sự kiện sau theo các sự kiện sơ cấp: có nhiều nhất 1 phế phẩm; có không quá 4 phế phẩm, có ít nhất 1 phế phẩm. Giải, a) Ký hiệu Aị - trong 5 sản phẩm có ỉ phế phẩm. Rõ ràng i = 0,5 và Q = {Ao, A „ A 2, A 3, A ị , A 5I. b) Gọi A, B và c là các sự kiện tương ứng. Dễ dàng biểu diễn A = Aq + Aị, B — Aq + A| + A2 + Ag + Aị = A-, c = Aj + Av + A3 + A4 + A5 - Aq. Thí dụ 1.4. Cho sơ đồ mạng điện trên hình 1.2 gồm 3 bóng đèn. Việc mạng mất điện (sự kiện A) chỉ có thể xảy ra do cháy các bóng đèn Ọíý hiệu là Aj, A2, A3). Hãy biểu diễn A theo các ỉ = 1, 2, 3). Giải. A xuất hiện khi xảy ra một trong 3 trường hỢp: ___^ (i) cả ba bóng cháy, (ii) cháy hai bóng 1 và 2, (iii) cháy hai bóng 1 và 3. Hình 1.2 Từ đó ta có A = A 1A2A3 + AịA^A.j + A, A,Ạ,. 8 Có thể dùng tính chất của mạng song song và nốì tiếp để có một biểu diễn khác gọn hơn: A =A,(A2 + A 3). Trong nhiều bài tập, việc xác định sô" lượng các sự kiện sơ cấp đưa đến sử dụng các kết quả của lý thuyết tổ hỢp. 1.3. Giải tích kết hợp Việc đếm sô" các kết cục của một phép thử dựa vào mô hinh: chọn hú họa ra k phần tử từ n phần tử cho trưốc. Nếu phân biệt thứ tự các phần tử chọn ra, ta có khái niệm chỉnh hỢp; nếu thứ tự không phân biệt, ta có tổ hợp. (i) Chinh hỢp: chỉnh hỢp chập k từ n ỉà một nhóm có thứ tự gồm k phần tử lấy từ n đã cho. Đó chính là một nhóm gồm k phần tử khác nhau được xếp theo thứ tự nhất định. Sô" các chỉnh hỢp như vậy, ký hiệu là (k < TÌ). = n{n - l)...(n - Ã + 1) = ^ (1 .1) {n-k)\ (ii) Chỉnh hỢp lặp: chỉnh hợp lặp chập Ấỉ từ n là một nhóm có thứ tự gồm k phần tử có thể giống nhau lấy từ n đã cho. Đó chính là một nhóm gồpn k phần tử có thể lặp lại và được xếp theo thứ tự nhất định, số các chỉnh hỢp lặp như vậy, ký hiệu lặ ĂÌ=n'‘. (1 .2) (iii) Hoán vị: hoán vị của n là một nhóm gồm n phần tử đưỢc sắp xếp theo một 'thứ tự nào đó. Rõ ràng số các hoán vị như vậy, ký hiệu là p„, chính là số các chỉnh hỢp A" và p„ = n\ .(1.3) (iv' Tổ hỢp: tổ hỢp chập ^ từ n là một nhóm (không phân biệt i;!ứ tự) gồm k phần tử khác nhau lấy từ n đã cho. Số các tổ' hỢp r.hu vậy, ký hiệu là (k < n) 9 = ^ (1.4) " k\ k\{n-k)\ Thí dụ 1.5. Cho một tập hỢp gồm 3 phần tử {a, 6, c}. Có thế tạo ra bao nhiêu nhóm gồm 2 phần tử chọn từ tập trên? Giải: (i) Nếu ta để ý đến thứ tự các phần tử và mỗi phần tử chỉ đưỢc chọn một lần, sô" nhóm thu được sẽ là = 3.2 = 6; đó là {a, 6}; {6, a}; {a, c}; {c, a}; {b, c}, {c, b}. (ii) Nếu vẫn để ý đến thứ tự, nhưng mỗi phần tử được chọn nhiều lần, số nhóm thu được trở thành Ag = 3^ = 9; đó là: {a, 6}; ịb, a}; {a, c}; {c, a}; {ồ, c), {c, 6}; {a, a)\ {b, 6}; ịc, e}. (iii) Nếu không để ý đến thứ tự các phần tử và chúng chỉ được chọn một lần, sô" nhóm thu đưỢc trở thành c | = 3; đó là {a, 6}; {a, c}; {ồ, c}. Thí dụ 1.6. Một lổp phải học 6 môn trong học kỳ, mỗi ngày học 3 môn. Hỏi có bao nhiêu cách xếp thòi khóa biểu trong 1 ngày? Giải. Sô" cách xếp cần tìm chính là sô" cách ghép 3 môn từ 6 món, trong đó các cách ghép sẽ khác nhau nếu có ít nhất một môn khác nhau hoặc thứ tự môn khác nhau. Từ đó theo (1 .1) ta có số cách cần tìm là Aị = 6.5.4 = 120. Thí dụ 1.7. Có thể đánh số được bao nhiêu xe nếu chỉ dùng 3 con sô" từ 1 đến 5? Giải. Mỗi sô" thứ tự của một xe dễ thấy là chỉnh hỢp lặp chập 3 từ 5. Từ đó theo (1.2) ta có sốlượng xe được đánh số sẽ là Ă\ = 5^ = 125. Thí dụ 1.8. Có bao nhiêu cách lập một hội đồng gồm 3 người chọn trong số 8 ngưòi? 10 Giải. Hội đồng là một nhóm 3 người lấy từ 8 người, do đó theo (1.4) sẽ có Cg = 8!/(3!5!) = 56 cách lập. Cuối cùng, để ý là ta đã rất quen thuộc với khái niệm tổ hỢp được dùng trong công thức nhị thức Niu-tơn (x + aỴ = c°x’' + C>"^'a +... + +... + C"a\ ^ ' n n n n Từ đó có thể dễ dàng chứng minh (để ý c° = = 1) c ' c* =C^í +c* n n ^ n n.-l, n -1 §2. CÁC ĐỊNH NGHĨA CỦA XÁC SUẤT 2.1. Định nghĩa cổ điển Trong mục này ta làm việc với các phép thử có kết cục đồng khả năng. Khái niệm đồng khả năng đóng vai trò chủ đạo và khó có thể định nghĩa một cách hình thức. Xét thí dụ đơn giản sau đây: Thí dụ 2.1. Trong một hộp có n viên bi giông nhau về kích cỡ và chỉ khác nhau về màu sắc, trong đó có m bi trắng vầ n - m bi đỏ. Rút hú họa ra một viên bi (phép thử). Do sô" viên bi là n nên tổng số các kết cục khác nhau sẽ là n, và vì tính giông nhau của chúng nên mỗi viên bi có cùng khả năng đưỢc rút. Bây giò nếu gọi A là sự kiện rút được bi trắng thì trong sô" n kết cục đồng khả năng có m kết cục thuận lợi cho A. Vì vậy trực giác cho thấy nên chọn tỷ sô" mln làm xác suất của việc xuâ't hiện A. Đinh nghĩa. Cho một phép thử với n kết cục đồng khả năng, trong đó có m kết cục thuận lợi cho A, khi đó , X m số kết cuc thuân lơi cho A /o 1 \ P{A) = — = ....- , ■,— — . (2.1) n tống sô kết cục có thê 11 Định nghĩa trên được gọi là định nghĩa cổ điển của xác suất. Cách tính xác suất theo (2.1) có ưu điểm là tương đối đơn giản và trực quan, tuy nhiên phạm vi áp dụng rất hạn chê chỉ cho các loại phép thử gồm hữu hạn kết cục đồng khả năng. Trong tính toán thường sử dụng các kết quả (1.1) - (1.4). Thí dụ 2.2. Gieo đồng thòi 2 con xúc sắc giống nhau. Tính xác suất để tổng sô' chấm thu được bằng 6. Giải. Phép thử có 6.6 = 36 kết cục (sự kiện sơ cấp) khác nhau đồng khả năng. Gọi A là sự kiện “tổng sô" chấm bằng 6”, thì có tất cả 5 kết cục thuận lợi cho A là {1,5}, {2,4}, {3,3}, {4,2} và {5,1} (số thứ nhất chỉ sô" chấm của con xúc sắc 1 , sô" thứ 2 - số chấm của con xúc sắc 2). Vậy P(A) = 5/36. Thí dụ 2.3. Trong hộp có 4 viên bi trắng và 6 viên bi đỏ cùng kích cõ. Rút hú họa ra 2 bi, tính các xác suất để trong đó có: a) hai viên trắng; b) ít nhất 1 viên đỏ; c) viên thứ hai đỏ. Giải. Ta dùng định nghĩa cổ điển ở trên. a) Tổng số cách để rút ra 2 bi có quan tâm đến thứ tự là Afo = 10.9 = 90, trong đó số cách thuận lợi cho A - rút được 2 bi trắng - là Al = 4.3 = 12; vậy xác suất cần tìm P(A) = 12/90 = 2/15. Có thể sử dụng khái niệm tổ hỢp để tính xác suất: tổng sô" cách lấy ra 2 bi từ 10 viên bi là cf(j (không quan tâm đến thứ tự), trong đó để rút ra 2 bi trắng có C4 cách. Từ đó ta có cùng kết quả như trên. b) Có thể tính trực tiếp xác suất của B - sự kiện rút được ít nhất 1 bi đỏ (tức là hoặc được 1 hoặc cả 2 bi đỏ). Dễ thấy sự kiện đối lập B - cả 2 bi đều trắng - đã có xác suất hiện bằng 2/15. Từ đó P(B) = 1 - P(B) = 13/15 (xem tính chất của xác suất ngay dưới đây). 12 c) Gọi c là sự kiện viên bi thứ hai màu dỏ. số cách thuận lợi cho c bao gồm (có quan tâm đến thứ tự): 6.5 = 30 cách đối với trường hỢp viên bi đầu màu đỏ và 4.6 = 24 cách đòì với trưòng hỢp bi đầu màu trắng. Từ đó P(C) = (30 + 24)/90 = 3/5. Có thể lý luận đơn giản hơn như sau: do viên bi đầu không biết màu sắc nên thông tin về tỷ lệ màu không thay đổi vói viên bi thứ hai. Vậy sự kiện c sẽ có cùng xác suất với việc rút hú họa ra 1 bi đỏ từ hộp 10 viên ban đầu và xác suất của sự kiện đó rất dễ tính là 6/10 = 3/5. Dùng công thức (2.1) dễ dàng chứng minh các tính chất sau đây của xác suất (đúng cho cả các trường hỢp định nghĩa khác): (i) 1 > P(A) > 0; (li) P(ơ) = 1 ; P(V) = 0; (iii) Nếu A, B xung khắc thì P(A + B) = P(A) + P{B)-, (iv) P(Ã) = 1 -P(A ); (v) Nếu A B thì P{A) < P{B). Đe khắc phục hạn chế của (2.1) chỉ áp dụng cho các phép thử có hữu hạn kết cục, người ta đưa ra định nghĩa hình học cúa xác suất. Gải sử tập hợp (vô hạn) các kết cục đồng khả năng của một phép thử có thể biểu thị bởi một miền hình học G (chẳng hạn đoạn thẳng, một miền mặt cong hoặc khôi không gian...), còn tập các kết cục thuận lợi cho A bởi một miền con nào đó s c G. Sẽ rất hỢp lý nếu ta định nghĩa xác suất bằng tỷ số độ đo của s vối G (phụ thuộc vào s và G mà độ đo có thể là độ dài, diện tích hoặc thể tích...). Như vậy ta có P(A) bằng xác suất để điểm‘gieo rơi vào s , vối giả thiết nó có thể rơi đồng khả năng vào các điểm của G và đ ậ đ o ^ (2 .2) độđoG 13 Khái niệm “rơi đồng khả năng vào G” có nghía là điểm gieo có thể rơi vào bất kỳ điểm nào của G và xác suất để nó rơi vào một miền con nào đó của G tỷ lệ vói độ đo của miền ấy, mà không phụ thuộc vào vị trí và hình dạng của miền. Thí dụ 2.4. Đưòng dây điện thoại ngầm nôl một tổng đài với một trạm dài Ikm. Tính xác suất để dây đứt tại nơi cách tổng đài không quá lOOm. Giải. Rõ ràng nếu dây điện thoại đồng chất, khả năng nó bị đứt tại một điểm bất kỳ là như nhau, nên tập hỢp các kết cục đồng khả năng có thể biểu thị bằng đoạn thẳng nối tổng đài với trạm. Các kết cục thuận lợi cho A - sự kiện chỗ đứt cách tổng đài không quá lOOm - được biểu thị bằng đoạn thẳng có độ dài lOOm. Từ đó theo (2.2) P(A) = 100/1000 = 0,1. Một số bài toán thực tế khác có thể đưa về mô hình dạng trên. Chú ý rằng theo cách định nghĩa này thì sự kiện có xác suất bằng 0 vẫn có thể xảy ra (chảng hạn mũi tên bắn trúng một điểm cho trưóc...)- Tính chất này rất đặc trưng cho các biến ngẫu nhiên liên tục sẽ nghiên cứu ở chương II. 2.2. Định nghĩa thống kê Điều kiện đồng khả năng của các kết cục một phép thử không phải lúc nào cũng được bảo đảm. Có nhiều hiện tượng xảy ra không theo các yêu cầu của định nghĩa cổ điển, chẩng hạn khi tính xác suất một đứa trẻ sắp sinh là con trai, ngày mai tròi mưa vào lúc chính ngọ, v.v... Có một cách khác để xác định xác suất của một sự kiện. Giả sử tiến hành một loạt «1 phép thử cùng loại, nếu sự kiện A nào đó xuất hiện trong mj phép thử thì ta gọi mj/rỉ, là tần suất xuất hiện A trong loạt phép thử đã cho. Tương tự với loại phép thử thứ hai, thứ ba... ta có các tần suất tương ứng mjn 2, rnJn:Ị,... 14 Trên cơ sở quan sát lâu dài các thí nghiệm khác nhau ngưòi ta nhận thấy tần suất xuât hiện một sự kiện có tính ổn định, thay đổi rất ít trong các loạt phép thử khác nhau và dao động xung quanh một hằng sô" xác định. Sự khác biệt đó càng ít khi sô' phép thử tăng nhiều lên. Hơn nữa đối với các phép thử xét ở mục 2.1 hằng sô" xác định đó trùng vối xác suất theo định nghĩa cổ điển. Đặc tính ổn định của tần suất khi sô” phép thử tăng lên khá lớn cho phép ta định nghía xác suất của sự kiện là trị sô" ổn định đó của tần suất xuâ^t hiện sự kiện. Nhưng do hằng sô^ đó chưa biết, nên người ta lấy ngay tần suất khi sô" phép thử đủ lớn làm xác suất của sự kiện. Cách hiểu như vậy đưỢc gọi là định nghĩa thống kê của xác suất. Như vậy xác suất ở đây là mộr giá trị gần đúng và nhiều ngưòi cho rằng đó không phải là một định nghĩa thật sự. Tuy nhiên, trong nhiều ngành khoa học thực nghiệm xác suất đưỢc xác định theo cách này đạt độ chính xác khá lớn và rất phù hỢp với thực tế cũng như với tính toán lý thuyết, nhiều khi sai sô’phạm phải bé hơn nhiều so với sai sồ^ đo của thí nghiệm. Vì thế định nghĩa thông kê vẫn được thừa nhận rộng rãi và rất có ý nghla. Ta có thể định nghía chặt c}'iẽ hơn về mặt toán học như sau: xác suâ^t của sự kiện là giới hạn của tần suất xuất hiện sự kiện đó khi số^ phép thử tăng vô hạn. Sự hỢp lý của định nghĩa đvíỢc minh chứng không chỉ bằng thực nghiệm mà cả bằng lý thuyết (sau này ta sẽ thấy rõ trong luật sô lốn Béc-nu-li). Có nhiều thí dụ minh họa tính ổn định của tần suất khi sô" phép thử khá lớn. Ta có thể tham khảo dưới đây các tần suất xuất hiện mặt sâp khi gieo một đồng tiền nhiều lần: Người thí nghiệm S ố lần gieo s ố lần sấp Tần su ất Buýt-phông 4040 2048 0,5080 Piếc-xơn 12000 6019 0,5016 Piếc-xơn 24000 12012 0,5005 15 Một thí dụ khác: có thể cho rằng xác suất phân rã của một nguyên tử Ra"^® sau 100 năm là 0,04184 (với độ chính xác tôi 5 chữ số sau dấu phảy); ở đây số lượng nguyên tử tham gia thí nghiệm rất lớn (cỡ 10^® - 10^'*). Có thể kiểm tra được rằng xác suất định nghĩa theo thống kê thỏa mãn các tính chất trình hày ở mục trước. Chú ý ỉà trong định nghĩa phải có điều kiện các phép thử lặp ỉại nhu nhau, điều này trên thực tế không dễ bảo đảm nên tần suất có thể phụ thuộc vào thời gian. Mặc dù vậy phương pháp xác định xác suất theo tần suất có phạm vi ứng dụng rất lớn trong nhiều ngành khoa học và kỹ thuật. Mặt khác, điểm xuất phát để xây dựng lý thuyết xác suất như là một khoa học cũng chính là việc quan sát tính ổn định thông kê của các tẩn suất của vô vàn các hiện tượng thực tế. Từ đó dễ hiểu vì sao có thể định nghĩa lỵ thuyết xác suất như là một khoa học nghiên cứu các mô hình toán học của các hiện tưđng ngẫu nhiên có tầii suất ổn định. 2.3. Định nghĩa tiên để Các định nghĩa cổ điển và thống kê của xác suất có nhiều hạn chế để xây dựng một lý thuyết tổng quát. Khái niệm cổ điển không dùng được trong trường hỢp không thể xây dựng một hệ thống đầy đủ các sự kiện đồng khả năng. Trong khi đó, tần suất chỉ là một giá trị xấp xỉ để đánh giá xác suất, chưa kể đòi hỏi là sô" quan sát phải rất lớn và giá trị tần suất tìm được phải lốn hơn nhiều sai sô" đo và cả sai số tính toán. Chúng ta bắt đầu từ hệ thống các tiên đề dưới dạng do Kôn-mô-gô-rôp phát biểu. Các tiên đề đó (giông như các tiên đề toán học khác) đưỢc thừa nhận là đúng đắn, tất nhiên căn cứ vào kinh nghiệm cuộc sôVig và hoạt động thực tiễn. Cách tiếp cận này liên hệ chặt chẽ lý thuyết xác suất với lý thuyết hàrn sô’ và tập hỢp. Cách xác định xác suất theo tiên đề sẽ chứa 16 trong nó các định nghĩa cổ điển và thống kê của xác suất như là các trường hỢp riêng. Ta quay trở lại không gian các sự kiện sđ cấp Q (xem §1), còn bản thân các phần tử là gì không quan trọng. Tiếp theo xác định hệ thống (Ả các tập hỢp con của Q, các phần tử của dl được gọi là các sự kiện ngẫu nhiên. Ta đặt cho cA các yêu cầu hợp lý sau: (i) chứa (ii) Nếu AvàiB & CẢ thì A , B , A + B, AB e C Á . Hệ thống cị thỏa măn các điều kiện trên được gọi là đại số Bun. Nếu ta yêu cầu thêm (iii) Nếu A2: A„. ... là các phần tử của cA, thì tổng và tích vô hạn Aj + A2 + ... + + .... AiA, ... A„... cũng.thuộc CÃ. Nếu thỏa mãn thêm điều kiện (iii) ta có một trường Bô-ren, hay ơ - đại sô'. Bây giò ta đã có thể định nghĩa xác suất: Định nghĩa. Ta gọi xác suất trên (Q, c//) là một hàm số xác định trên íA có giá trị trong [0; 1] và thỏa mãn 3 tiên đề (T,)P(fi) = l; (T2) P(A + B) = P{A) + P{B) (A, B xung khắc); (T;j) Nếu dãy {A,,} có tính chất Aj => Aị, V ỉ <_/ và A,A2...A„... = V, thì P(A„) >0. Xuất phát từ hệ tiên để trên có thể chứng minh đưỢc các tính chất của xác suất đã trình bày ở §1 , hoặc chính chúng đã là các tính chất đó (tiên đề 1 và 2). Chú ý rằng hệ tiên đề này chưa đầy đủ: ứng vối một tập Q có thể chọn xác suất theo nhiều cách khác nhau. Người ta có thể thay tiên đề 2 và 3 bằng một tiên đề có tên là tiên đề cộng mở rộng: 17 (TJ Nếu dãy {AJ có tính chất xung khắc từng đôi và A = ^ G th ì rt=i P(A) = P(A,) + P(A,) + ... P(A„) + ... = ỵ P ( A J . n=ì Để kết luận, có thể nói rằng cách định nghĩa xác suất ở đây nhìn từ quan điểm của lý thuyết tập hỢp chính là sự đưa vào cùng với Q một độ đo không âm, trực chuẩn, cộng tính, xác định cho mọi phần tử của tập <Ẩ. Như vậy khi định nghĩa xác suất chúng ta phải có không chỉ tập Q các sự kiện sơ cấp ban đầu, mà còn phải có tập các sự kiện ngẫu nhiên CẨ và hàm sô" p xác định trên đó. Tổ hợp {Q, c4 , P} sau này thường được gọi là không gian xác suất. §3. XÁC SUẤT CÓ ĐIỀU KIỆN 3.1. Khái niệm• Thực ra mọi xác suất P(A) đều là có điều kiện, vì sự kiện A xảy ra khi thực hiện một bộ điều kiện xác định. Tuy nhiên, nếu ngoài bộ điều kiện đó ra còn có thêm điều kiện khác thể hiện bằng việc xuất hiện B nào đó, thì người ta đưa ra một khái niệm mới: xác suất có điều kiện của A biết rằng đã xảy ra B, ký hiệu là P(Ạ B). Bằng trực giác ta cũng thấy rằng khi có B với P(B) > 0 thì nói chung “khả năng” xuất hiện A cũng thay đổi; đặc biệt nếu AB = V khả năng đó triệt tiêu, còn nếu B ^ A thì khả năng trở thành tất yếu. Vậy là, vối điều kiện đã có B, người ta xác định một cách tự nhiên khả năng xuất hiện A nào đó bằng một số tỷ lệ vối P(AB), tức là số có dạng kP(AB), k > 0. Để xác định hằng số k đó, do P{A IB) = kP(AB) là một xác suất và ta chọn A = B, P(B I fi) = 1 , nên kP{B) = 1 . Từ đó 18 k =P{B) Đ ịnh nghĩa 1. Giả sử trong một phép thử ta có P(B) > 0. Khi đó xác suất có điều kiện của sự kiện A nào đó, biết rằng đã có B, sẽ là một số không âm, ký hiệu là: P{A B) = P{AB) P(B)(3.1) Để ý rằng nói chung P(A) ^ P(A B). Ngoài ra xác suất có điều kiện có mọi tính chất của một xác suất bình thường. Thí dụ 3.1. Gieo 2 con xúc sắc giống nhau. Tính xác suất để ta có tống số chấm thu đưỢc bằng 6, biết rằng tổng đó là một sô" chẵn. Giải. Ta đã biết P(A) - 5/36 (xem thí dụ 2.2, A là sự kiện xuất hiện tông chấm bằng 6). Nếu ký hiệu B là sự kiện xuất hiện tổng chấm chẵn, thì điều kiện để tính P{A Is) đã thay đổi, tổng sô chẵn chỉ tương ứng với 18 kết cục của phép thử gieo 2 con xúc sác. Từ đó P(A IB) = 5/18. Thí dụ 3.2. Rút từ bộ bài tú lơ khơ 52 con lần lượt ra 2 con bài. Tìm xác suất để con thứ hai là át, biết rằng con thứ nhất đã là át. Giải. Dễ thấy nếu ký hiệu Ai là sự kiện con thứ i là át (i = 1,2), thì P(A, A,) = 1, tương đương với việc do đã có 51 17 A|, việc tính xác suất sự kiện đưa về tính trong trường hỢp chỉ còn 51 con bài với 3 con át trong đó. Đ ịnh nghĩa 2. Ta nói rằng A và B độc lập (thống kê), nếu P(A 1B) = P(A) hoặc P(B \A) = P(B). (3.2) Như vậy nếu A, B độc lập việc xuất hiện sự kiện này không làm thay đổi xác suấ"! của sự kiện kia. Tuy nhiên việc kiểm tra tính chất (3.2) trong thực tiễn râ't khó khăn và trong nhiều 19 trường hỢp là không thể. Vì vậy dựa vào thực tê và trực giác mà ta thừa nhận các sự kiện độc lập trong các bài tập sau này. Công thức tương đương của (3.2), có để ý đến (3.1) là: P(AB) = P{A)P{B). (3.3) Đ inh nghĩa 3. Ta nói bộ sự kiện Ai, Ag, độc lập (hay độc lập trong tổng thể) nếu P(a X . . . A,^) = P(A,;)P(A. )... P ( \ ) (3.4) vói mọi dãy (ỉi, ik) gồm các số nguyên khác nhau lấy từ {1 , 2, n}. Thí dụ 3.3. Gieo hai lần một đồng tiền, và ta có 4 kết cục đồng khả năng iS - ký hiệu mặt sấp, N - mặt ngửa) fì = {SS, SN, NS, NN]. Rõ ràng các sự kiện A = SS + S N , B = s s + NS, c = s s + NN là độc lập từng đôi do P{A) = P(B) = P(0 - —; còn P{AB) 2 P(AC) = P{BƠ) ~ — thỏa mãn (3.3). Tuy nhiên chúng không 4 độc lập trong tổng thể do P{ABC) = - ^ P{A)P(B)P(C) = 4 8 Như vậy không nên nhầm lẫn hai khái niệm độc lập trong các định nghĩa 2 và 3. Khái niệm độc lập trong tổng thể kéo theo độc lập từng đôi (do (3.3) là trường hỢp riêng của (3.4) khi k - 2), nhưng ngưỢc lại nói chung không đúng. 3.2. Công thức cộng và nhân xác suất l. Công thức nhân xác suất P(AB) = P(A)P(B IA) = P(B)P(A IB). {8.5) Đó là hệ quả trực tiếp suy ra từ (3.1). Từ (3.5) có thể dẫn ra các kết quả quan trọng: 20 (i) Nếu A, B độc lập thì P(AB) = P{A)P{B) (xem 3.3)). (ii) Mở rộng cho tích n sự kiện P{AA,...A„) = = P{A,)P{A, IA,)P(A., IA,A,)..,P(A„ I (3.6) (iii) Nếu A,A;,, ... A„ độc lập trong tổng thể, thì: p A: \ 1 = 1 /^1 P(A). 2. Cồng thức cộng xác suất P(A ^B) = P(A) -f P{B) - P(AB). (3.7) Việc chứng minh công thức trên không có gì quá phức tạp (nhất là từ các tiên để của mục 2.3). Từ (3.7) có thể dẫĩl ra các kết quả sau: (i) Nêu A, B xung khác, thì P(A + B) = P(A) + P(B), (ii) Mở rộng cho tổng n sự kiện p + ( - i r ' ’P(A,A,...A„). (iii) Nếu Aj, A2, xung khắc từng đôi p (3.8) Các công thức (3.5) - (3.8) cho ta các công cụ hiệu quả để tính xác suất các sự kiện phức tạp qua xác suất các sự kiện đơn giản hơn. Thí dụ 3.4, Hai cọc bài được lấy từ một bộ bài tú lơ khơ, cọc thứ nhất gồm 4 con át, cọc thứ hai gồm 4 con ka. Rút ngẫu nhiên từ mỗi cọc bài ra một con bài, tính các xác suất đế 21 a) cả 2 con là con cơ, b) có ít nhất 1 con cơ. Cũng câu hỏi như vậy nhưng thay điều kiện đầu bài: trộn cọc bài và rút hú họa từ đó ra 2 con bài. Giải. Gọi A - con bài thứ nhất là cơ, B — con bài thứ hai là cơ. Để ý rằng thuật ngữ “thứ nhất”... chỉ để phân biệt hai con bài chứ không để chỉ thứ tự nào cả. Trong trường hợp hai cọc bài riêng rẽ, dễ thấy A và B độc lập. Từ đó a) Xác suất cần tìm là P(AB), để ý đến (3.3) ta có: P(AB)^P(A)P(B) = ị . ị = ~ . 4 4 16 b) Sự kiện ta quan tâm là A + 5 , theo (3.7): P(A + B )-P (A ) + P (B )-P (A fi) = i + ỉ - ^ = ^ . 4 4 16 16 Trường hỢp trộn lẫn hai cọc bài thành một thì A, B không còn độc lập nữa. Tuy nhiên các xác suất P(A) và P(B) đều bằng 2/8 = 1/4 do vai trò hai quân bài như nhau. Từ đó; a) Dùng công thức (3.5): P(AB) = P(A)P(B IA) = Ị . ị = ^ 4 7 28 b) Một lần nữa theo (3.7): P(A + B) = P(A) + P(B) - P(AB) = i + ỉ - — = — . 4 4 28 28 Thí dụ 3.5. Ba xạ thủ mỗi người bắn một viên đạn với xác suất bắn trúng của từng ngưòi tương ứng là 0,7; 0,8 và 0,9. Tính các xác suất: a) có hai ngưòi bắn trúng, b) có ít nhất một người bắn trượt. Giải. Gọi A, là sự kiện xạ thủ thứ i bắn trúng (i = 1 , 2, 3) và P(A,) = o’7; PCA^) = 0,8; P(A,) = 0,9. 22 a) Nếu gọi A là sự kiện có đúng 2 người bắn trúng thì: A = A, A, + Aj A2A3 + A1A2A3. Dùng tính xung khắc của các sô' hạng và tính độc lập của các Aị và A, (75^ ỉ), ta có: P(A) = P(A,A,A,) + P{A, A, A3 ) + P( A ) = P(A)P(A,)P(Ã^) + P(A,)P(Ã;)P(A3) + P(Ã)P(A,)(/43) = 0,7.0,8.(1 - 0,9) + 0,7.(1 - 0,8).0,9 + (1 - 0,7).0,8.0,9 = 0,398. b) Nếu gọi B là sự kiện có ít nhất một người bắn trượt, thì B là sự kiện không có ai bắn trượt hay cả ba đều bắn trúng. Rõ ràng việc tính P{B) dễ dàng hơn nhiều so vối tính P{B) theo cách trực tiếp, từ đó P{B) = l - P { B ) = \ - P { A , A ^ , ) = 1 - 0,7.0,8.0,9 = 0,496. Thí dụ 3.6. Cho một mạch điện gồm 4 linh kiện như hình 1.3, trong đó xác suất hỏng của từng linh kiện trong một khoảng thời gian nào đó tương ứng là 0,2; 0,1; 0,05 và 0,02. Tìm xác suất để mạng hoạt động tốt trong khoảng thòi gian đó, với giả thiết là các linh kiện làm việc độc lập với nhau và các dây luôn tô"t. Giải. Gọi Ai là sự kiện linh kiện thứ ỉ làm việc tốt (ỉ = 1,4). Sử dụng cá( tính chất của mạng song song và nổl tiếp, gọi A là sự kiện mạng hoạt động tốt, khi đó A =Ai(Ã2 +Ắ3)A4. Hinh 1.3 Để ý rằng từ giả thiết đầu bài ta luôn có Ai, A4 và A2 + A3 độc lập, nên: PiA).= P(A,)PiA,+Ạ,)P{A,). (3.9) 23 Ta cần tính P { \ + Ag), và do A;j không xung khắc, nên P( A, + A3 ) = P( A ,) + P( A3 ) - P( A, A3 ). Thay vào (3.9), để ý rằng P{A.ịA^ = P{A2)P{Aị) và giả thiết của đầu bài P(A) = P{A,)[P{A.^ + P{A,) - P(A,)P(A3)]P(A,) = 0,8.(0,9 + 0,95 - 0,9.0,95).0,98 = 0,78008. Chú ý rằng nếu ta khai triển A = sau đó dùng các công thức (3.6) - (3.7) để tính P{A) thì sẽ phức tạp hơn một chút, bạn đọc hãy tự giải theo cách này. Thí dụ 3.7. Một gia đình có 6 coh. Tìm xác suất đế gia đình đó có số con trai nhiều hơn sô" con gái. Giải. Ta chấp nhận xác suất sinh con trai bằng xác suất sinh con gái và bằng 0,5, ngoài ra kết quả mỗi lần sinh được coi là độc lập với nhau. Gọi A là sự kiện sô" con trai nhiều hơn con gái, khi đó việc tính trực tiếp P(A) đưa về xác định các trường hỢp; hoặc 6 trai, hoặc 5 trai 1 gái, hoặc 4 trai 2 gái. Tuy nhiên có thể dùng cách khác. Gọi B là sự kiện số gái nhiều hơn trai, còn c là sự kiện sô" trai và số gái như nhau. Dễ thấy A + B + C = U v ầ P{A) + P(B) + P(C) = 1 . Do tính đốì xứng của việc sinh con trai và con gái, nên P(A) = P(B), từ đó: P(A) = ^ ~2 và ta cần phải tính P(C) - xác suất để trong gia đình có 3 con trai, 3 con gái. Môt trường hơp như vây có xác suất và có tât cả Cg = 20 khả năng khác nhau, từ đó P{C) = 20/64 = — và 16 24 P(A) = ----2 32 Thí dụ 3,8. Một ngưòi viết n là thư cho n ngưòi khác nhau, bỏ ngẫu nhiên vào n phong bì đã có sẵn địa chỉ. Tìm xác suất để có ít nhất một lá thư bỏ vào đúng phong bì. Giải, Gọi A, là sự kiện là thư thứ i bỏ đúng phong bì (i = 1, /?), A - là sự kiện cần tìm xác suất, ta có A = Aị + A2 + ... + A„. Do cấcAị không xung khắc, nên ta dùng công thức (3.8). Dễ thấy ni P(A,Aj) = P{A^)P{A^\A,) ( n - 2)! ĨI n - 1 n\ P{A,AA,) = P(A ,)P(A J4)P(A J A,A^.) - (AI-3 )! n\ PiA,A,...AJ = P{A,)P{A, A)...P(A„ A A - A - , ) = - i71/ • Từ đó theo (3.8) P(A) = X ^ ( A ) - Z m A ) + z p (AAjA,)-... i=l i 0,95 o 0,05 > 0,99" ^ . 296. log 0,99 Nhiều khi ta muốn tìm xác suất để trong dãy n phép thử Béc-nu-ni sự kiện A xuất hiện vối sô" lần từ ki đến ^2Ỉ dễ thấy xác suất cầĩỊ tìm, ký hiệu là Pn(ki, kỵ), sẽ là; «,)= t È c .‘ p V ’‘ . (3.11) k=k^ 27 Ta có nhận xét rằng khi n và k khá lốn, việc tính toán xác suất theo (3.10) và (3.11) rất cồng kềnh và khó khăn; vì vậy người ta tìm cách tính gần đúng các xác suất đó. Có thể sử dụng các cách xấp xỉ sau đây: (i) Nếu n rất lớn, trong khi p rất nhỏ, xác suất theo công thức (3.10) có thể xấp xỉ bằng {xấp xỉ Poa-xông) (3.12) (ii) Nếu n lớn, nhưng p không quá bé và quá lớn, ta có xấp xỉ chuẩn (định lý giới hạn địa phưđng Moa-vrd - Láp-la-xơ) (3.13) yỊnpq yỊnpq _£Ĩ trong đó (ữ{x) = - 7= e 2 Ịà hàm Gao-xơ (xem bảng 1). v 2;r (iii) Nếu n lốn, nhưng p không quá bé hoặc quá lón thì xác suất trong (3.11) có thể xấp xỉ bằng (định lý giối hạn tích phân Moa-vrđ - Láp-la-xơ) „ k : - n p _ _ K ) ~ ệ { o c ^ ) - ệ { x ^ ) , Xj = , j = l, 2, (3.14) yjnpq r /2 1 f - - và trong đó ệ(x) = -7== e ^dt \à hàm Láp-la-xơ (xem bảng 2). v 2;r Thí dụ 3.13. Xác suất sản xuất ra phế phẩm của một máy là 0,005. Tìm xác suất để trong 800 sản phẩm của máy đó có đúng 3 phế phẩm. Giải. Rõ ràng có thể dùng xấp xỉ Poa-xông theo (3.12), với np = 4 n o o ( 3 ) - - ^ = 0,1954. 28 Thí dụ 3.14. Xác suất ném trúng rô của một cầu thủ là 0,8- Tìm xác suất để trong 100 lần cầu thủ đó: a) ném trúng 75 lần; b) ném trúng không ít hơn 75 lần. Giải. Việc tính theo công thức (3.10) hoặc (3.11) của lược đồ Béc-nu-li sẽ khá phức tạp. Ta sẽ tính xấp xỉ theo (3.13) và (3.14); í 7 5 -0 ,8 .1 0 0 ' a) p ,„(76,. M = 0,04565. ẠOO.0,8.0,2 4 b) P,oo(75; 100) ^ íý(õ) + ệ{l,25) = 0,8943. §4. CÔNG THỨC BAY-ÉT 4.1. Khái niệm nhóm đầy đủ Đ ịnh nghĩa. Nhóm các sự kiện Aj, A 2, An {n ^ 2) của một phép thử được gọi là (hay tạo thành) một nhóm đầy đủ, nếu (i) AẠj = V, Vỉ 7^ j (xung khắc từng đôi), (ii) A| + A2 + ... + A„ = ơ. Theo định nghĩa này ở phép thử đang xét chỉ có thể xuất hiện một sự kiện trong số n sự kiện Aj, A„ (và phải có một sự kiện). Nhóm Ai, A„ có các tính chất trên còn được gọi là một hệ thống đầy đủ. Thí dụ 4.1. Xét phép thử gieo một con xúc sắc. Nếu ký hiệu A, là sự kiện xuất hiện mặt i chấm (í = 1,6), ta có một nhóm đầy đủ ịAi, i = 1,6}. Có thể tạo thành nhiều nhóm đầy đủ khác cho phép thử này, chẳng hạn đặt A = Ag, từ đó A = A] + A2 + ... + A5 = Ag và nhóm {A, A } chính là một nhóm đầy đủ. 29 Như vậy dễ thấy tập hỢp tất cả các sự kiện sơ cấp tạo nên một nhóm đầy đủ. Tổng quát hơn tập các sự kiện tạo nên một phân hoạch của không gian Q các sự kiện sơ cấp cũng là một nhóm đầy đủ. Tập {A, A }, với A là sự kiện tùy ý là nhóm đầy đủ bé nhất (chỉ có 2 phần tử). Để ý {U, V} cũng tạo nên một nhóm đầy đủ và đưỢc gọi là nhóm đầy đủ tầm thường. 4.2. Công thức xác suất đẩy đủ Giả sử ta có một nhóm đầy đủ các sự kiện Aj, A.2, ... A„ và đồng thời xét một sự kiện H nào đó. Nếu đã biết các P(A,) và P{H Aj), ta có thể tính được P{H). Rõ ràng từ giả thiết về nhóm đầy đủ; i=l / Từ đó P(H) = p (do xung khắc), V i=i i=l J Ỉ=1 và áp dụng công thức nhân (3.5): P(H)=^ỵP{A^)P{H\A^). (4.1) Ỉ = 1 Công thức (4.1) có tên gọi là công thức xác suất đầy đủ (hay xác suất toàn phần). Thí dụ 4.2. Một phân xưởng có 3 máy sản xuất cùng loại sản phẩm với tỷ lệ phế phẩm tương ứng 1%; 0,5% và 0,2%. Biết rằng máy I sản xuất ra 35%, máy II — 45% và máy III — 20% sản phẩm. Chọn hú họa ra một sản phẩm, tìm xác suất đó là phế phẩm. Giải. Đặt M2 và M3 tương ứng là sự kiện sản phẩm chọn ra do máy I, II và III sản xuất. Dễ thấy {M„ ỉ = 1,3} tạo nên một nhóm đầy đủ và P(Mị) = 0,35; PìM.ị) - 0,45; P{M.^ = 0,20, Gọi H sự kiện rút đưỢc phế phẩm, áp dụng (4.1) để ý rằng P{H 1 Mi) = 1%; P{H 1M2) = 0,5%; P{H I M;ị) = 0,2%, ta có 30 P{H) = Ỷ^P{M^)P{H\M^) = Í=1 = 0,35.1% + 0,45.0,5% + 0,20.0,2% = 0,615%. Ý nghĩa của xác suất này là tỷ lệ phế phẩm của phân xưởng. Thí dụ 4.3. Có hai hộp áo, hộp I có 10 áo trong đó có 1 phế phẩm, hộp II có 8 áo trong đó có 2 phế phẩm. Lấy hú họa 1 áo từ hộp I bỏ sang hộp II, sau đó từ hộp này chọn hú họa ra 2 áo. Tìm xác suất để cả 2 áo đó đều là phế phẩm. Giải. Ta lập nhóm đầy đủ để làm rõ thông tin về chất lượng chiếc áo mang từ hộp I sang; gọi A - áo đó là phế phẩm, A - áo tôt. Đặt H là sự kiện 2 áo cuôl chọn ra đều là phế phẩm. Rõ ràng P(A) = — ; P(Ã) = — ; ta còn cần tính P(H\A) và P{H\ A ). Dùng định nghĩa xác suất; Từ đó dùng (4.1) P(H) = P(A)P(H IA) + P{Ã)P{H 11) = — . — + — .— = — . 10 12 10 36 30 4.3. Công thức Bay-ét Giả sử ta có một nhóm đầy đủ Ai, A2, ... A„, sau đó có thêm sự kiện H nào đó. Đôi khi ta muôVi xác định xác suất PịẠi H), i là một sô' nào đó trong {1, 2, n}. Theo công thức nhân (3.5) ta có P{A,H) = P(AdP(H IA,) = P{H)P{A, IH). 31 Từ đó P(A, I / / ) ^ (4.2) P{H) và thay (4.1) vào (4.2) P (A ,|//)= ; ■ (4.3) P(A,)P(H A.) X p (a ,)P(h |a ,) i = l Công thức (4.3) có tên gọi là công thức Bay-ét. Các xác suất P(Ai), i — 1, n, đã được xác định từ trước, thường đưỢc gọi là xác suâ^t tiên nghiệm; còn các xác suất P(A( H), i - 1. n, được xác định sau khi đã có kết quả thí nghiệm nào đó thế hiện qua sự xuâ’t hiện của H, thường đưỢc gọi là xác suất hậu nghiệm. Như vậy công thức Bay-ét cho phép đánh giá lại xác suất xảy ra các A, sau khi đã có thêm thông tin về H. cần phải nhấn mạnh rằng nếu muôn dùng các công thức (4.1) hoặc (4.3), nhất thiết phải có nhóm đầy đủ. Ngoài ra nếu (4.1) cho ta xác suất không có điều kiện, thì (4.3) cho phép tính xác suất có điều kiện, trong đó sự kiện A, cần tính xác suất phải là một thành viên của nhóm đầy đủ đang xét. Từ đó thấy rằng việc dùng công thức Bay-ét để tính xác suất có điều kiện đã gỢi ý cho ta cách chọn nhóm đầy đủ sao cho sự kiện quan tâm phải là thành viên. Trong trường hỢp không có (hoặc rất khó xác định) nhóm đầy đủ, nên dùng công thức (4.2), trong trường hỢp này việc tính P{H) sẽ khó hơn là dùng công thức (4.1). Thí dụ 4.4. Một mạch điện gồm 2 bộ phận mắc nối tiếp, với xác suâ't làm việc tốt trong một khoảng thòi gian nào đó của mỗi bộ phận là 0,95 và 0,98. ở một thời điểm trong khoảng thời gian trên người ta thấy mạch điện ngừng làm việc (do bộ phận nào đó hỏng); tìm xác suất để chỉ bộ phận thứ hai hỏng. Giải. Do hai bộ phận mắc nôl tiếp nên chỉ cần một bộ phận hỏng là mạch ngừng làm việc. Gọi A, (i = 1 , 2) là sự kiện bộ phận thứ i tô't; khi đó có thể xảy ra 4 khả năng khác nhau: 32 Bq - cả hai bộ phận đều tốt; s , - bộ phận I tôt, II hỏng; B2 - bộ phận II tốt, I hỏng; Bs - cả hai bộ phận đều hỏng. Dễ thấy các B,, i = 0,3, tạo nên một nhóm đầy đủ và do tính độc lập P(Bo) = P{A,A^ = 0,95.0,98 = 0,931; P(BJ = P(A^A^) = 0,95.0,02 = 0,019; P(B^) = P { A ^ = 0,05.0,98 = 0,049; ■P(ổ3) = 4 ) = 0,05.0,02 = 0,001. Gọi H - S\Ị kiện mạch không làm việc, ta có: = P{H\B,) = P{H\B^) = P{H\B,) = 1 . Từ đó theo công thức Bay-ét (4.3): P{B,)P{H\B,) 0,019 !=0 = 19 69' Để ý rằng ta có thể dùng (4.2) để tính P(JBi \H). Để làm điều đó ta viết: H = Aj + A, A2 + Aj A2. Do tính xung khắc và độc lập của các sự kiện tương ứng ta có P(H ) = P (Ạ ) P ( 4 ) + P(A ^)P(4) + P (Ã ^)P (4) = 0,069. Mặt khác BiH = A| A2 (nhân vào công thức của H và để ý = V), nên tử số của (4.2) sẽ là 0,019; từ đó ta có lại kết quả cần tìm mà không cần đến nhóm đầy đủ. Tuy nhiên mọi khó khăn rơi vào việc tính trực tiếp P(H). Thí dụ 4.5. Tại một phòng khám chuyên khoa tỷ lệ ngưòi đến khám có bệnh là 83%. Theo thông kê biết rằng nếu chẩn đoán có bệnh thì đúng tới 90%, còn nếu chẩn đoán không bệnh thì chỉ đúng 80%. 33 a) Tính xác suất chẩn đoán đúng. b) Biết có một trường hỢp chẩn đoán đúng; tìm xác suất ngưồi đươc chẩn đoán đúng có bệnh. Giải. Gọi H sự kiện chẩn đoán đúng, vậy H - chẩn đoán sai; A - người có bệnh, A - ngưòi không có bệnh; B - chẩn đoán bệnh, B — chẩn đoán không bệnh. a) Để tính P{H), ta thử dùng công thức (do Ả, A - nhóm đầy đủ): P{H) = P(A)P{H A) + P (A )P (H A), tuy nhiên P(H A) - xác suất để khi chẩn đoán người có bệnh thì đúng - chưa biết (chú ý phân biệt với xác suất chẩn đoán có bệnh thì đúng là P(H\B). Vì vậy ta tìm cách dùng công thức thứ hai (do B và B tạo ra nhóm đầy đủ). P(H) = P{B)P{H IB) + P(B)P{H\B). (4.4) Nhưng P{B) (và P{B) nữa) lại chưa biết, tuy nhiên ta có thể khai thác công thức; P(A) = P{B)P{A\B) + P(B)P{A\B). (4.5) Theo giả thiết đầu bài P(A) = 0,83; ngoài ra dễ thấy; P{A\B)P{H\B) = 0,9; P(A\B) = P(H\B) ^ 1 -P(H\B) = 1 - 0,8 = 0,2. Từ đó nếu đặt P(B) = X, P(B) = 1 - P(B) = 1 - X và thay tất cả vào (4.5). 0,83 = 0,9;c + 0,2(1 - x ) = > x = P{B) = 0,9. Từ đó thay các kết quả trên vào (4.4) P{H) = 0,9.0,9 + 0,1.0,8 = 0,89. b) Xác suất cần tìm là P{A\H). Áp dụng công thức (4.2): I P(H) 34 Mặt khác dựa vào ý nghĩa các sự kiện và lại dùng tiếp (4.2) P{H\A) = P(B\A) = ^(-S)P(A|g) P{A) từ đó thay vào công thức trên: P(A\H) = ^ 0 9 ]^ P(H) 0,89 BÀI TẬP 1 . Cho 4 sản phẩm và gọi A là sự kiện có ít nhất một phế phẩm, - cả 4 đều tốt. Cho biết ý nghĩa của các sự kiện sau: Ã, Ỗ, A + B,AB, AB, ÃB, Ã + B, A + B, Ã + B ,Ã ẽ . 2. Chứng minh công thức Đơ Moóc-găng: A + B = Ã B , Ã B = Ã + B. 3. Có bao nhiêu sô" tự nhiên mà mỗi số có 4 chữ số? 4. Tìm sự kiện X từ đẳng thức X + A + X + A = B. 5. Một giải bóng đá gồm 16 đội. Hỏi phải tổ chức bao nhiêu trận đấu, biết rằng mỗi đội gặp nhau 2 lần? 6. Có bao nhiêu cách xếp 10 quả bóng vào 2 hộp? 7. Có bao nhiêu số điện thoại có các chữ số khác nhau ở một tổng đài nội bộ vối các sô" chỉ có 4 chữ số? Có bao nhiêu sô' điện thoại có đúng 1 cặp sô" trùng? 8. Có bao nhiêu cách xếp 5 ngưòi ngồi quanh một bàn tròn sao cho hai người định trước ngồi cạnh nhau? Cũng câu hỏi như vậy nhưng thay bàn tròn bằng bàn dài. 9. Một lô hàng có N sản phẩm trong đó có M phế phẩm. Có bao nhiêu cách chọn ra n sản phẩm để trong đó có m phế phẩm? 10. Có bao nhiêu cách để 8 ngưòi lên tầng của một tòa nhà có 4 tầng lầu? 35 1 1 . xếp ngẫu nhiên một bộ sách gồm 6 tập lên giá sách, tìm xác suất để bộ sách được xếp đúng thứ tự. 12. Một cậu bé có 10 bi, trong đó có 6 đỏ và 4 xanh. Một hôm cậu thấy mất một viên bi, tìm xác suất để nếu rút hú họa ra 1 bi trong sô" còn lại thì đó là bi đỏ. 13. Tìm xác xuất để khi rút hú họa ra n con bài từ cỗ bài tú lơ khơ 52 con thì chúng có giá trị khác nhau (không để ý đến chất). 14. Một lớp học sinh có 30 sinh viên trong đó có 4 giỏi, 8 khá và 10 trung bình. Chọn hú họa ra 3 người, tính các xác suất: a) cả ba đểu là học sinh yếu; b) có ít nhất một học sinh giỏi; c) có đúng một học sinh giỏi. 15. Gieo đồng thời 4 đồng tiền cân đối đồng chất, tìm các xác suất: a) cả 4 mặt giông nhau xuất hiện; b) có đúng 2 mặt sấp. 16. Tìm xác suất khi chia đỗi một bộ tam cúc thì mỗi phần có đúng một nửa là quân đỏ. 17. Bẻ ngẫu nhiên một thanh gỗ có độ dài l thành 3 đoạn. Tìm xác suất để ba đoạn đó tạo được một tam giác. 18. Tìm xác suất để khi lấy hú họa ra một sô" có hai chữ số thì nó là bội số của 2 và 3. 19. Bài toán Buýt-phông. Trên mặt phẳng đã kẻ sẵn các đường song song cách đều nhau một khoảng có độ dài 2 a gieo ngẫu nhiên một kim dài 21 (ỉ < a). Tính xác suất để chiếc kim cắt một đường thẳng nào đó. 20. Bài toán Ba-nắc. Một ngưòi có trong túi 2 bao diêm, mỗi bao có n que. Mỗi khi cần diêm anh ta rút hú họa ra một bao. Tìm xác suất sao cho người đó lần đầu rút phải bao rỗng thì trong bao kia còn đúng k que (k = 1 , 2,..., n). 36 2 1. Xác suất trúng đích của một lần bắn là 0,4. cần phải bắn bao nhiêu phát để xác suất có ít nhất một viên trúng sẽ ìôn hơn 0,95? 22. Một xí nghiệp có 3 xe tải với xác suất hỏng trong ngày của mỗi xe tương ứng là 0,01; 0,005 và 0,002. Tìm xác suất để trong ngày: a) có 2 xe bị hỏng; b) có ít nhất một xe hỏng. 23. Xếp ngẫu nhiên 10 quyển sách vào 2 ngăn kéo. Tính các xác suất: a) ngăn kéo nào cũng có sách; b) ngăn kéo thứ nhất có 2 quyển sách và ngăn thứ hai có 6 quyển sách. 24. Chứng minh rằng nếu A và ổ độc lập thì các cặp sự kiện sau cũng độc lập: A và ổ, A và B, A và ổ. 25. Một gia đình có 6 con. Giả sử xác suất sinh con trai là 0,5, tính các xác suất đê trong 6 con có: a) đúng 3 con trai; b) có không quá 3 con trai; c) có nhiều nhât 4 con trai. 26. Một xạ thủ phải bắn cho đến khi nào trúng thì thôi. Tìm xác suất để anh ta phải bắn không quá 4 lần, biết rằng xác suâ"t trúng của mỗi lần bắn là 0,6. 27. Trong thòi gian có dịch ở 1 vùng dân cư cứ 100 người bị dịch thì có 10 ngưòi phải đi cấp cứu. Xác suất gặp một ngưòi phải cấp cứu vì mắc bệnh dịch ở vùng đó là 0,06. Tìm tỉ lệ mắc bệnh dịch của vùng dân cư. 28. Một công nhân đứng máy 1000 ô"ng sỢi. Xác suất mỗi ông bị đứt trong vòng một giò là 0,005. Tính xác suất để trong vòng 1 giờ có: a) 40 ông sỢi bị đứt; b) không quá 40 ông sỢi bị đứt. 37 29. Tỉ lệ hút thuôc ở một vùng là 35%. Theo thống kê biết rằng tỷ lệ viêm họng trong số ngưòi hút thuốc là 60%, còn trong sô" không hút là 30%. Khám ngẫu nhiên một ngưòi thì thấy anh ta bị viêm họng; tìm xác suất đó là người hút thuốic. Nếu anh ta không bị viêm họng thì xác suất đó bằng bao nhiêu? 30. Một xạ thủ bắn 4 phát đạn vối xác suất bắn trúng của mỗi viên đạn là 0,7. Biết rằng có hai viên trúng, tìm xác suất để viên thứ nhất đã trúng đích. 31. Một phân xưởng có 3 máy với xác suất trục trặc trong ngày của từng máy là 0,1; 0,05 và 0,2. Cuối ngày thấy có 2 máy trục trặc, tính xác suất đó là máy thứ hai và ba. 32. Một người có 3 chỗ ưa thích như nhau để câu cá. Xác suất để câu được cá mỗi lần thả câu ở từng ndi tương ứng là 0,2 ; 0,3 và 0,4. Biết rằng ở một chỗ anh ta thả câu 3 lần và chỉ câu được 1 con cá, tìm xác suất để đó là chỗ thứ nhất. 33. ở một bệnh viện tỷ lệ mắc bệnh A là 15%. Đề chẩn đoán xác định người ta phải làm phản ứng miễn dịch, nếu không bị bệnh thì phản ứng dương tính chỉ có 10%. Mặt khác biết rằng khi phản ứng là dương tính thì xác suất bị bệnh là 60%. a) Tinh xác suất phản ứng dương tính của nhóm có bệnh. b) Tính xác suâ't chẩn đoán đúng. 38 Chương II BIẾN NGẪU NHIÊN VÀ LUẬT PHÂN PHỐI XẮC SUẤT §1. KHÁI NIỆM BIẾN NGẪU NHIÊN 1.1. Khái niêm• Tính toán bằng số vốn đã quen thuộc và dễ sử dụng trong ứng dụng, nhất là có dùng tối máy tính. Khi nghiên cứu các sự kiện ngẫu nhiên, rất bất tiện khi mô tả và làm tính vối các sự kiện. íOìái niệm biến số (đại lượng biến thiên) đã rất thông dụng trong giải tích toán. Chính vì thế ta tìm cách đưa vào khái niệm biến s ố ngẫu nhiên như là một đại lượng phụ thuộc vào kết cục của một phép thử ngẫu nhiên nào đó. Thí dụ 1.1. Gieo một con xúc sắc. Nếu ta gọi biến ngẫu nhiên là “sô" chấm xuất hiện”, rõ ràng nó phụ thuộc vào kết cục của phép thử và nhận các giá trị nguyên từ 1 đến 6. Thí dụ 1.2. Nghiên cứu biến ngẫu nhiên “nhiệt độ” của một phản ứng hóa học trong một khoảng thời gian nào đó Rõ ràng nhiệt độ đó nhận giá trị trong một khoảng [í; T], trong đó í và T là các nhiệt độ thấp nhất và cao nhất của phản ứng trong khoảng thời gian trên. Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như là một hàm số có giá trị thực xác định trên không gian các sự kiện sơ cấp (sao cho nghịch ảnh của một khoảng sô' là một sự kiện). Để phân biệt sau này ta kí hiệu X, Y,... là các biến ngẫu nhiên, còn X, 3', ... ìà giá trị của các biến ngẫu nhiên đó. Như 39 vậy, X mang tính ngẫu nhiên, còn X là giá trị cụ thể quan sát được khi phép thử đã tiến hành (trong thống kê được gọi là thể hiện của X). Việc xác định một biến ngẫu nhiên bằng tập các giá trị của nó rõ ràng lả chưa đủ. Bước tiếp theo là phải xác định xác suất của từng giá trị hoặc từng tập các giá trị. Vì thế ở tiết sau ta sẽ phải dùng tổi khái niệm vể phân phối xác suất của biến ngẫu nhiên X. 1.2. Phân loại Biến ngẫu nhiên được gọi là rời rạc, nếu tập giá trị của nó là một tập hữu hạn hoặc vô hạn đếm được các phần tử. Thí dụ: sô" điểm thi cửa một học sinh, sô" cuộc gọi điện thoại của một tổng đài trong một đơn vị thòi gian, sô"tai nạn giao thông, ... Biến ngẫu nhiên được gọi là liên tục, nếu tập giá trị của nó lấp kín mộc khoảng trên trục số^ (sô" phần tử của tập giá trị là vô hạn khỏng đếm đưỢc theo lý thuyết sô). Thí dụ: huyêt áp của một bệnh nhân, độ dài của chi tiết máy, tuổi thọ của một loại bóng đèn điện tử, ... Như vậy miền giá trị của một biến ròi rạc sẽ là một dãy sô" Xi, %2, x„,... có thể hữu hạn hoặc vô hạn. Miền giá trị của một biến liên tục sẽ là một đoạn [a; ồ] c R hoặc là chính R = {-co, +co). §2. LUẬT PHÂN PHỐI XÁC SUẤT 2.1. Bảng phân phối xác suã't và hàm xác suất Đôi với biến ngẫu nhiên ròi rạc, mỗi giá trị của nó được gắn vổi một xác suất đặc trưng cho khả năng biến ngẫu nhiên nhận giá trị đó P i- P(X - Xi). Như vậy ta đã xác định; Đ ịnh nghĩa 1 . Bảng phân phối xác suất của biến ngẫu nhiên X là 40 X = x Xị X2 .... Xn p{x) Pi .... trong đó [Xị, X2, ...} là tập các giá trị của X (đã sắp xếp theo thứ tự tăng); còn = p (x j = P{X = x j. Thí dụ 2.1. Bảng phân phôi xác suất của thí dụ LI §1 sẽ là: X . 1 2 3 4 5 6 píx) 1 1 1 1 1 1 6 6 6 6 6 6 Dẻ thấy các p{x), X =1,6, đều bằng nhau; hay X có phân phối đểu trên tập sô {1, 2,..., 6}. Chú ý rằngp{x) = 0 vối mọi X không nằm trong tập giá trị trên của X, chẳng hạn /}(8) = 0. Thí dụ 2.2. Một xạ thủ chỉ có 3 viên đạn. Anh ta được yêu cầu bắn từng phát cho đến khi trúng mục tiêu thì dừng bắn, biết rằng xác suât trúng của mỗi lần bắn là 0,6. Hãy lập bảng phân phôi xác suất của sô" đạn cần bắn. Giải. Rõ ràng số^ đạn cần bắn, ký hiệu là X, là một biến ngẫu nhiên rồi rạc và từ yêu cầu của bài toán sẽ có 3 giá trị là 1, 2 và 3. X = 1 là sự kiện phát thứ n h ấ t trú n g và Pi = P{X - 1) = D,6; X = 2 là sự kiện phát thứ nhất trượt, còn phát thứ hai trúng và do độc lập nên P2 = P{X = 2) = 0,4.0,6 = 0,24; cuôl cùng nếu viên thứ hai vẫn trượt, thì dù viên thứ ba kết quả thế nào, P‘ị vẫn bằng P{X = 3) = 0,4^ = 0,16. Từ đó bảng phân phôi cần tìm: X 1 2 3 Pix) 0,6 0,24 0,16 Thí dụ 2,3. Một xạ thủ bắn 3 phát, xác suất bắn trúng mục tiéu của mỗi phát là 0,6. Hãy lập bảng phân phô^i xác suất của sô đạn trúng mục tiêu. 41 Giải. Nếu gọi X là sô" đạn bắn trúng, ta có tập giá trị là {0, 1, 2, 3}. Ta tính xác suất P{X = k) - p{k) bằng công thức Béc-nu-li p(k) = ; n = 3, p = 0,6; từ đó bảng phân phôi cần tìm: X 0 1 2 3 p{x) 0,064 0,288 0,432 0,216 Hàm sốp(x) = P(X = x), X e tập giá trị của X, thường được gọi là hàm xác suất của X; nó có hai tính chất cơ bản: (i) p{x)> 0 Vx; (ii) p{x) = 1. mọi X Bạn đọc có thể kiểm tra dễ dàng các tính chất này trong 3 thí dụ trên. Ngoài ra có thể thấy rằng hàm của một hoặc nhiều biến ngẫu nhiên vẫn tiếp tục là một biến ngẫu nhiên. Trong trường hỢp biến rời rạc việc tìm luật phân phôi của một biến hàm như vậy thường dễ hơn so với biến liên tục. Thí dụ 2.4. Cho hai biến X và y có bảng phân phối tương ứng: X - 1 0 1 p{x) 0,3 0,4 0,3 và y 1 2 p(y) 0,3 0,7 Hãy lập bảng phân phôi xác suất của: a) b) X + y. Giải, a) Biến z = rõ ràng chỉ có hai giá trị 0 và 1 , từ đó bảng phân phôi xác suất của nó: z 0 1 p(z) 0,4 0,6 b) Biến z = X + Y có các giá trị sau: 0, 1 , 2 và 3. Để ý rằng í>(Z = z ,) = P (X + y = 2,) = ỵ P ( X . x , : Y = ỵ^ trong đó tổng hiểu theo nghĩa lấy theo mọi giá tỉ-ị X, và của X và Y sao cho + ỵj = Zf,\ còn P{X = x^; yj) là xác suất 42 đê đồng thòi x= X, và y = Vj. Nếu X vằ Y không có quan hệ gì (tức độc lập, sẽ nói đến ở chương III) thì rõ ràng xác suất P{X = X- Y - y.i) = P(X = X,)P(Y = ỵj). Từ đó bảng phâ của Z: 2 0 1 2 3 p(z) 0,09 0,33 0,37 0,21 (chẳng hạn P(Z = 2) = P(X = 0; y = 2) + P(Z = 1; y 0,4.0,7 + 0,3.0,3 = 0,37). 2.2. Hàm phân phối xác suâ't Bảng phân phôi xác suất có một hạn chế cơ bản là chưa đủ tổng quát để đặc trưng cho một biến ngẫu nhiên tùy ý, nhấ^t là ti^ưòng hỢp biến liên tục. Vì vậy ngưòi ta đưa ra khái niệm sau: Đ ịnh nghĩa 2. Hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu là F{x), được xác định như sau: F(x) = P{X < x), X e R (2.1) Từ định nghĩa trên, F{x) phản ánh độ tập trung xác suất ở bên phải của sô' thực X . Trong trưòng hỢp biến ngẫu nhiên ròi rạc, (2.1) cho ta một hàm còn được gọi là hàm phân phôi tích lũy (hay xác suất tích lũy). Thí dụ 2.5. Từ bảng phân phôi của thí dụ 2.2 và dùng (2.1) ta sẽ có F{x) = 2^ p{Xị)vằ X. < x 0, X < 1, F{x) = 0,6, 1 < X < 2 , 0,84, 2 < X < 3, 1, X ^ 3. Đồ thị của hàm phân phôi xác suất này là hàm bậc thang; Để ý là X có bao nhiêu giá trị thì F(x) có bằng ấy điểm gián đoạn loại 1 (xí-m hình 2.1). 43 Hàm phân phôi xác suất có F{x) vai trò quan trọng khi nghiên cứu các biến ngẫu nhiên liên tục. Nếu ta biết được hàm phân phối xác suất có nghĩa là xác định hoàn toàn biến ngẫu nhiên. Tuy nhiên trong thực tế cũng phải thấy rằng việc tìm được F{x) là rất khó, nếu không nói là hầu như không thể làm đưỢc. 1 0,84 0,6 0 2 Hình 2.1 3 X Có thể nêu ra một văi tính chất của hàm F{x)\ (i) 1 > F{x) > 0. (ii) F{x) là một hàm không giảm, tức là nếu thì F{xỉ) > F{x[). ặn)P{a) = 1; F{-<ò) = 0. Việc chứng minh các tính chất trên có thể dựa vào định nghĩa- (2.1). Cũng từ định nghĩa ấy ta thấy F{x) ít nhất phải là hàm liên tục trái (xem ví dụ 2.5 ở trên), còn trong trường hỢp X liên tục thì F{x) nói chung là một hàm liên tục. Trong tính chất (iv) F{+ oc) ký hiệu lim F{x), tương tự đôi với F{-<ò), Cuôi cùng để ý là (2-.2) luôn đúng vối mọi biến X liên tục hay ròi rạc, trong trường hỢp F{x) liên tục có hệ quả hiển nhiên: P{a 4. Xác định hằng số a và tính P(2 < X < 3). Giải. Do F(x) liên tục, nên tại = 4 ta phải có a(4 từ đó a = —. Dùng (2.2) ta có: 4 ■ 1 P(20 \/x; +00 (ii) f(x)dx - 1. J—00 Từ định nghĩa (2.1) và khái niệm đạo hàm, ta có thể thấy ở nơi nào giá trị của f(x) lân thì tại lân cận điểm đó có độ tập trung xác suất cao, điều đó giải thích tên gọi mật độ xác suất. Thí dụ 2 .7. Cho hàm mật độ của biến ngẫu nhiên X có dạng ; f(x) = • acosx, X G < K n . 2 ’ 2 0, X€ K n . 2 ’ 2 _ a) Tìm a và xác định hàm phân phối xác suất F{x) của X. b) Tính xác suất để X nhận giá trị trong khoảng ,ĩĩ Giải, a) Dùng tính chất (ii) của hàm mật độ: n + 00 ' 2 f{x)dx = a cosxdx = 2a = 1, K từ đó rút ra a - —. Việc tìm Fiy) dựa vào công thức (2.3b). Ta có: 2 46 n Với X < thì 2f{x)dx = 0; X Vối ~~ ^ thì fịx)dx = -^cosxdx = 1. 2 ^ ^ ^ J - y , ĩĩ 2 2 0, X < -712 Từ đỏ F(x) b) Theo (2.2): pn< x 71 ;r ) 1 r , n . sm — + 11 V2 2 4 Thí dụ 2.8. Cho xác suất phân rã của một nguyên tử chất phóng xạ trong khoảng thòi gian dt khá bé là Ădt (giả sử sự phân rã đó không phụ thuộc vào quá khứ). Hãy xác định: a) Xác suâ^t để nguyên tử đó phân rã trong khoảng thòi gian t\ b) Hàm mật độ xác suất của thòi điếm phâm rã của nguyên tử. 47 Giải. a) Dễ thấy xác suất không phân rã của nguyên tử trong khoảng thòi gian dí là 1 - Ầdt. Chia khoảng thời gian t thành tldt các khoảng con có độ dài dt\ từ đó xác suất để nguyên tử không phân rã trong khoảng thời gian đó xấp xỉ là (do có giả thuyết độc lập) (1 - Ẳdty''^\ Lấy giối hạn khi dt ->■ 0, ta có xác suất cần tìm ỉà 1 - (bằng 1 - xác suất nguyên tử không phân rã trong khoảng thời gian t). b) Gọi T là thòi điểm phân rã của nguyên tử và f{t) là hàm mật độ của T. Rõ ràng xác suất để nguyên tử phân rã ở thòi điểm trong khoảng thồi gian từ t đến í + dí sẽ bằng xác suất không phân rã trong khoảng thời gian t trưốc đó nhân vối xác suất phân rã trong khoảng thời gian dt, từ đó; P{t < T < t + dt) = f{t)dt - e^^‘Ẵdt. Vậy ta có f{t) = 0,t<0, t > 0. Đây chính là hàm mật độ của biến ngẫu nhiên tuân theo luật phân phối mũ, ký hiệu ở đây T ~ £{Ằ). §3. CÁC SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN Dâu biết rằng hàm phân phổi xác suất cho ta thông tin đầy đủ nhất vể biến ngẫu nhiên, nhưng trong thực tế ta không thể xác định được nó; từ đó dẫn đến việc tìm jnột vài đặc trưng quan trọng, thông thường là đặc trưng về vị trí và về độ phân tán. Trong 3 sô" đặc trưng về vị trí, đầu tiên ta xét về kỳ vọng, hai sô'khác là mốt và trung vị sẽ xét ỏ mục 3.3. 3.1. Kỳ vọng Đ ịn h n g h ĩa 1. Kỳ vọng của biến ngẫu nhiên X, ký hiệu là EX, được xác định như sau: 48 nêu X là biến ròi rạc có hàm xác suất p (X i) -p^i- 1, 2,.„ thì: EX=Ỵ^x,p,] (3. la) Vi “ nếu X là biến liên tục có hàm m ậ t độ f{x), X e R, thì: EX= xfix)dx. (3.1b) Từ (3.1) ta thấy kỳ vọng chính là tổng có trọng sô" của tất cả các giá trị của X, hay còn là trị trung bình của biến ngẫu nhiên (phân biệt với trung bình cộng của các giá trị). Trong thực tế, nếu quan sát các giá trị của X nhiều lần và lấy trung bình cộng, thì khi sô" quan sát càng lớn sô" trung bình đó càng gần tới kỳ vọng EX, vì vậy kỳ vọng còn được gọi là trị trung binh của biến X mà không sỢ nhầm lẫn. Thí dụ 3.1. Xét lại thí dụ 2,1 với X là sô" chấm xuất hiện khi gieo một con xúc sắc. Theo (3.la) E X = ỉ ( l + 2 + 3 + 4 + 5 + 6) = 3,5. 6 Như vậv trong trưòng hỢp xác suất đưỢc phân phối đều trên tập giá trị, kỳ vọng chính là trung bình cộng của các giá trị ấy. EX - 3,5 còn có nghĩa là nếu gieo nhiều lần sô" chấm trung bình thu được sẽ là 3,5. Thí dụ 3.2. Tìm kỳ vọng của biến X trong thí dụ 2.3. Giải. TI eo (3.la) ta có: l X = 0.0,064 + 1.0,288 + 2.0,432 + 3.0,216 = 1,8. Thí dụ 3 3. Tìm kỳ vọng của biến X trong thí dụ 2,6. Giải. Trước hết ta phải tìm hàm mật độ của X, theo (2.3a) f{x) = 49 - 2), x e [2;4], 0, X Ể Í2;4 Từ đó theo (3.1b): 4-cr 10 EX = xfix)dx= '~[x-2)dx 3 2 Thí dụ 3.4. Một người mua 10000 đồng xổ sô" lô tô 2 sô^ với luật chơi như sau: anh ta sè thắng 700000 đồng (gấp 70 lần tiền mua) nếu sô" m ua trùng với 2 sô" cuôi của giải độc đắc gần nhất sắp tới (và không được đồng nào nếu không trùng). Hãy tìm sô" tiền thắng tru n g bình của một lần chơi như vậy. Giải. Gọi X là sô" tiền thắng của một lần chơi, rõ ràng X nhận các giá trị 0'' và 700000^^ với các tần suất (và coi luôn là xác suất cũng không sỢ làm mất tổng quát) tương ứng là 99% và 1%. Từ đó sô" tiền thắng trung bình chính là: E X = 0^.99% + 700000^1% = 7000 đồng. Mặc dù EX > 0, nhưng chớ quên rằng anh ta đã bỏ ra 10000 đồng để mua xổ sô". Như vậy trong thực tế mỗi lần chơi anh ta mất trung bình 3000 đồng. Ta phát biểu một sô" tính chất của kỳ vọng: (i) Ec - c {c — hằng sô"); (ii) E{cX) = cEX\ (iii) E{X +Y)^EX^EY\ (iv) Nếu X, Y độc lập thì E{XY) = EX.EY (để ý rằng khái niệm độc lập sẽ được làm rõ hơn ỏ chương III); (v) Nếu Y = (fÁX), thì phụ thuộc vào X ròi rạc hay liên tục +0C ta có; E Y = )Pi hoặc E Y = \(p[x)f[x)dx, trong đó các i -cr p{x) và f{x) là các hàm xác suất hoặc mật độ tương ứng. Thí dụ 3.5. Gieo đồng thòi 2 con xúc sắc. Tìm tổng sô^ châm trung bình. 50 Giải. Gọi X, là sô' chấm xuất hiện của con xúc sắc thứ i {i = 1, 2), dễ thấy từ thí dụ 3.1 EXị = E X2 - 3,5. Mặt khác tổng sô^ chấm của 2 con xúc sắc sẽ là Xị + X2 , từ đó dùng tính chất (iii) của kỳ vọng, ta có E(X-ị + X 2 ) = 3,5 + 3,5 = 7. 3.2. Phương sai 1. Dùng phép lấy kỳ vọng ở mục trước, ta có thể định nghĩa khái niệm phương sai. Đ ịnh nghĩa 2. Phương sai của biến ngẫu nhiên X, ký hiệu là vx. được định nghĩa như sau: VX^E[{X-EX)~]. (3.2) Trong (3.2) ta thấy X - EX chính là độ lệch của biến X so với trung bình của nó, từ đó phương sai chính là trung bình của bình phương độ lệch đó. Vậy phương sai đặc trưng cho độ phân tán của biến ngẫu nhiên quanh trị trung bình của biến đó. Cũng theo ý nghĩa đó phương sai càng lớn thì độ bất định của biến tương ứng càng làn. Trong tính toán, phụ thuộc vào X là ròi rạc (với hàm xác suất p{x)) hay liên tục (với hàm mật độ f{x)), ta có hai công thức tính phương sai: - E x f p^. (3.3a) V i hoặc: v x = \[x - E X f f [x)dx. (3.3b) « Tuy nhiên việc tính theo (3.3) khá phức tạp, vì vậy, dùng các tính chất của kỳ vọng, ta có thể biến đổi (3.2) về dạng tưdng đương, khá dễ dàng để tính toán v x = E{X^) - {EX)\ (3.4) vối các phương án tính ứng với X rời rạc hay liên tục như trong (3.3): 51 (3.4a) J 2 +CC v x = x^fị^x)dx- —co '^+00 ^ x/'(x)dx v - c c J (3.4b) Thí dụ 3,6. Bảng phân phôi của biến ngẫu nhiên X trong thí dụ 2.3 có dạng: X 0 1 2 3 p ( x ) 0,064 0,288 0,432 0,216 Hãy tính vx. Giải, Ta đã tính E X = 1,8 trong thí dụ 3.2. Rõ ràng việc tính theo (3.3a) khá phức tạp. Ta sẽ dùng công thức (3.4a) v x = 010,064 + 110,288 + 2l0,432 + 3l0,216 - 1,8“ = 3 ,9 6 -3 ,2 4 = 0,72. Thí dụ 3.7, Cho hàm m ật độ của biến ngẫu nhiên X tuân theo phân phối mũ (xem thí dụ 2.8, để ý Ắ > 0) f(x) = 0, JC < 0, , X > 0. Hãy tính phương sai của X, Giải. Đầu tiên ta tính kỳ vọng theo (3.1) +CC' E X = ’ xf[x)dx = Ẳ xe - Ã 52 —oc 0 Từ đó dùng (3.4b) ta có; v x = Ả \ x ^ e ' ^ d x - \ = \ . 2. Đê ý rằng phương sai v x luôn là một sô" không âm. Từ định nghĩa ta cũng thấy rằng về mặt vật lý v x không cùng thứ nguyên (cùng đơn vị đo) đôi với X, vì vậy ta đưa vào khái niệm sau đây: Đ ịnh n g h ĩa 3. Độ lệch chuẩn của biến ngẫu nhiên X, ký liệu là ơ(X), được định nghĩa như sau: ơ { x ) = 4 v x . (3.5) Từ định nghĩa (3.5), nhiều khi người ta ký hiệu phương sai à cr{X) hoặc (nếu đã biết rõ là phương sai của biến nào). Độ ệch chuẩn được dùng thường xuyên hơn phương sai do có cùng đơn vị đo với chính biến X. 3. Cuôi cùng ta phát biểu một sô^ tính chất của phương sai và độ lệch chuẩn; (i) Vc = 0 (c - hằng sô); (ii) V{cX) = c'VX; a{cX) = |c|ơ(Z); (iii) Nếu X, Y độc lập thì ViX+Y) = v x + VY; a{X + Y) = ^ a ^ X ) + a^{Y). Chú ý điồu kiện độc lập là khá chặt, sau này ỏ chương III ta thây có tho giảm nhẹ. Từ ba tính chất trên, ta có thể dẫn ra 2 hệ quả quan trọng: - V(X + í ) = vx. - Phướn Ị sai của trung bình cộng n biến ngẫu nhiên độc lập cùng ph. n phôi sẽ bé hơn n lần phương sai của các biến thành phần, :ức là nếu VXị^ = cr^ Vỉ = 1,^1, thì: v x = vnơ n Đây chính là lý do khi đo đạc các đại lượng vật lý ngưòi ta thường đo nhiều lần rồi lấy trung bình cộng các kết quả. 53 3.3. Một sô đặc số khác 1 . Mốt là giá trị của biến ngẫu nhiên X có khả năng xuất hiện lổn nhất trong một lân cận nào đó của nó. Như vậy đôi vói biến ròi rạc mô"t là giá trị của X ứng với xác suất lớn nhất, còn đốĩ với biến liên tục mô"t là giá trị làm hàm mật độ đạt max. Như vậy mố^t có thể chỉ là cực đại địa phương và một biến ngẫu nhiên có thể có một môt hoặc nhiều mô't. Thí dụ 3.8. Cho hàm mật độ của biến ngẫu nhiên X tuân theo phân phối Vây-bun 0, X < 0, f{^) = X 4 -e \ x > 0 . [ 2 Hãy xác định môt của X. Giải. Môt của X sẽ là nghiệm của phương trình: Từ đó mốt sẽ là nghiệm của 1 - — = 0 . Nhưng do X > 0, 2 suy ra môt = yÍ2 ^ 1,414. 2. Trung vị là giá trị của biến ngẫu nhiên X chia phân phôi thành hai phần có xác suất giống nhau, tức là nếu ký hiệu trung vị là medX thì: P(X < medX) = P(X > medX) =2 Từ định nghĩa hàm phân phôi, rõ ràng để tìm trung vị ta chỉ cần giảiF(:r) = —. Trong nhiều trưòng hỢp ứng dụng, trung vị 2 là đặc trưng vị trí rất tốt, nhiều khi tô"t hơn cả kỳ vọng, nhất là khi trong sô" liệu có những sai sót thái quá. 54 Trung vị còn có tên gọi là phân vị 50% của phân phôi. Phân vị là một điểm (giá trị của X) sao cho xác suât để biến ngẫu nhiên nhận giá trị bé hơn nó sẽ bằng sô' phần trăm cho trưâc của tổng xác suất phân phôi, chẳng hạn ta nói rằng 2 là phân vị 72% của X nếu F(2)= 0,72. Thông thường ngưòi ta hay xét các phân vị 25%, 50% (trung vị), 75%, 95%,... Thí dụ 3.9, Tìm trung vị của biến X trong thí dụ 3.8. Giải. Rỏ ràng trung vị là nghiệm của phương trình: madX {medxỹ f{x)dx ~ 0,5 hay 1 ~e ^ = 0,5; từ đó suy ra medX - 1,665. Nói chung, ba sô^ đặc trưng kỳ vọng, môt và trung vị không trùng nhau, chẳng hạn từ thí dụ 3.8 và 3.9 và tính thêm trung bình, ta có EX = 1,772; môt = 1,414 và med X = 1,665. Tuy nhiên trong trường hỢp phân phôi đôi xứng và chỉ có một môt thì cả ba đặc trưng đó trùng nhau. 3. Mômen là khái niệm tổng quát hơn so vói kỳ vọng và phương sai. Đ ịnh nghĩa 4. Mô men cấp k đôi vối a của biến ngẫu nhiên X là một sô" xác định như sau: v,{a) ^ E{{X ~ af]. (3.6) Nếu a = 0, ta ký hiệu Vị, = Vk(0) = E{X^) và gọi nó là mômen gốc cấp k. Rõ ràng kỳ vọng chính là mômen gôc cấp 1 EX = Ui- Nếu a = EX, ta ký hiệu Vf,{EX) - E[(X - EX)^] và gọi nó là mômen trung tâm cấp k; cũng rõ ràng phương sai là mômen trung tâm cấp 2 vx = . Mômen có vai trò quan trọng trong thông kê và ứng dụng xác suâ"t. Giữa chúng (mômen gốc và mômen trung tâm) có các liên hệ sau: 55 1^2 = V 2 -V 'ỉ= ơ \ //3 =ư.ị - 3^2 ^] + 2 i>f, =Uị -iv.ịVị+6v.^Vị-3u‘l,.... Ngưòi ta còn dùng các mômen để đặc trưng cho hình dạng của hàm mật độ phân phôi: - Hệ sô bất đối xứng là tỷ sô" nếu = 0 đường a . . cong mật độ đôi xứng, nếu nó âm hay dương đưòng cong đó sè bất đôi xứng tương ứng với các đưòng I và II trên hình 3.1. - Hệ số nhọn là tỷ số' . Nếu tỷ sô^ này càng lốn ^4 đưòng cong có đỉnh càng nhọn hơn. Đưòng cong mật độ của phân phối chuẩn (xét ở mục sau) có /?2 “ 3. §4. MỘT SỐ PHÂN PHỐI THÒNG DỤNG 4.1. Phân phối đểu 1. Phân phối đều rời rạc Đ ịnh n g h ĩa 1. Biến ngẫu nhiên X được gọi là tuân theo luật đều rời rạc với tham sô' n, ký hiệu là nếu X có bảng phân phôi xác suất X 1 2 • • • n p{x)n n n(4.1) 1 1 1 1 Như vậy hàm xác suất sẽ có dạng p{i) - —, i-\,n . Ngưòi n ta còn mỏ rộng khái niệm phân phôi đều cho biến X nhận giá trị trên một tập hữu hạn bất kỳ có n phần tử {Xi, x„}; khi đó: 56 piXị) = i= ĩ,n . n Dễ dàng, nếu X - ^/(n) và từ (4.1), ta có ngay: E X ^ ^ - V X rì^ -1 2 12 2. Phân phối đều liên tục Đ ịnh nghĩa 2. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối đều liên tục trên [a;6] ký hiệu là x ~ ^/([a; ò]), nếu X có hàm mật độ (a < 6): 1 , x e f{x) = b-aa; 6] 0, X Ể a; b . (4.2) Đồ thị của hàm f(x) cho trên hình 4.1. Bằng tính toán đơn giản có thể tìm được: nếu X ~ 6]) thì: EX v x = a + b 12 Phân phối đều ^/([0: 1]) có vai trò rất quan trọng trong mô phỏng các sô" ngẫu nhiên. Hình 4.1 4.2. Phân phối nhị thức 1. Phân phối Béc-nu-li Định nghĩa 3. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối Béc-nu-li, ký hiệu là X ~ nêu hàm xác suất của nó có dạng: p(x) = pY~'‘, X = 0 và 1. (4.3) 57 Ta thây mọi phép thử chỉ có hai kết cục đều có thê mô hình hóa bằng phân phôi này. Chẳng hạn một phép chỉ có kết cục A vối xác suất p và A với xác suất q = 1 ~ p. Xây dựng biến ngẫu nhiên X sao cho P(X = 1) = P(A) = p vầ P{X = 0) = P(Ã j= g, ta có X p). X 0 1 p(x) ợ p EX = o.ợ + l.p - p , vx=ơ\q + p(l - p ) = pq. Trong thực tế phân phôi Béc-nu-li ít được sử dụng (có thể do nó quá đơn giản), tuy nhiên nó đưỢc dùng làm cơ sỏ để tìm luật phân phôi của các biến ngẫu nhiên khác. 2. Phân phối nhị thức Đây là một trong các phân phôi rât hay dùng trong thông kê hiện đại. ở chương I ta đã làm quen với lược đồ Béc-nu-li khi xét dãy n phép thử độc lập, giông nhau, trong mỗi phép thử sự kiện A xuất hiện với xác suâ^t p. Nếu gọi X là sô^ lần xuât hiện A trong dãy n phép thử đó, ta đã biết X có các giá trị từ 0 đến n với các xác suất tương ứng (ợ = 1 ~p): p(x) = (x) = x^O,n. (4.4) Đ ịnh nghrĩa 4. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối nhị thức, ký hiệu X - p) nếu hàm xác suât của nó có dạng (4.4). Bạn đọc hày tự xây dựng bảng phân phối xác suất của x~ p). Rõ ràng phân phôi Béc-nu-li ở trên là một trưòng hỢp riêng của phân phôi nhị thức khi n = 1 . Cần nhắc lại các điều kiện để có phân phôi nhị thức: 58 - dãy các phép thử giông nhau, độc lập; - trong mỗi phép thử chỉ có 2 kết cục (có và không); - hai tham sô^ hằng xác định: sô^ các phép thử n và xác suât xuất hiện 1 trong 2 kết cục trên là p. Thí dụ 4.1. Cho X - (5; 0,25). Hãy xây dựng bảng phân phôi xác suất của X, sau đó tính các xác suất; a) X > 3; b)X > 1; c) X < 4. Giải. Về m ặt ý nghĩa X là số lần xuất hiện sự kiện A nào đó trong dãv õ phép thử độc lập, biết rằng trong mỗi phép thử sự kiện A có xác suất P(A) = 0,25. Dùng công thức (4.4) với n - õ\ p ~ 0,25. ta sè có; X 0 1 2 3 4 5 pix) 0.2373 0,3955 0,2637 0,0879 0,0146 0,0010 Quan sát bảng số^ này ta thấy X ~ 1 ìầ giá trị có xác suất lớn n h ấ t, v ạy 1 là m ôt của X, trong ứng dụng ngưòi ta gọi là số lần xuất hiện chắc chắn nhất, Việc tìm các xác suất tương ứng dựa vào bảng sô" trên: a) P{X > 3) = p(4) + p(5) = 0,0156; b) P{X>\) = 1 - P ( X < 1) = 1 -p (0 ) = 0,7627; c) P(X < 4) = 1 - P{X > 4) = 1- p(5) = 0,9990. Có thể dựng biểu đồ (đồ thị của hàm ròi rạc) của p{x) như hình 4.2. Bây giò ta tính kỳ vọng và phương sai của phân phôi nhị thức. Rõ ràng nếu X -ờì{n, p) p M 0,4- thì X là sô" lẳn xuất hiện sự kiện A nào đó trong dãy n phép thử Béc-nư-li. Gọi X, là sô" lần xuất hiện sự kiện A đó trong phép thử 0,2- 0 1 2 3 4 Hinh 4.2 X 59 thứ i, i = 1, n . Ta thấy Xi chỉ có hai giá trị 0 và 1 và P(A) = p = P{Xị = 1), X = Xi + X2 + ...+ x„. Do các X; độc lập, mặt khác EXi = p, VXị = pq, nên ta có: EX = i = l v x = ỵ v x , = npq. i = l Chú ý rằng khi n khá lớn mức độ đối xứng (đối với kỳ vọng) của hàm xác suất càng rõ rệt. Nói chung việc tính xác suất theo công thức (4.4) khá phức tạp, tuy nhiên bằng các chương trình máy tính thì không có vấn để gì lớn. Việc tính xấp xỉ các xác suất đó đã xét ở §3 chương I và ở các mục dưới đây. Ngoài ra dễ dàng chứng minh hai kết quả sau: (i) Nếu X ~ ^ { n , p) thì Y = n - X~ ịn, l-p). (ii) Nếu.Xi~ p), X2~S9(ri2, p), thìX) + ^ 2~ +ri2,p). 4.3. Phân phối Poa-xông Đ ịnh n gh ĩa 5. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối Poa-xông, ký hiệu là x ~ nếu hàm xác suâ't của nó có dạng: p(jc) = ^ ^ , :)C = 0,1, 2,... (4.5) a:! Phân phối Poa-xông có nhiều ứng dụng trong lý thuyết phục vụ đám đông, kiểm tra chất lượng sản phẩm... Chang hạn số cuộc gọi điện thoại của một tổng đài trong 1 ngày, số lượng khách hàng của một nhà băng trong 1 giờ... đều là các biến ngẫu nhiên có phân phối Poa-xông. Có thể chứng minh rằng [1 - pỴ' , khi n -» + 00, p -> 0 sao cho np ^ Ả = hằng sô", có giối han — -— . Trong thưc xĩ hành, nếu n khá lớn và p khá bé, thì (À = np): 60 p„(x) = C>^(1 - p)"-^ - Thí dụ 4.2. Ngưòi ta vận chuyển 5000 chai rượu vào kho với xác suất vỡ của mỗi chai là 0,0004. Tính xác suất để khi vận chuyển có không quá 1 chai bị vỡ. Giải. Có thể dùng lược đồ Béc-nu-li (phân phối nhị thức), nhưng n = 5000 rất lớn, còn p = 0,0004 quá bé. Nếu gọi X là số chai bị vỡ khi vận chuyển, có thể coi phân phối của X xấp xỉ với phân phôi Poa-xông với Ă = np = 2.Tử đó theo (4.5): p(0 < X < 1) = Ặ « 0,406. ^ ^ 0! V.e^ Ta đi tính các sô" đặc trưng của X ~ ■ hx ct? - X EX ^J^xp{x) = ỵ^xe~^~ x=0 a:=0 ^ * v x = Eịx'^) - { E x f = ì ‘ + Ả- Ẳ^ =Ă. Đôi khi ngưòi ta yêu cầu tính mốt của X. Người ta đã chứng minh Ă - 1 < mốt X < Ằ. Nếu Ả nguyên, ta có 2 mốt là Ả và Ả - 1 ; còn nếu Ă không nguyên, môt sẽ là giá trị nguyên nằm giữa A - 1 và Ắ. Trong thí dụ 4.2 môt của X là 1 và 2, đó là số chai có khả năng vỡ nhiều nhất khi vận chuyển (xác suất vỡ bằng 0,2707 cho mỗi trưòng hỢp X = 1 hoặc X = 2). 4.4. Các phân phối rời rạc khác 1 . Một trong các giả thiết của phân phối nhị thức là sự độc lập của các phép thử thành viên trong dãy. Trong nhiều bài toán thực tế giải thiết đó không được thỏa mãn. Một trường hỢp cổ điển là việc chọn mẫu không hoàn lại, trong đó xác suất 61 không còn la hảng sô nữa. Thí dụ ta có N sán phấm trong đó có m phế pbôm: nếu ta chọn không hoàn lại ra n sản phẩm và gọi X là sô" phế phẩm trong đó thì P(X = x) sẽ không còn cỉược tính theo (4.4) được nữa (để ý muôn tính theo (4.4) ta phải chọn có hoàn lại). Theo định nghĩa cổ điển, xác suất để trong n sản phẩm có đúng X phế phẩm chính là; X P (x) = ■ ■ .r - 0, 1 , ....n. tl ^ ' r'\n ■ Đ inh nghĩa 6. Biên ngẫu nhiên X được gọi là tuân theo luật phân phôi siêu hinh học, ký hiệu là X - .'■TíiN, n, p). nếu hàm xác suâ^t được xác định theo công thức: /■ 'IX X p(^) = = 0, 1, /7, (4.6) Để ý rằng trong công thức (4.6). nếu lùu ý đến thí dụ bên trên đinh ng’iìa, ta có p - — là tỷ lê phê phám lúc ban đaiu và N n ế u đ ặ t ợ = 1 - p thì (4.6) sẽ trớ th à n h : ^n-x ’ X - 0, 1, n. Khi N rất lớn, xác suâ^t p sẽ ít thay đổi và khi đó ta có thê dùng lại (4.4) để xấp xỉ cho (4.6) và giả thiết p là hằng xác định không bị thay đểi đáng kể. Thí dụ 4.3. Trong một hộp đèn 15 bóng có 5 bóng kém châ^t lượng. Chọn ngảu nhiên ra 10 bóng (tất nhiên không hoàn lại), hãy lập bảng phân phôi xác suất của sô^ bóng kém chất lượng trong mẫu chọn ra. Giải. Rõ ràng X tuân theo phân phôi siêu hình học với 1 _ . . N" = 15, = 10 và p = —. Dùng phần mểm đế tính theo (4.6), ta 3 có bảng phân phôi như sau: 62 X p{x) 0 1 2 3 4 5 ¥,00033 0,01665 0,14985 (^39960 0 34965' 0,0.^592 X 6 7 8 9 1 0 p(x) 0 0 0 0 0 Trong trường hỢp này ta không thể xấp xỉ các xác suất bằng phân phôi nhị thức đưỢc. chang hạn tính theo (4.4) với n - 10, p = - , ta có P,o(3) = 0,26012; p,„(7) = 0,01626, ... Trong thực 3 hành khi N > lOn ngưòi ta mới chấp nhận xỉ bằng phân phốĩ nhị thức. Có thế chứng minh được rằng nếu X - .^{N , riy p): N ~n EX = np\ v x = npq~ . N - \ Ngoài ra khi —> 00 sao cho —— > 0 ta có: N ^ỉl-x Vối p - Điều đó giải thích cho việc xấp xỉ phân phôi siêu hình bằng phân phôi nhị thức khi N khá lớn. Trong mục này ta định nghĩa thêm hai phân phôi ròi rạc lấy cơ sở của phép thử Béc-nu-li. 2. Đ ịnh nghĩa 7. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối hỉnh học, ký hiệu là X - ^(p)y nếu hàm xác suất của nó có dạng: p(x) = p { l - p ) \ X = 0, 1, 2, ... (4.7) Từ đó ta thấy X chính là sô' lần không xuất hiện trước lần xuất hiện đầu tiên của một sự kiện A nào đó (trong dãy Béc-nu-li với P(A) = p). Dễ dàng chứng minh khi X - &ip)- 63 p p p p 2 • 3. Đ ịnh nghĩa 8. Biến ngẫu nhiên X đưỢc gọi là tuân theo luật phân phối nhị thức âm, ký hiệu \kX ~ cA^^{r, p), nếu hàm xác suất của nó có dạng: p{x) = il - p ) \ x = 0 ,l,2 ,... (4.8) Ý nghĩa của X chính là số lần không xuất hiện trước lần xuất hiện thứ r (r > 0) của một sự kiện A nào đó (trong dãy Béc-nu-li với P{A) = p). So sánh (4.7) và (4.8) ta thấy rằng phân phôi hình học là trường hỢp riêng của phân phôi nhị thức âm khi r = 1 . Cũng có thể chứng tỏ khi X ~ cA"í/ì (r, p). = = (ợ = l - p ) . p p Có thể tóm tắt các quan hệ của các phân phối rời rạc ở trên bằng sơ đồ sau; Sơ đồ quan hệ giữa các phân phôi rời rạc 64 4.5. Phân phối chuẩn Đây là phân phôi liên tục quan trọng và có ứng dụng rộng rãi nhât, còn có tên gọi là phăn phối Gao-xơ, Đ ịnh nghĩa 9. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối chuẩn, ký hiệu lầ X ~ ơi\a, ơ^), nếu hàm mật độ của nó có dạng ix-ciý f{x) = '2ơ~ ơ xeR. (4.9) 7T Dễ thây hai tham sô" trong (4.9) là a và cũng chính là hai sô" đặc trưng quan trọng EX và vx, còn ơ à độ lệch chuẩn của X. về mặt đồ thị, đường cong (4.9) có dạng hình chuông (xem hình 4.3). Từ hình vẽ 4.3 ta thấy hàm f{x) trong (4.9) đốì xứng qua EX = a, từ đó m edx ~ a, đồng thồi mốt X - a do hàm đạt m a x tại X - a. Nếu ta lây lân cận crcủa a, thì phần diện tích chắn bởi /'(x), tục hoành và các đường X = a ± ơ- sẽ có diện tích bằng 68,26% (đơn vị diện tích). Đó cũng chính là P(l X - a\< ớ) - 68,26%. Tương tự ta cũng có P (|X -a |< 2 c x ) = 95,44%; P ( |X - a I < 3a) = 99,74%. (4.10) Công thức (4.10) cho ta thây hầu chắc chắn biến ngẫu nhiên X ơỲ\a, cr) fiè nhận giá trị trong lân cận Scrcủa kỳ vọng, sự kiện đó mang tên gọi quy tắc SơYắt quen thuộc trong các tính toán kỹ thuật. Qua hình 4.3 ta cùng thấy rõ nếu EX là đặc trưng định vỊ của phân phôi, thì v x là đặc trưng độ tán xạ. 65 Nếu & càng lớn f{x) phân tán nhiều hơn, đỉnh đồ thị càng thâp và tù hơn, đưòng cong tiệm cận tới trục hoành chậm hơn (chú ý là tổng diện tích chắn bởi f{x) và trục Ox luôn bằng 1). Thí dụ 4,4. Độ dài một chi tiết máy giả sử tuân theo luật phân phôi chuẩn với trị trung bình 20cm và độ lệch chuan là 0,5. Hãy tính xác suất khi chọn ngẫu nhiên ra một chi tiết thì độ dài của nó: a) lớn hơn 20cm; b) bé hơn 19,5cm; c) lớn hơn 21,5cm. Giải. Gọi X là độ dài của chi tiết máy chọn ra, rõ ràng X ~ o4'^(20; 0,5'). a) Do phân phôi đôi xứng qua kỳ vọng nên P(X > 20) = 0,5. b) Do P(19,5 < X < 20,5) = 68,26% (quy tắc la) nên xác suất để X nằm ngoài khoảng đó là 31,74%. Do tính đôi xứng P(X < 19,5) = 15,87% (và cũng bằng P(X > 20,5)). c) Do cùng lý do như trên và dùng quy tắc 3cr ta có P(X > 21,5) = (1- 99,74%)/2 = 0,13% = 0,0013 (xác suất không đáng kể). Tuy nhiên trong thí dụ trên khó tìm được xác suất để độ dài X nằm trong một khoảng tùy ý. Có hai cách giải quyết hoặc dùng máy tính với các phần mềm tương ứng, hoặc sử dụng các bảng sô" có sẵn. ở chương I §3 ta đã đưa vào khái niệm hàm Láp-la-xơ ^(x) - e '^dt. (4,11) ^ 4 ^ ị Ta sẽ tìm cách biến đổi (4.9) và hàm phân phôi tương ứng của X ~ ơị'\a; (ỷ) để có thể dùng đưỢc bảng sô" hàm trên. Dễ thây từ (4.9), hàm phân phối của X có dạng: 66 F(x) = c 2a dt.(4.12) ơ\^Z7ĩ yỈ2. Dùng phép biến đổi 2 = ~—— ta có thể đưa (4.12) về dạng ơ x- a o F W = 1 V2e dz n x- a a z* yÍ2ndz +'J2n 0 (4.13) Mặt khác phép biến đổi biến trên sẽ ứng với phép biến đổi: x -a z = (4.14) ơ từ đó do cV{a; <ỷ), nên z ~ ũ4''(0; 1) vối hàm mật độ: f{z) V21e 2 (hàm Gao-xơ). n Phân phôi ũV{0; 1) sẽ có tên gọi là phân phôi chuẩn rút gọn, hay phân phôi chuẩn chuẩn tắc và động tác biến đổi (4.14) đưỢc gọi là quy chuẩn. Do kỳ vọng của z bằng 0 nên 0 p[z<0)= f[z^dz = ữ,b - 0 0 và từ (4.13) ta có: ơ(4.15) Việc biết đưỢc hàm phân phôi trong (4.15) cho phép chúng ta tính được mọi xác suất của X thông qua hàm Láp-la-xơ trong (4.11) đưỢc xác định trong bảng sô" 2. Chú ý rằng z chỉ có phân 67 phôi chuẩn khi biến X tương ứng tuân theo luật chuẩn, tuy nhiên z luôn có kỳ vọng 0 và phương sai 1 . Bây giò giả sử ta muôn tính p[a ĩi khi p < 0,5 hoặc ỉi(l ~ p) > 5 khi p > 0,5. Từ đó nếu X - ữì{n, p) và có các điều kiện ở trên thì (xem §3 chương I): p(a < X < /?) - ệp-np yỊnpq- ệa -np npq(4.18)

\)+ <íí(l,60) = 0,9743. Để ý là kết quả thật của xác suất này là 0,978. Ngưòi ta cùng chứng minh được rằng, nếuX~^(Ầ) thì: X -Ă L VI Ả—*0O 4 cT(0; 1). 4.6. Các phân phối liên tục khác Ngưòi ta đã thấy rằng nhiều phân phốĩ liên tục được cảm sinh trực tiếp bởi phân phối chuẩn (kể cả chuẩn). Trong mục này ta sẽ xét một số phân phối quan trọng hay dùng trong thốhg kê. Các phân phôi khác có thể tham khảo trong bảng thông kê ở cuối tiết này. 1. Phân phối vối n bậc tự do, ký hiệu là ;Ị^(n), có thể được định nghĩa bằng việc xác định hàm mật độ: f(x) = , JC > 0, n > 0, trong đó hàm gam-ma đã đưỢc xét trong giải tích nx) có các tính chất Ví nguyên (i) m + 1) = i! (i > 0); (4.19) (ii) r v2 .- - 1 2 3 1 2 (i > 2, lẻ); (iii) r{x) = (x - 1)F(:!c - 1), X e R. 70 Tuy nhiên cách định nghĩa này khá phức tạp và không cho ta cách xác định rõ ràng phân phôi ^ xuâ^t phát từ phân phôi chuẩn. Đ ịnh nghĩa 10. Xét n biến ngẫu nhiên độc lập Xị - c4 '{ỊÒ\ 1), 1 - 1, n . Khi đó biến ngẫu nhiên: (4.20) i = l Rỏ ràng (4.20) cho ta cách nhận biết đơn giản một biến có phân phôi khi bình phương xuất phát từ n biến độc lập cùng phân phôi chuẩn chuẩn tắc. Dạng đồ thị của hàm mật độ (4.19) cho ở hình 4.4. Các sô^ đặc trưng quan trọng là EU^-n, VU, = 2n. Phân phôi ^ có một vài tính chất quan trọng: a) Nếu X ~ /in ), Y - / (m), và độc lập => X + F ~ ;f{n + m). u - n -r n>2 n = 2 b) \/2Ã i n->x o4^'{0; 1). Hình 4.4 Ngoài ra có một hệ quả quan trọng sẽ được dùng nhiều trong thông kê: Nếu ta có n biến độc lập ' cy^^(a; ơ^); t = 1, /I, và x = -{x, +...+ Z „ ) t h ì - V x ( X , - / ( n - 1 ) . (4.21) ỉĩ ơ i^] Trong (4.21) do ta thay thế a bằng X , vì vậy bậc tự do của phân phôi đă bớt đi I. Việc tính toán với phân phôi ;^{n) đưa vê sử dụng bảng 4 trong phụ lục hoặc dùng máy tính. 2. Ta sẽ dùng cách định nghĩa ở trên để xác định luật phân phối Stiu-đơn với n bậc tự do, ký hiệu là t{n). 71 Đ ịnh nghĩa 11. Cho X và y là hai biến ngẫu nhiên độc lập tuân theo luật c4'X0; 1) và ỵ^{n) tương ứng. Khi đó biến Y n (4.22) Hàm mật độ của phân phôi t{n) cho ở bảng cuôi tiết, đồ thị của nó có dạng rất giông với đưòng cong chuẩn. Các sô' đặc trưng của là (chú ý hàm mật độ đôi xứng): ET^ = 0 {n > 1); v r ' = ^ ( « > 2). Phân phối Stiu-đơn có tính chất quan trọng: / > cyf '{0; 1). ^ ;ỉ->oc ' ^ Trong thực hành, khi n > 30, đồ thị của đưòng cong mật độ phân phôi t{n) đã rất gần với Ể>/ '(0; 1). Chú ý khi n = 1 , ta có phân phối Cô-si, đó là phân phối không có mô men nào. Bảng phân vị t{n) cho ở phần phụ lục (bảng 3). 3. Tỷ sô" của hai biến ngẫu nhiên độc lập có phân phối cho ta một phân phối mới (ký hiệu là í ĩ (n, m) - phân phổi Phi-sơ - Sne-đơ-co với nvằm bậc tự do). Đ ịnh nghĩa 12 . Cho X và y là hai biến ngẫu nhiên độc lập tuân theò luật ỵ^{n) và x^{ni) tương ứng. Khi đó biến u = (4.23) Y Im Hàm mật độ của phân phổi ỉỹ {n, m) cho ở bảng cuôi tiết. Đồ thị của hàm đó có dạng gần giông với đường cong mật. độ Biến có các đặc trưng: m-2^ ’ 72 2m^(n + m-2) . . VU = —----------------U m > 4 . nịm - 4)(m - 2) Để ý từ (4.23), do vai trò của X và y có thể đổi cho nhau nên nếu u ~ ỂF (n, m), V ~ .‘ỹ {m, n) thì ơ và — có cùng phân phôi. Ngoài ra nếu M = 1 , từ (4.22) thấy ngay rằng tuân theo luật ,^(1 , m). 4. Đ ịnh n ghĩa 13. X tuân theo luật phân phối Gam-ma, ký hiệu là X ~ ỵ[r, ằ) , nếu hàm mật độ có dạng: f{x) = - Ạ - ,r>0,Ả>0,x>0. (4.24) r ( x ) (hàm r(x) đã xác định ở trên). Các số đặc trưng của X ~ ỵ(r, ằ) : E X = j ; V X = - ^ . Ằ Ta để ý một số tính chất quan trọng của phân phối Gam-ma a) Nếu X ~ y{p, Ẫ), Y ~ y{q, Ả) và độc lập => X + y ~ Xợ + p, ^)- b) Nếu X ~ /(r ,l) thì x - r , £/K(0; 1). Đế ý nếu r = 1 , ta có phân phôi mũ £{Ả) (xem thí dụ 2.8 chương này) có nhiều ứng dụng trong lý thuyết độ tin cậy. 5. Bảng tổng kết các phân phối liên tục. 73 Bảng tổng kết phân phối liên Hàm mặt âộf{x) EX vx ơyỈ2n exp /x-a ơ --1 .2 /> 2 e x> 0 a n ơ 2n 22 rn>0 n n rn + l TĩTl r .2 \ 1 +n n+l 0(n>\) rV n-2 n+m X { m+ nx) 2 2nì^ {n + m - 2 ) m ơ rv2y rm JC> 0 m,n>0 m -2(m > 2) n { m - 2 f { m - 4 ) {m > 4) Bảng tổng kết phối liên tục (tiếp) Ã x>0 a r Ảe Ã, X > 0 Ằ' 6-a< x 0 a-^b 1.1 Ằ 12 r 1 + -/I-r- I .iìả J n/2^x'^exp (7vz;r (Inx-g)" 2ơ-' A>0 ơ-> 0 exp a + ơ' expị2a+ơ-') exp(cr^)-l r{a + ấ) g - 1 0 0 (a + Ẵý (a + /I +1) Từ bảng tổng kết trên, có thể xây dựng sơ đồ quan hệ sau: o Z(±x,) Sơ đồ quan hệ g/ũa các phân phối liên tục BÀI TẬP Một xí nghiệp có 3 xe ô tô với các xác suất làm việc tốt trong ngày là 0,99; 0,995 và 0,999. Tìm bảng phân phối xác suất của sô" xe hỏng trong ngày. Hai cầu thủ thay nhau ném bóng vào rổ cho đến khi nào trúng rô thì dừng ném, biết rằng xác suất ném trúng của mỗi người tương ứng là 0,6 và 0,7 (trong mỗi lần ném). Tìm luật phân phối xác suất của: a) số lần ném của cầu thủ thứ nhất; b) số lần ném của cả hai cầu thủ. Vlột tổ có 6 nam và 4 nữ. Chọn ngẫu nhiên ra 3 ngưòi. Tìm luật phân phôi của sô" nữ trong nhóm đưỢc chọn. 76 Xác suât chữa khỏi bệnh A của một bác sĩ là 0,8. Tìm luật phân phôi của số^ được chữa khỏi bệnh trong một nhóm bệnh nhân gồm 5 người do bác sĩ đó điều trị. Cho bảng phân phôi xác suất của một biến X nào đó có dạng: X 1 2 3 4 5 p(x) a 2a a 3a 2a (a là tham số). Hãy xác định: a) tham sô" a; b) giá trị k nhỏ nhất sao cho P{X < Ã) > —.2 Một vùng dân cư có tỷ lệ sôt rét là 5%. cần chọn ra ít nhất 6, bao nhiêu ngưòi để với xác suât 95% trong sô" đó có ít nhất 1 ngưòi mắc bệnh sôt rét? 7, Xác suất bắn trúng đích của một khẩu súng là p. Tiến hành bắn liên tiếp trong điều kiện như nhau đến khi trúng thì dừng bắn. Tìm sô" đạn trung bình phải bắn. 8. Cho hàm mật độ của biến ngẫu nhiên X có dạng: f{x) = x>0. (l + e“")ln2 ’ Hãy tính EX và v x Cho biến X có hàm phân phôi có dạng: 9, 0, X < 2, f ( i ) = X a + b arcsin —, - 2 < X < 2, 2 1, X > 2. a) Xác định a và b; b) Tìm hàm mật độ f{x)\ tìm các sô đặc trưng EX, vx, mốt X, medX. 10. Năng suất lúa ở một địa phương là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng 42 tạ/ha và cr= 3 tạ/ha. Tìm xác suất 77 để khi gặt ngẫu nhiên 3 thửa ruộng thì có 2 thửa có năng suâ^t sai lệch so với trung bình không quá 1 tạ/ha. 11. Kiểm tra chất lưỢng 100 sản phẩm với tỷ lệ chính phẩm 0,95. Tìm xác suất để sô^ sản phẩm đạt tiêu chuẩn nằm trong khoảng từ 900 đến 980. 12 . ở một thửa ruộng trung bình trong một giò tìm được 60 con sâu. Tìm xác suất trong vòng 1 phút không tìm thây con sâu nào. 13. Tìm môt của biếnX tuân theo luật nhị thức. 14. Một viên đạn có tầm xa trung bình là 300 m. Giả sử tầm xa đó là một biến ngẫu nhiên tuân theo luật chuẩn với a = 10. Hãy tìm tỉ lệ đạn bay quá tầm xa trung bình từ 15 đến 30 m. 15. Biên độ dao động của thành tầu thủy là biến ngẫu nhiên X tuân theo luật phân phôi Rê-le f{x) = X ơ 2ơ‘ [x > 0). Tìm xác suất để biên độ dao động lốn hơn trung bình của nó. 16. Từ kết quả 2 lần thí nghiệm ta có 2 đại lượng ngẫu nhiên độc lập cùng phân phôi với bậc tự do tương ứng là 4 /à 6. Tìm xác suất để đại lượng thứ nhất bé hơn 3 lần đại .ượng thứ hai. 17. Ch í các X: ~ 0, ị , i = 1,5; 0, ^ , i = 1,11; V, giả ỏ ) V sử chúng độc lập. Tính p 3 ỵ x ỉ > V Ỉ = 1 Ỉ = 1 18. Cho X ~ £^'(3, l), Y ~ 2) độc lập. Tìm các xác gaấi a)Z > Y ; b) X > 27. 78 Chương Hi BIÊN NGẪU NHIÊN NHIÊU CHIÊU §1. LUẬT PHÂN PHỐI CỦA BIẾN NGẪU n h iê n NHIỀU CHIỀU 1.1. Các khái niệm cơ sở 1 . ở hai chương trưốc ta đã nghiên cứu bản chất xác suất của một biến ngẫu nhiên riêng rè. Nhưng trong thực tế nhiều khi phải xét đồng thời nhiều biến khác nhau có quan hệ tương hỗ và dẫn tối khái niệm ưéc tơ ngẫu nhiên hay biến ngẫu nhiên nhiều chiều. Những thí dụ về các biến nhiều chiểu rất phổ biến, chang hạn khi nghiên cứu một chi tiết máy, ta quan tâm đồng thòi đến nhiều khía cạnh khác nhau như trọng lượng, kích thước (riêng nó đã là nhiều chiều), chất lượng, chất liệu... Việc nghiên cứu riêng rẽ từng khía cạnh có thể cho ta các thông tin không đầy đủ. Để cho đơn giản, ta nghiên cứu biến ngẫu nhiên 2 chiều (X, Y), trong đó X vằ Y là các biến một chiều. Hầu hết các kết quả có thể mở rông khá dễ dàng cho biến n chiều. Nếu X và y là ròi rạc, ta có biến ngẫu nhiên hai chiều ròi rạc; nếu chúng liên tục, ta có biến hai chiều liên tục. Sẽ phức tạp hơn một chút là một biến ròi rạc và một biến liên tục mà ta không xét ở đây. 2. Ta phát triển khái niệm hàm phân phối xác suất cho biến ngẫu nhiên hai chiều. Xét hai sự kiện A = {X < và < y}. Đ ịnh nghĩa 1. Hàm phân phối xác suất của biến hai chiều (X, Y) được xác định như sau; F{x, y) = P{AB) = p { x < X-, YF(x,y) > 0; (ii) F(x, y) không giảm theo từng đôl sô"; (iii) F(-co, y) = jP(x;-CX)) = 0; F(+co;+oo) = l(giá trị ±00 hiểu theo nghĩa lây giới hạn); (iv) Vối < X2, yi < y 2 ta luôn có P(x^ < X < X2; F < y.) = ^ 2) - F(^2. yù - ^(^ 1, yi) F(x^,y,). Đó chính là xác suất để điểm ngẫu nhiên (X, Y) rơi vào miền chữ nhật ABCD (xem hình 1.1). Để ý rằng F (x ;+ 00) = p ( x < x; F <+00) = p ( x < x) = (x); F { ^ ; y) = P{X < + cx); Y < y) = P {Y < y ) = F^{y) là các phân phôi của riêng từng thành phần X vằ Y tương ứng; chúng đưỢc gọi là các phân phối biên của biến hai chiều (X, Y). Đó cũng chính là các phân phôi (một chiều) thông thưòng của X và Y. 3. ở chương I ta đã làm quen với khái niệm độc lập của hai sự kiện A và B: chúng đưỢc gọi là độc lập nếu PịẠB) ~ P{A)P{B). Áp dụng khái niệm này vào (1 .1) ta có 80 Y y2 3^1 0 Hình 1.1 Đ ịn h nghĩa 2. Hai biến ngẫu nhiên X và y được gọi là độc lập nếu F (x,y) = F,(x)F2(y). (1.2) Tất nhiên nếu X và y độc lập, ta có thể nghiên cứu riêng rẽ từng biến theo các phường pháp đã có và từ các phân phối biên của X và Y có thể xác định được phân phối của (X, Y) theo (1.2). Tuy nhiên chúng không đủ để xác định phân phối đồng thòi nếu X và y không độc lập. 1.2. Phân phối xác suất của biến ngẫu nhiên hai chiều rời rạc 1. Giông như trường hỢp một chiều ta tìm cách xác định biến hai chiều rồi rạc qua bảng phân phối xác suất. Đ ịn h nghịa 3. Bảng phân phối xác suất của biến (X, Y) rời rạc là V2 ... :Vm Y .J ■ X Pll P 12 •.. Pij ... P\m Pĩ (^1) ^2 P21 P 22 P 2 j . P2m P2(^2) •• •• •. •...•• Pil Pi2•Pij Pìm P l ) •1• •,• P nl Pn2 ... • • • Pnm Pl ) X{P 2 (>'1 ) pÁy2) P2(yj) ... Pìiym) 1 trong đó Pịị = p ị x - Xị-,Y = yj"j là xác suất đồng thời để X lấy giá trị X i, i = l,ra , và y lấy giá yj, j = l,m. Bảng này có thể trở thành vô hạn khi n, m nhận giá trị 00. Giông như trong trường hớp một chiều, ta xác định hàm xác suất p(a:, y^sao cho y-) = i= l,n, j = l,m . Hàm này có tính chất: 81