Bài giảng Xác suất thống kê - Chương 7: Kiểm định giả thiết
Giả thiết H0 là một khẳng định của tham số tổng thể và H1 là một trong các khẳng định:
• Tham số này lớn hơn giá trị được phát biểu (kiểm định phía phải).
• Tham số này nhỏ hơn giá trị được phát biểu (kiểm định phía trái).
• Tham số này lớn hơn hay nhỏ hơn giá trị được phát biểu (kiểm định hai phía).
Sau khi kiểm định được thực hiện và thống kê S được tính thì giá trị P của kiểm định này là xác suất sao cho giá trị của S về hướng H1 nếu giả thiết H0 là đúng.
Ths. Nguyễn Công Trí Copyright 2001 KIỂM ĐỊNH GIẢ THIẾT KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT (Xem) KIỂM ĐỊNH ĐẶC BIỆT VỚI MẪU LỚN (Xem) KIỂM ĐỊNH ĐẶC BIỆT VỚI MẪU NHỎ (Xem) QUAN HỆ ƯỚC LƯỢNG VÀ KIỂM ĐỊNH (Xem) ĐƯỜNG CONG ĐẶC TRƯNG–LỰC KIỂM ĐỊNH (Xem) KIỂM ĐỊNH CHI BÌNH PHƯƠNG (Xem) PHƯƠNG PHÁP ĐIỀU CHỈNH YATE (Xem) HỆ SỐ NGẪU NHIÊN (Xem) BÀI TẬP (Xem) Ths. Nguyễn Công Trí Ths. Nguyễn Công Trí Copyright 2001 KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT CÁC QUYẾT ĐỊNH THỐNG KÊ (Xem) GIẢ THIẾT THỐNG KÊ–GIẢ THIẾT KHÔNG (Xem) KIỂM ĐỊNH GIẢ THIẾT VÀ Ý NGHĨA (Xem) SAI LẦM LOẠI I VÀ SAI LẦM LOẠI II (Xem) MỨC Ý NGHĨA (Xem) CÁC KIỂM ĐỊNH CÓ LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN (Xem) KIỂM ĐỊNH MỘT PHÍA VÀ HAI PHÍA (Xem) GIÁ TRỊ P (Xem) CÁC QUYẾT ĐỊNH THỐNG KÊ Trong thực tế ta thường đưa ra một quyết định về tổng thể dựa trên cơ sở thông tin trên mẫu. Các quyết định như thế được gọi là các quyết định thống kê. Ví dụ, trên cơ sở dữ liệu mẫu, ta quyết định liệu một loại huyết thanh mới thực sự có hiệu quả trong việc chữa khỏi một căn bệnh nào đó hay không? liệu một phương án giáo dục này có tốt hơn phương án khác hay không? liệu một đồng xu có công bằng không? Nhằm đưa ra một quyết định, ta lập các giả thiết. Các giả thiết có thể đúng hoặc sai, được gọi là các giả thiết thống kê. Ví dụ, muốn quyết định xem đồng xu có công bằng hay không, ta lập giả thiết đồng xu công bằng, nghĩa là p = 0,5. Giả thiết này được gọi là giả thiết không, ký hiệu là H0. Bất kỳ giả thiết nào khác với giả thiết không thì được gọi là giả thiết phòng hờ hay giả thiết thay thế. Ví dụ, nếu giả thiết không là p = 0,5 thì giả thiết phòng hờ có thể là p = 0,7, p ≠ 0,5 hay p > 0,5, ký hiệu là H1. GIẢ THIẾT THỐNG KÊ –GIẢ THIẾT KHÔNG Nếu dựa trên giả định cho rằng giả thiết không (H0) đúng, nhưng các kết quả được quan sát trên một mẫu khác với điều mà chúng ta mong đợi của giả thiết H0 thì ta có khuynh hướng bác bỏ giả thiết này (hay ít nhất không chấp nhận giả thiết trên). Ví dụ, trong 20 lần tung một đồng xu có 16 lần xuất hiện mặt ngửa thì ta có khuynh hướng bác bỏ giả thiết cho rằng đồng công bằng, mặc dù chúng ta có thể mắc sai lầm. Các thủ tục giúp chúng ta quyết định chấp nhận hay bác bỏ một giả thiết thì được gọi là kiểm định giả thiết, kiểm định ý nghĩa hay luật kiểm định. KIỂM ĐỊNH GIẢ THIẾT VÀ Ý NGHĨA Sai lầm loại I: khi chúng ta bác bỏ một giả thiết mà giả thiết đó là đúng. Sai lầm loại II: ta chấp nhận một giả thiết mà giả thiết đó lẽ ra phải được bác bỏ. Hướng giải quyết sai lầm trong quyết định Thiết kế một kiểm định sao cho khi đưa ra quyết định thì sai lầm xảy ra nhỏ nhất. Điều này khó thực hiện vì giảm sai lầm loại này thì tăng sai lầm loại khác nên có sự thỏa hiệp: hạn chế loại sai lầm nghiêm trọng hơn. Một phương pháp duy nhất hạn chế cả hai loại sai lầm là tăng kích thước mẫu, mà điều này có thể hoặc không thể được. SAI LẦM LOẠI I VÀ SAI LẦM LOẠI II Khi kiểm định một giả thiết, rủi ro mắc sai lầm loại I với xác suất lớn nhất được gọi là mức ý nghĩa của kiểm định (thường được xác định trước khi tiến hành chọn mẫu). Trong thực hành, mức ý nghĩa thường là 0,05 hay 0,01, tuy nhiên các giá trị khác cũng được sử dụng. Chẳng hạn, mức ý nghĩa được chọn để kiểm định một giả thiết là 0,05 hay 5%. ie, nếu giả thiết H0 đúng thì chúng ta tin chắc 95% quyết định là đúng. Trong trường hợp này, ta nói giả thiết đã bị bác bỏ ở 0,05 mức ý nghĩa, hay chúng ta quyết định sai lầm với xác suất 0,05. MỨC Ý NGHĨA Minh họa, giả sử thống kê mẫu S ~ N(S, S2). Nếu giả thiết đúng thì ta tin chắc 95% giá trị z của thống kê mẫu S sẽ nằm giữa -1,96 đến 1,96. Chúng ta có phát biểu: Bác bỏ giả thiết với mức ý nghĩa 0,05 nếu giá trị z của thống kê S nằm ngoài khoảng –1,96 đến 1,96 (ie, z >1,96 hay z 12, giá trị P = P(Z 1,9) = 0,029. Với H1: 12. Nếu giá trị P lớn, bằng chứng không bác bỏ H0 để tham khảo H1. Trường hợp (ii), P = 0,97 nên không thể bác bỏ H0: =12 để tham khảo H1: 12. Ý NGHĨA CỦA GIÁ TRỊ P P(Z z1) P(Z z1) P(Z z1) P(Z z1) Ths. Nguyễn Công Trí Copyright 2001 CÁC KIỂM ĐỊNH ĐẶC BIỆT VỚI MẪU LỚN KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ (Xem) KIỂM ĐỊNH TỶ LỆ TỔNG THỂ (Xem) KIỂM ĐỊNH HIỆU CỦA CÁC TRUNG BÌNH (Xem) KIỂM ĐỊNH HIỆU CỦA CÁC TỶ LỆ (Xem) Với mẫu lớn, nhiều thống kê S rất gần phân phối chuẩn, trung bình S, độ lệch chuẩn S. Trường hợp thống kê là trung bình mẫu S = X, ta có và trong đó là độ lệch chuẩn của tổng thể và n là kích thước mẫu. ĐLNN được chuẩn hóa là Khi chưa biết độ lệch chuẩn của tổng thể, ta có thể sử dụng độ lệch chuẩn mẫu s (hoặc s^) để ước lượng cho . KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ Trường hợp thống kê là tỷ lệ mẫu S = f, ta có tỷ lệ thành công trên mẫu S = f = P, trong đó P là tỷ lệ thành công của tổng thể và n là kích thước mẫu. ĐLNN được chuẩn hóa là Trong trường hợp f = X/n, trong đó X là số lần thành công trên mẫu, biểu thức trên trở thành KIỂM ĐỊNH TỶ LỆ TỔNG THỂ Gọi X1 và X2 là trung bình mẫu thu được từ các mẫu có kích thước n1 và n2 được chọn từ hai tổng thể có trung bình lần lượt là 1, 2 và độ lệch chuẩn là 1, 2. Xét giả thiết H0: 1 = 2 là không có sự khác biệt nào giữa hai trung bình tổng thể. ĐLNN được chuẩn hóa là Chúng ta có thể kiểm định giả thiết H0 đối với giả thiết H1 ở mức ý nghĩa thích hợp. KIỂM ĐỊNH HIỆU CỦA CÁC TRUNG BÌNH Gọi f1 và f2 là tỷ lệ mẫu thu được từ các mẫu có kích thước n1 và n2 được chọn từ hai tổng thể có tỷ lệ lần lượt là P1, P2. Xét giả thiết H0: P1 = P2 là không có sự khác biệt giữa hai tỷ lệ tổng thể. trong đó dùng để ước lượng p. ĐLNN được chuẩn hóa là Chúng ta có thể kiểm định giả thiết H0 đối với giả thiết H1 ở mức ý nghĩa thích hợp. KIỂM ĐỊNH HIỆU CỦA CÁC TỶ LỆ Ths. Nguyễn Công Trí Copyright 2001 CÁC KIỂM ĐỊNH ĐẶC BIỆT VỚI MẪU NHỎ KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ (Xem) KIỂM ĐỊNH HIỆU CỦA CÁC TRUNG BÌNH (Xem) KIỂM ĐỊNH PHƯƠNG SAI TỔNG THỂ (Xem) KIỂM ĐỊNH TỶ LỆ CỦA CÁC PHƯƠNG SAI (Xem) Trường hợp mẫu nhỏ (n 02, vẫn với giả thiết H0 bên trên, dùng kiểm định một phía, chúng ta sẽ bác bỏ H0 ở mức ý nghĩa (kết luận H1 đúng) nếu 2 2. KIỂM ĐỊNH PHƯƠNG SAI TỔNG THỂ Trong bài toán, ta muốn quyết định liệu xem 2 mẫu lần lượt có kích thước là m, n và có phương sai tương ứng là s12, s22 được chọn từ 2 tổng thể có phân phối chuẩn thì hai tổng thể đó có cùng phương sai hay không? Chúng ta sẽ sử dụng thống kê trong đó 12, 22 lần lượt là phương sai của hai tổng thể có phân phối chuẩn. Giả sử giả thiết H0 là không có sự khác biệt nào giữa các phương sai của tổng thể, 12 = 22. Với giả thiết này thì biểu (16) trở thành KIỂM ĐỊNH TỶ LỆ CỦA CÁC PHƯƠNG SAI Từ các kết quả trên ta thấy có mối quan hệ giữa lý thuyết ước lượng và lý thuyết kiểm định. Ví dụ, để chấp nhận giả thiết H0 ở mức ý nghĩa thì tương đương với kết quả (1–)% khoảng tin cậy Vậy ít nhất trong trường hợp kiểm định hai phía, chúng ta có thể sử dụng khoảng tin cậy của chương 6 để kiểm định giả thiết. Một kết quả tương tự cho kiểm định một phía sẽ đòi hỏi khoảng tin cậy một phía (xem bài tập 6.14). QUAN HỆ GIỮA ƯỚC LƯỢNG VÀ KIỂM ĐỊNH Hạn chế sai lầm loại I tùy thuộc vào chọn mức ý nghĩa của kiểm định. Tránh sai lầm loại II bằng cách không thực hiện chúng, i.e, không bao giờ chấp nhận H0. Tuy nhiên, nhiều trường hợp trong thực tế, điều này không thể thực hiện được. Ta thường sử dụng đường cong đặc trưng hay đường cong OC là biểu đồ chỉ ra xác suất của sai lầm loại II dưới các giả thiết khác nhau để giảm đến mức thấp nhất của sai lầm loại II. i.e, sẽ chỉ ra lực kiểm định. ĐƯỜNG CONG ĐẶC TRƯNG – LỰC KIỂM ĐỊNH Để xác định liệu phân phối mẫu có kích thước n có cùng phân phối với tổng thể ở mức ý nghĩa hay không, chúng ta sử dụng tiến trình kiểm định giả thiết được gọi là kiểm định chi bình phương hoặc Nếu 2 > 2: bác bỏ H0, i.e, phân phối mẫu không cùng phân phối với tổng thể. Nếu 2 2: chấp nhận giả thiết H0 (ít nhất cũng không bác bỏ), i.e, phân phối mẫu có cùng phân phối với tổng thể. KIỂM ĐỊNH CHI BÌNH PHƯƠNG Để áp dụng phân phối liên tục cho dữ liệu rời rạc, ta điều chỉnh dữ liệu bằng phương pháp Yate như sau: Yate được áp dụng trong trường hợp mẫu nhỏ để so sánh các giá trị 2 có điều chỉnh và không điều chỉnh. Nếu cả hai giá trị dẫn đến các kết luận khác nhau, ta có thể yêu cầu tăng kích thước mẫu, hoặc nếu kết luận không thực tế, ta có thể sử dụng đến các phân phối xác suất đa thức. PHƯƠNG PHÁP ĐIỀU CHỈNH DỮ LIỆU YATE Độ đo liên quan, kết hợp hay độc lập của sự phân lớp trong bảng ngẫu nhiên được cho bởi biểu thức được gọi là hệ số ngẫu nhiên. Giá trị hệ số C càng lớn thì độ kết hợp càng lớn. Số dòng và số cột trong bảng ngẫu nhiên xác định giá trị lớn nhất của hệ số C, hệ số này không bao giờ lớn hơn 1. Với bảng k k, giá trị lớn nhất của C được cho bởi . Xem bài tập 7.52 và 7.53. HỆ SỐ NGẪU NHIÊN Ths. Nguyễn Công Trí Copyright 2001 CÁC KIỂM ĐỊNH TRUNG BÌNH VÀ TỶ LỆ SỬ DỤNG PHÂN PHỐI CHUẨN [1] [2] [3] [4] [5] [6] [7] [8] [9] [63] [64] [65] [66] [67] [68] [69] [70] [71] CÁC KIỂM ĐỊNH VỀ HIỆU CỦA CÁC TRUNG BÌNH VÀ TỶ LỆ [10] [11] [12] [13] [14] [15] [72] [73] [74] [75] [76] CÁC KIỂM ĐỊNH SỬ DỤNG PHÂN PHỐI STUDENT [16] [17] [18] [19] [77] [78] [79] [80] [81] [82] [83] BÀI TẬP CHƯƠNG 7 Ths. Nguyễn Công Trí Ths. Nguyễn Công Trí Copyright 2001 CÁC KIỂM ĐỊNH SỬ DỤNG PHÂN PHỐI CHI BÌNH PHƯƠNG [20] [84] [85] [86] [99] [100] [101] [102] [103][104] [105] CÁC KIỂM ĐỊNH SỬ DỤNG PHÂN PHỐI F [21] [22] [87] [88] [89] ĐƯỜNG CONG ĐẶC TRƯNG [23] [24] [25] [26] [27] [28] [90] [91] BIỂU ĐỒ KIỂM TRA CHẤT LƯỢNG [29] [30] [31] [32] [33] [92] [93] KIỂM ĐỊNH CHI BÌNH PHƯƠNG [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] BÀI TẬP CHƯƠNG 7 Ths. Nguyễn Công Trí
File đính kèm:
- Chuong 7(Ver5).ppt