logo xDuLieu.com

Trang trướcKiểm định số trung bìnhTrang sau

Như ta biết, số trung bình là đại lượng rất thông dụng được dùng để đặc trưng cho sự tập trung của dữ liệu. Do đó kiểm định trung bình là công việc thường phải thực hiện khi xem xét các dữ liệu số.

Khái quát

 

Xét biến `X` của tổng thể có trung bình là `mu` và độ lệch chuẩn là `sigma`. Từ tổng thể này ta rút ra một mẫu có kích thước là `n`, có trung bình và độ lệch chuẩn của biến `X` lần lượt là `bar x` và `s`. Từ các đại lượng này, ta có thể đánh giá các giả thuyết về mối tương quan giữa trung bình tổng thể `mu` và một giá trị `a` nào đó với độ tin cậy `1-alpha` (hay mức ý nghĩa `alpha`) cho trước.

Vậy giả thuyết không có dạng :   Ho : `mu=a`(3)

Còn giả thuyết đối nghịch Ha thì tùy theo trường hợp cụ thể có dạng `mu!=a` hay `mu>a` hay `mu< a`.

Thí dụ : Hàm lượng protein trung bình của sữa theo tiêu chuẩn T là 3,8%. Để đánh giá sữa do công ty C sản xuất, ta lấy 10 mẫu để phân tích. Kết quả cho biết hàm lượng protein trung bình là 3,6% với độ lệch chuẩn là 0,3%. Liệu ta có thể cho rằng sữa của công ty C đạt tiêu chuẩn T về hàm lượng protein hay không ?

Phân tích thí dụ này ta thấy :

  • Tổng thể là toàn bộ sữa của công ty C. Đại lượng X mà ta quan tâm là hàm lượng protein của sữa.
  • Ta không biết hàm lượng protein trung bình `mu` của sữa thuộc tổng thể này.
  • Ta lấy mẫu có `n=10` phần tử. Kết quả phân tích mẫu cho biêt hàm lượng protein (của mẫu) có trung bình `bar x` là 3,6% và độ lệch chuẩn `s` là 0,3%.
  • Ta cần quyết định về mối tương quan giữa `mu` và giá trị `a` là 3,8%.

Vậy cặp giả thuyết Ho và Ha sẽ có thể có dạng :

    Ho : `"Protein"=3,8`

    Ha : `"Protein"< 3,8`

Khi kiểm định trung bình, tùy trường hợp cụ thể, mà ta có thể biết độ lệch chuẩn của mẫu `sigma` hay không, và mẫu của chúng ta có thể nhỏ (như trường hợp trên) hay lớn (`n>30`). Vậy ta có 4 trường hợp chính như sau:

  •  `sigma` biết, mẫu lớn
  •  `sigma` biết, mẫu nhỏ
  •  `sigma` không biết, mẫu lớn
  •  `sigma` không biết, mẫu nhỏ

Trong phần dưới đây, ta sẽ lần lượt xem xét các trường hợp trên.


Kiểm định số trung bình khi biết `sigma`

 

Khi đã biết `sigma` thì tiêu chuẩn kiểm định sẽ là :

`z=(bar x-a)/(sigma/sqrt(n))`(4)

Ta thấy rằng `z` là khoảng cách tương đối giữa dữ liệu mẫu và giả thuyết không Ho với "đơn vị" là sai số chuẩn `sigma//sqrt(n)`. Vậy `z` càng lớn khoảng cách giữa dữ liệu mẫu và Ho càng xa, khả năng bác bỏ Ho càng tăng.

Khi mẫu lớn hoặc mẫu nhỏ nhưng biến khảo sát `X` có phân phối chuẩn, tiêu chuẩn kiểm định `z` có phân phối chuẩn tiêu chuẩn `N(0,1)`.


Kiểm định số trung bình khi không biết `sigma`

 

Do không biết `sigma` nên ta dùng độ lệch chuẩn `s` của mẫu để thay thế. Khi ấy tiêu chuẩn kiểm định là :

`t=(bar x-a)/(s/sqrt(n))`(5)

Về phân phối của tiêu chuẩn kiểm định `t`, ta có hai trường hợp :

  • nếu mẫu lớn, ta dùng phân phối chuẩn tiêu chuẩn
  • nếu mẫu nhỏ (nhưng biến khảo sát có phân phối chuẩn) ta dùng phân phối Student

Thí dụ

 

Hàm lượng trung bình của canxi trong sữa bột là 1,2%. Một công ty C công bố rằng sữa của họ có hàm lượng canxi cao hơn bình thường. Để đánh giá tính xác thực của công bố này, người ta đo 10 mẫu sữa của công ty thì thấy hàm lượng canxi trung bình là 1,4% với độ lệch chuẩn là 0,4%. Với độ tin cậy là 95%, ta có thể chấp nhận công bố của công ty C không ?

Trong trường hợp này, tổng thể là toàn bộ sữa bột của công ty C, đại lượng mà ta quan tâm là hàm lượng can xi trong sữa bột (đơn vị là %), và ta muốn so sánh trung bình của đại lượng này với giá trị 1,2. Vì vậy ta tiến hành kiểm định qua các bước như sau.

Thông số kiểm định

Dựa vào yêu cầu kiểm định, thông số kiểm định là trung bình của canxi trong sữa bột của công ty C. Ta ký hiệu thông số này là `Ca`.

Xây dựng cặp giả thuyết Ho và Ha

Do `Ca` của mẫu là 1,4 lớn hơn giá trị thông thường, có vẻ như phù hợp với công bố của công ty C, nên cặp giả thuyết sẽ là :

  •   Ho : `Ca=1,2`
  •   Ha : `Ca>1,2`

Chọn mức ý nghĩa `alpha`

Vì độ tin cậy yêu cầu là 95% nên mức ý nghĩa `alpha=0,05`

Tiêu chuẩn kiểm định và phân phối

Do ta không biết độ lệch chuẩn `sigma` của mẫu nên tiêu chuẩn kiểm định là tiêu chuẩn `t`:

  `t=(bar x-a)/(s/sqrt(n))`

Mặt khác, mẫu có 10 phần tử được xem là mẫu nhỏ. Vì vậy tiêu chuẩn `t` có phân phối Student.

Xác định giá trị tới hạn `t`*

Dựa vào giả thuyết Ha : `Ca>1,2`  ta có :  `t"*"=t_(alpha,\ nu)` (kiểm định một phía).

Tra bảng phân vị Student với `alpha=0,05` và `nu=n-1=10-1=9`, ta có `t"*"=t_(0,05,\ 9)=1,833`

Tính `t_o`

Ta có :   `t_o=(1,4-1,2)/((0,4)/sqrt(10))=1,58`

So sánh, đối chiếu

Ta thấy `t_o< t`* : ta chấp nhận Ho.

Kết luận

Do không thể bác bỏ Ho, nên ta kết luận hàm lượng canxi trong sữa của công ty C cũng chỉ thuộc loại bình thường.



Trang trướcVề đầu chươngTrang sau


Trang web này được cập nhật lần cuối ngày 27/11/2018