Em được biết là: P-value là giá trị diện tích phần đuôi.
1/ Vậy em hiểu 1 cách tổng quát là P-value là giá trị tổng diện tích phần reject region thì có chính xác không ạ.
2/ Vậy em hiểu P-value là phần còn lại trong tổng số 100%, ngược với confident interval. Nói cách khác P-value = significant level vậy có đúng không an
Trợ giảng: Mình thấy bạn hiểu đúng hướng nhưng đang nhầm lẫn giữa p-value và significant level. Mình giải thích một chút như sau:
1) Significant level là probability threshold cho phép Type I error xảy ra, nghĩa là ngưỡng xác xuất cho phép reject nhầm Ho trong trường hợp Ho đúng. Rõ ràng nếu significal level càng nhỏ thì rủi ro reject nhầm càng thấp, nhưng bù lại thì xác suất bỏ sót (Type II error) càng cào. Lưu ý là ngưỡng xác suất này được đặt ra ngay từ đầu khi bắt đầu Hypothesis testing.
2) p-value được tính ra dựa trên data đã collect và phân phối xác xuất của data đó. p-value là mức significant level nhỏ nhất để reject Ho, có nghĩa là để reject được Ho thì significant level đặt ra từ ban đầu chỉ cần lớn hơn hoặc bằng p-value.