Trình Mô Phỏng Thống Kê Tương Tác

Khám phá mối quan hệ giữa Tổng thể và Mẫu, và giải mã bí ẩn đằng sau công thức phương sai mẫu `s²`.

Mô Phỏng: Từ Tổng Thể đến Mẫu

Bên dưới là phân phối của một tổng thể giả định gồm 200,000 con chuột. Chúng ta biết được các tham số thực của tổng thể này. Hãy sử dụng thanh trượt để chọn kích thước mẫu, sau đó nhấn "Lấy Mẫu Ngẫu Nhiên" để xem các thống kê mẫu ước lượng các tham số này như thế nào.

Trung bình Tổng thể (μ)

--

Phương sai Tổng thể (σ²)

--

Trung bình Mẫu ()

--

Phương sai Mẫu (chia cho n)

--

Phương sai Mẫu (chia cho n-1)

--

Tại Sao Phương Sai Mẫu (chia cho n) Bị Chệch?

Phương sai mẫu tính bằng cách chia cho n có xu hướng ước lượng thấp hơn phương sai thực của tổng thể. Điều này xảy ra vì tổng bình phương khoảng cách từ các điểm trong mẫu đến **trung bình mẫu ()** luôn là giá trị nhỏ nhất có thể. Biểu đồ dưới đây cho thấy tổng bình phương khoảng cách Σ(xᵢ - z)² là một hàm parabol của z. Điểm đáy của parabol (giá trị nhỏ nhất) luôn nằm tại z = x̄. Bất kỳ giá trị z nào khác, kể cả trung bình tổng thể μ, cũng sẽ cho tổng bình phương lớn hơn.

Bậc Tự Do (Degrees of Freedom)

Để khắc phục sự chệch (bias), chúng ta sử dụng khái niệm "Bậc tự do". Bậc tự do là số lượng giá trị trong một phép tính có thể tự do biến đổi.

Khi tính toán trung bình mẫu x̄ từ n điểm dữ liệu, chúng ta đã áp đặt một ràng buộc lên dữ liệu. Nếu chúng ta biết trung bình và n-1 giá trị, giá trị cuối cùng sẽ không còn "tự do" nữa, nó bị cố định. Do đó, chúng ta nói rằng chúng ta đã "mất" một bậc tự do.

Thử tương tác!

Giả sử một mẫu có 3 giá trị và trung bình mẫu là 10. Hãy nhập 2 giá trị đầu tiên.

?

Giá trị thứ 3 phải là: 12

Vì chỉ có n-1 thông tin độc lập về sự biến thiên của mẫu, chúng ta chia tổng bình phương khoảng cách cho n-1 để có được một ước lượng không chệch cho phương sai tổng thể. Việc chia cho một số nhỏ hơn (n-1 thay vì n) sẽ "thổi phồng" ước lượng phương sai lên một chút, bù đắp cho xu hướng ước lượng thấp một cách có hệ thống.