Bài 10 toán 12 đề cập đến những khái niệm cơ bản nhưng rất quan trọng về phương sai và độ lệch. Hãy cùng tìm hiểu phương sai và độ lệch chuẩn là gì? Cách tính phương sai và độ lệch chuẩn để biết cách áp dụng chúng trong các bài toán thực tế.
Phương sai và độ lệch chuẩn là gì?
Định nghĩa, công thức về phương sai
Phương sai là giá trị trung bình của bình phương các khoảng cách giữa các giá trị dữ liệu và giá trị trung bình của chúng. Nó cho biết mức độ phân tán của một tập hợp dữ liệu.
Công thức
Đối với một tập hợp giá trị \(x_1, x_2, \ldots, x_n\) với giá trị trung bình μ:
Phương sai \(\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i – \mu)^2\)
Ký hiệu cho phương sai: \(\sigma^2\)
Định nghĩa, công thức về độ lệch chuẩn
Độ lệch chuẩn là căn bậc hai của phương sai. Nó cũng đo lường mức độ phân tán, nhưng được biểu diễn cùng đơn vị với dữ liệu gốc, giúp dễ hiểu hơn.
Công thức
Đối với một tập hợp dữ liệu:
Độ lệch chuẩn \(\sigma = \sqrt{\sigma^2}\)
Ký hiệu cho độ lệch chuẩn: \(\sigma\)
Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm
Phương sai của mẫu số liệu ghép nhóm, kí hiệu là \(s^2\), là một số được tính theo công thức sau:
\( s^2 = \frac{m_1 (x_1 – \bar{x})^2 + \dots + m_k (x_k – \bar{x})^2}{n}\);
trong đó \(n = m_1 + \dots + m_k\); \(x_i = \frac{a_i + a_{i+1}}{2}\) với i = 1, 2, …, k là giá trị đại diện cho nhóm \((a_i; a_{i+1})\) và \(\bar{x} = \frac{m_1 x_1 + \dots + m_k x_k}{n}\) là số trung bình của mẫu số liệu ghép nhóm.
Độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu là s, là căn bậc hai số học của phương sai của mẫu số liệu ghép nhóm, tức là \(s = \sqrt{s^2}\).
Công thức:
\(s^2 = \frac{1}{n} \left( m_1 x_1^2 + \dots + m_k x_k^2 \right) – (\bar{x})^2\)
Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
Ý nghĩa:
Phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm là các xấp xỉ cho phương sai, độ lệch chuẩn của mẫu số liệu gốc. Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm xung quanh số trung bình của mẫu số liệu đó. Phương sai, độ lệch chuẩn càng lớn thì mẫu số liệu càng phân tán.
Lưu ý: Người ta còn sử dụng các đại lượng sau để đo mức độ phân tán của mẫu số liệu ghép nhóm:
\(\hat{s}^2 = \frac{m_1 (x_1 – \bar{x})^2 + \dots + m_k (x_k – \bar{x})^2}{n – 1}\), \(\hat{s} = \sqrt{\hat{s}^2}\)
Bài tập ví dụ phương sai và độ lệch chuẩn
Ví dụ 1 cách tính phương sai và độ lệch chuẩn
Chiều cao của 40 mẫu cây ở một vườn thực vật (đơn vị: centimét) được thống kê lại như sau:
Nhóm | Tần số |
[30; 40) | 4 |
[40; 50) | 10 |
[50; 60) | 14 |
[60; 70) | 6 |
[70; 80) | 4 |
[80; 90) | 2 |
n = 40 |
Tìm phương sai và độ lệch chuẩn cho mẫu số liệu ghép nhóm này.
Hướng dẫn giải:
Chọn giá trị đại diện cho mẫu số liệu, ta có bảng sau:
Nhóm | Giá trị đại diện | Tần số |
[30; 40) | 35 | 4 |
[40; 50) | 45 | 10 |
[50; 60) | 55 | 14 |
[60; 70) | 65 | 6 |
[70; 80) | 75 | 4 |
[80; 90) | 85 | 2 |
n = 40 |
Ta có giá trị trung bình của mẫu số liệu là
\(\bar{x} = \frac{35 \cdot 4 + 45 \cdot 10 + 55 \cdot 14 + 65 \cdot 6 + 75 \cdot 4 + 85 \cdot 2}{40} = 55.5\)
Phương sai của mẫu số liệu trên là:
\(s^2 = \frac{1}{40} \left( 4 \cdot 35^2 + 10 \cdot 45^2 + 14 \cdot 55^2 + 6 \cdot 65^2 + 4 \cdot 75^2 + 2 \cdot 85^2 \right) – 55.5^2 = 659.4\)
Độ lệch chuẩn của mẫu số liệu trên là:
\(s = \sqrt{\frac{659}{4}} = \sqrt{659.2}\)
Ví dụ 2 Sử dụng phương sai, độ lệch chuẩn đo độ rủi ro
Giá đóng cửa của một cổ phiếu là giá của cổ phiếu đó cuối một phiên giao dịch. Bảng sau thống kê giá đóng cửa (đơn vị: nghìn đồng) của hai mã cổ phiếu A và B trong 50 ngày giao dịch liên tiếp.
Giá đóng cửa | [120; 122) | [122; 124) | [124; 126) | [126; 128) | [128; 130) |
Số ngày giao dịch của cổ phiếu A | 8 | 9 | 12 | 10 | 11 |
Số ngày giao dịch của cổ phiếu B | 16 | 4 | 3 | 6 | 21 |
Người ta có thể dùng phương sai và độ lệch chuẩn để so sánh mức độ rủi ro của các loại cổ phiếu có giá trị trung bình gần bằng nhau. Cổ phiếu nào có phương sai, độ lệch chuẩn cao hơn thì được coi là có độ rủi ro lớn hơn.
Theo quan điểm trên, hãy so sánh độ rủi ro của cổ phiếu A và cổ phiếu B.
Hướng dẫn giải:
Ta có bảng thống kê giá đóng cửa theo giá trị đại diện
Giá đóng cửa | 121 | 123 | 125 | 127 | 129 |
Số ngày giao dịch của cổ phiếu A | 8 | 9 | 12 | 10 | 11 |
Số ngày giao dịch của cổ phiếu B | 16 | 4 | 3 | 6 | 21 |
Mẫu số liệu của cổ phiếu A:
Số trung bình của mẫu số liệu ghép nhóm là
\(x_1 = \frac{8 \cdot 121 + 9 \cdot 123 + 12 \cdot 125 + 10 \cdot 127 + 11 \cdot 129}{50} = 125.28\)
Phương sai của mẫu số liệu ghép nhóm là
\(s_1^2 = \frac{1}{50} \left( 8 \cdot 121^2 + 9 \cdot 123^2 + 12 \cdot 125^2 + 10 \cdot 127^2 + 11 \cdot 129^2 \right) – (125.28)^2 = 7.5216\)
Độ lệch chuẩn của mẫu số liệu là
\(s_1 = \sqrt{7.5216} \approx 2.74\)
Mẫu số liệu của cổ phiếu B
Số trung bình của mẫu số liệu ghép nhóm là
\(\bar{x}_2 = \frac{16 \cdot 121 + 4 \cdot 123 + 3 \cdot 125 + 6 \cdot 127 + 21 \cdot 129}{50} = 125.48\)
Độ lệch chuẩn của mẫu số liệu là
\(s_2 = \sqrt{12.4096} \approx 3.52\)
Nếu đánh giá mức độ rủi ro theo phương sai và độ lệch chuẩn thì cổ phiếu A có độ rủi ro thấp hơn cổ phiếu B.
Chúng ta đã vừa cùng nhau tìm hiểu chi tiết về hai khái niệm này trong bài 10 toán 12 KNTT và hy vọng bạn sẽ áp adụng thành công trong học tập và đạt được kết quả cao.
<<Xem thêm>> Khoảng tứ phân vị là gì? Cách tính khoảng tứ phân vị Toán 12