1. Mẫu số liệu ghép nhóm
a) Bảng tần số ghép nhóm
- Mẫu số liệu ghép nhóm là mẫu số liệu cho dưới dạng bảng tần số ghép nhóm.
- Mỗi nhóm số liệu gồm một số giá trị của mẫu số liệu được ghép nhóm theo một tiêu chí xác định có dạng [a; b), trong đó a là đầu mút trái, b là đầu mút phải. Độ dài nhóm là b – a.
- Tần số của một nhóm là số số liệu trong mẫu số liệu thuộc vào nhóm đó. Tần số của nhóm 1, nhóm 2, …, nhóm m kí hiệu lần lượt là n1, n2, …, nm.
- Bảng tần số ghép nhóm được lập như ở bảng 1, trong đó mẫu liệu gồm n số liệu được chia thành m nhóm ứng với m nửa khoảng [a1; a2); [a2; a3); …;[am; am+1), ở đó
a1 < a2 < … < am < am+1 và n = n1 + n2 + … + nm.
b) Ghép nhóm mẫu số liệu. Tần số tích lũy
Để chuyển mẫu số liệu không ghép nhóm thành mẫu số liệu ghép nhóm, ta thực hiện như sau:
- Chia miền giá trị của mẫu số liệu thành một số nhóm theo tiêu chí cho trước;
- Đếm số giá trị của mẫu số liệu thuộc mỗi nhóm (tần số) và lập bảng tần số ghép nhóm.
Chú ý: Khi ghép nhóm số liệu, ta thường phân chia các nhóm có độ dài bằng nhau và đầu mút của các nhóm có thể không phải là giá trị của mẫu số liệu. Nhóm cuối cùng có thể là [am; am+1].
- Tần số tích lũy của một nhóm là số số liệu trong mẫu số liệu có giá trị nhỏ hơn giá trị đầu mút phải của nhóm đó. Tần số tích lũy của nhóm 1, nhóm 2, …, nhóm m kí hiệu lần lượt là \(c{f_1},c{f_2},...,c{f_m}\).
- Bảng tần số ghép nhóm bao gồm cả tần số tích lũy được lập như ở Bảng 2.
2. Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu ghép nhóm
a) Số trung bình cộng
Cho mẫu số liệu ghép nhóm như ở bảng 3, trong đó giá trị đại diện của nhóm là trung điểm xi của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm i.
Số trung bình cộng của mẫu số liệu ghép nhóm, kí hiệu \(\overline x \), được tính theo công thức
\(\overline x = \frac{{{n_1}{x_1} + {n_2}{x_2} + ... + {n_m}{x_m}}}{n}\)
b) Trung vị
Cho mẫu số liệu ghép nhóm bao gồm cả tần số tích lũy như ở Bảng 2.
Giả sử nhóm k là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(\frac{n}{2}\), tức là \(c{f_{k - 1}} < \frac{n}{2}\) nhưng \(c{f_k} \ge \frac{n}{2}\). Ta gọi r, d, nk lần lượt là đầu mút trái, độ dài, tần số của nhóm k; cfk-1 là tần số tích lũy của nhóm k – 1.
Trung vị của mẫu số liệu ghép nhóm, kí hiệu Me, được tính theo công thức sau:
\({M_e} = r + \left( {\frac{{\frac{n}{2} - c{f_{k - 1}}}}{{{n_k}}}} \right).d\)
Quy ước: cf0 = 0.
c) Tứ phân vị
Cho mẫu số liệu ghép nhóm bao gồm cả tần số tích lũy như ở Bảng 2.
- Tứ phân vị thứ hai, kí hiệu Q2, bằng trung vị Me.
- Giả sử nhóm p là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(\frac{n}{4}\), tức là \(c{f_{p - 1}} < \frac{n}{4}\) nhưng \(c{f_p} \ge \frac{n}{4}\). Ta gọi s, h, np lần lượt là đầu mút trái, độ dài, tần số của nhóm p; cfp-1 là tần số tích lũy của nhóm p – 1.
Tứ phân vị thứ nhất, kí hiệu Q1, được tính bằng công thức sau:
\({Q_1} = s + \left( {\frac{{\frac{n}{4} - c{f_{p - 1}}}}{{{n_p}}}} \right).h\)
- Giả sử nhóm q là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng \(\frac{{3n}}{4}\), tức là \(c{f_{q - 1}} < \frac{{3n}}{4}\) nhưng \(c{f_q} \ge \frac{{3n}}{4}\). Ta gọi t, l, nq lần lượt là đầu mút trái, độ dài, tần số của nhóm q; cfq-1 là tần số tích lũy của nhóm q – 1.
Tứ phân vị thứ ba, kí hiệu Q3, được tính bằng công thức sau:
\({Q_3} = t + \left( {\frac{{\frac{{3n}}{4} - c{f_{q - 1}}}}{{{n_q}}}} \right).l\)
d) Mốt
Cho mẫu số liệu ghép nhóm như ở Bảng 1.
Giả sử nhóm i là nhóm có tần số lớn nhất. Ta gọi u, g, ni lần lượt là đầu mút trái, độ dài, tần số của nhóm i; ni-1, ni-1 lần lượt là tần số của nhóm i – 1, nhóm i + 1.
Mốt của mẫu số liệu ghép nhóm, kí hiệu Mo, được tính theo công thức sau:
\({M_o} = u + \left( {\frac{{{n_i} - {n_{i - 1}}}}{{2{n_i} - {n_{i - 1}} - {n_{i + 1}}}}} \right).g\)
Quy ước: n0 = 0; nm+1 = 0.