Lý thuyết bảng phân bố tần số và tần suất.
1. Khái niệm dấu hiệu, giá trị của dấu hiệu
Vấn đề người điều tra nghiên cứu quan tâm như: năng suất của một loại cây trồng, chiều cao và trọng lượng của thanh niên lứa tuổi 18… được gọi là dấu hiệu. Người điều tra cần xác định tập hợp các đơn vị điều tra (còn gọi mẫu). Mỗi đơn vị điều tra của dấu hiệu tương ứng với một số liệu gọi là giá trị của dấu hiệu. Tập hợp các giá trị của dấu hiệu của các đơn vị điều tra được ghi trong một bảng số liệu.
2. Khái niệm về tần số và tần suất
Một bảng số liệu, hay một mẫu có N giá nhưng chỉ có k giá trị khác nhau $displaystyle {{x}_{1}},{{x}_{2}},…{{x}_{k}}$
Giá trị xi xuất hiện ni lần (1 ≤ i ≤ k), ta nói $displaystyle {{n}_{i}}$ là tần số của giá trị $displaystyle {{x}_{i}}$, tỉ số $displaystyle {{f}_{i}}=frac{{{{n}_{i}}}}{N}$ được gọi là tần suất của $displaystyle {{x}_{i}}$. Ta phải có
$displaystyle {{n}_{1}}+{{n}_{2}}+…+{{n}_{k}}=N$,
$displaystyle {{f}_{1}}+{{f}_{2}}+…+{{f}_{k}}=1$
Các giá trị tần suất $displaystyle {{f}_{i}}$ đôi khi được ghi dưới dạng tỉ số phần trăm (%).
3. Bảng phân bố tần số và tần suất
– Bảng phân bố tần số và tần suất rời rạc:
Từ bảng số liệu thống kê ta liệt kê ra các giá trị khác nhau và các tần số, tần suất tương ứng ta được bảng phân bố tần số, tần suất rời rạc.
– Bảng phân bố tần số và tần suất ghép lớp:
Khi có một bảng số liệu thống kê có một số khá lớn các số liệu người ta chia các số liệu thành các lớp. Khoảng chứa tất cả các số liệu được chia thành các khoảng hay nửa khoảng nhỏ bằng nhau. Mỗi khoảng nhỏ là một lớp.
Số các số liệu nằm trong một lớp là tần số của lớp ấy. Tỉ số của tần số một lớp với tổng các số liệu của bảng là tần suất của lớp ấy. Mỗi lớp ta chọn một giá trị đại diện cho các giá trị của lớp. Thường thường lớp $displaystyle ({{x}_{i}};{{x}_{{i+1}}})$ người ta lấy $displaystyle x_{i}^{0}=frac{{{{x}_{i}}+{{x}_{{i+1}}}}}{2}$ làm giá trị đại diện.
Bảng ghi tất cả các lớp với các tần số, tần suất tương ứng được gọi là bảng phân bổ tấn số, tần suất ghép lớp.