Việc sắp xếp thông tin theo những tiêu chí nhất định gọi là phân loại dữ liệu.
Dựa trên tiêu chí định tính và định lượng, ta có thể phân loại các dữ liệu thành hai loại:
- Dữ liệu định lượng (số liệu) được biểu diễn bằng số thực và được chia thành hai loại:
+ Loại rời rạc là dữ liệu chỉ nhận hữu hạn giá trị hoặc biểu thị số đếm. Ví dụ: số học sinh, cỡ giày,…
+ Loại liên tục là dữ liệu có thể nhận mọi giá trị trong một khoảng nào đó. Ví dụ: chiều dài, khối lượng,…
- Dữ liệu định tính được biểu diễn bằng từ, chữ cái, kí hiệu,… và được chia thành các loại:
+ Dữ liệu định danh là dữ liệu thể hiện cách gọi tên. Ví dụ: giới tính, màu sắc, nơi ở,…
+ Dữ liệu biểu thị thứ bậc là dữ liệu thể hiện sự hơn kém. Ví dụ: mức độ hài lòng, khối, lớp,…
Có thể kiểm tra định dạng của dữ liệu hoặc mối liên hệ toán học đơn giản giữa các số liệu thống kê để nhận biết tính hợp lí của dữ liệu và các kết luận dựa trên các dữ liệu thống kê đó.
Các bài khác cùng chuyên mục