Category Archives: Blog

Phân biệt data categorical, ordinal và interval

Categorical

Đây là loại dữ liệu dạng “phân loại”, và không thể sắp xếp được.

Ví dụ: với class Gender có thể có domain là {Male, Female}, hay Color có domain là {Blue, Red, Green…}

Ordinal

Cũng thuộc dạng data “phân loại”, nhưng có thể sắp xếp được.

Chẳng hạn kích cỡ quần áo có thể có miền như {S, M, L, XL, XXL, XXXL}, hay xếp loại học lực {Giỏi, Khá, Trung Bình, Yếu}

Interval

Thuộc dạng “phân loại” và có thể sắp xếp được như kiểu Ordinal, nhưng các giá trị trong interval có chung một giá trị gọi là “khoảng cách”.

Chẳng hạn khi làm khảo sát mà có hỏi đến thu nhập, người ta hay đưa ra các khoảng như

  • 0 -> 20000 Euro
  • 20000 -> 40000 Euro
  • 40000 -> 60000 Euro
  • 60000 -> 80000 Euro

Ở đây “khoảng cách” giữa các giá trị là 20000 euro

Ref: https://stats.idre.ucla.edu/other/mult-pkg/whatstat/what-is-the-difference-between-categorical-ordinal-and-interval-variables/