Để đánh giá hiệu suất của mô hình phân loại cảm xúc, một trong những chỉ số quan trọng nhất mà chúng ta cần quan tâm là F1-score. Tại sao F1-score lại quan trọng? Hãy cùng tìm hiểu các khía cạnh của chỉ số này.
F1-score là sự kết hợp hài hòa giữa độ chính xác (precision) và độ nhạy (recall). Được tính bằng công thức:
F1 = 2 × (precision × recall) / (precision + recall)
Ở đây:
- Precision: Tỷ lệ các dự đoán đúng trên tổng số dự đoán "có" từ mô hình.
- Recall: Tỷ lệ các dự đoán đúng trên tổng số trường hợp mà đáng lẽ nó phải dự đoán "có".
F1-score là một chỉ số đặc biệt hữu ích trong phân loại dữ liệu không cân bằng — điều xảy ra khi một lớp dữ liệu chiếm ưu thế so với các lớp khác. Trong trường hợp như vậy, chỉ sử dụng độ chính xác (accuracy) để đánh giá mô hình là không hợp lý, bởi mô hình có thể đạt độ chính xác cao chỉ bằng cách dự đoán lớp ưu thế nhất cho tất cả các trường hợp.
Bây giờ, ta hãy đi qua một ví dụ cụ thể để thấy sự khác biệt giữa mô hình trước và sau khi tối ưu hóa dựa trên F1-score.
Hãy thử tưởng tượng trong một bài toán phân loại độ phân cực của câu (tích cực/tiêu cực). Sau khi chạy mô hình Logistic Regression với dữ liệu số cân bằng sử dụng TF-IDF, ta thu thập được các kết quả sau:
Precision: 0.75, Recall: 0.60
F1-score: 0.67
Điều đó có nghĩa là, mặc dù độ chính xác của mô hình có vẻ ổn, nhưng mô hình vẫn chưa có khả năng phán đoán đúng tất cả các trường hợp tích cực/tiêu cực.
Sau khi áp dụng một số kỹ thuật tối ưu hóa, chẳng hạn như điều chỉnh tham số hoặc sử dụng kỹ thuật tăng cường dữ liệu, hiệu suất mô hình được cải thiện như sau:
Precision: 0.80, Recall: 0.75
F1-score: 0.77
Như bạn có thể thấy, chỉ số Precision và Recall đều được cải thiện, do đó làm cho F1-score cũng được nâng cấp. Điều này cho thấy mô hình sau khi tối ưu hóa không chỉ tinh gọn mà còn chính xác hơn trong việc phân loại đúng các trường hợp.
Nếu bạn đang làm việc với dữ liệu không cân bằng, F1-score là chỉ số không thể thiếu để đảm bảo mô hình của bạn được tối ưu hóa ở mức cao nhất. Việc liên tục so sánh F1-score trước và sau khi sửa đổi sẽ giúp bạn tối ưu hóa mô hình một cách hiệu quả.