Bộ 13 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong quy trình Khám phá tri thức từ Cơ sở dữ liệu (KDD), bước nào thực hiện việc áp dụng các thuật toán để trích xuất các mẫu (patterns)?

Câu 2: Kỹ thuật 'Data Cleaning' (Làm sạch dữ liệu) thường giải quyết vấn đề nào sau đây trong tập dữ liệu?

Câu 3: Trong khai phá luật kết hợp, chỉ số 'Support' (Độ hỗ trợ) của một luật A kéo theo B được định nghĩa như thế nào?

Câu 4: Độ tin cậy (Confidence) của luật kết hợp 'A kéo theo B' bằng 80% có ý nghĩa gì?

Câu 5: Thuật toán Apriori dựa trên tính chất nào để giảm bớt không gian tìm kiếm các tập mục phổ biến?

Câu 6: Sự khác biệt chính giữa phân lớp (Classification) và gom cụm (Clustering) là gì?

Câu 7: Trong cây quyết định (Decision Tree), tiêu chí 'Information Gain' (Độ lợi thông tin) thường dựa trên khái niệm nào sau đây?

Câu 8: Hiện tượng 'Overfitting' (Quá khớp) trong học máy xảy ra khi nào?

Câu 9: Thuật toán K-means thuộc loại kỹ thuật nào trong khai phá dữ liệu?

Câu 10: Trong thuật toán K-Nearest Neighbors (KNN), giá trị 'k' đại diện cho điều gì?

Câu 11: Đặc điểm chính của thuật toán Naive Bayes là giả định điều gì về các thuộc tính?

Câu 12: Kỹ thuật 'Normalization' (Chuẩn hóa) dữ liệu bằng phương pháp Min-Max đưa giá trị về khoảng nào thông thường?

Câu 13: Trong hệ thống OLAP, thao tác 'Drill-down' (Khoan sâu) có tác dụng gì?

Câu 14: Mục tiêu chính của việc 'Dimensionality Reduction' (Giảm chiều dữ liệu) là gì?

Câu 15: Thuật toán DBSCAN có ưu điểm nổi bật nào so với K-means?

Câu 16: Chỉ số 'Lift' trong khai phá luật kết hợp dùng để làm gì?

Câu 17: Trong cây quyết định, việc 'Pruning' (Tỉa cành) được thực hiện nhằm mục đích gì?

Câu 18: Phương pháp 'k-fold Cross-Validation' dùng để làm gì?

Câu 19: Trong ma trận nhầm lẫn (Confusion Matrix), 'Precision' (Độ chính xác) được tính như thế nào?

Câu 20: Thuật toán 'Random Forest' hoạt động dựa trên nguyên lý nào?

Câu 21: Dữ liệu 'Outlier' (Dữ liệu ngoại lai) là gì?

Câu 22: Hệ số Silhouette (Silhouette Coefficient) được sử dụng để làm gì?

Câu 23: Trong khai phá dữ liệu, 'Market Basket Analysis' (Phân tích giỏ hàng) thường sử dụng kỹ thuật nào?

Câu 24: Mục đích của bước 'Data Integration' (Tích hợp dữ liệu) là gì?

Câu 25: Chỉ số 'F1-Score' được tính dựa trên hai đại lượng nào?