Bộ 6 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong quy trình KDD (Knowledge Discovery in Databases), bước nào chịu trách nhiệm chính trong việc áp dụng các thuật toán để trích xuất các mẫu tiềm ẩn?

Câu 2: Kỹ thuật nào sau đây được sử dụng để giải quyết vấn đề dữ liệu bị thiếu bằng cách thay thế chúng bằng giá trị trung bình của thuộc tính đó?

Câu 3: Trong khai phá luật kết hợp, chỉ số nào cho biết xác suất mà một giao dịch chứa tập mục tiêu A cũng sẽ chứa tập mục tiêu B?

Câu 4: Thuật toán phân lớp nào sau đây hoạt động dựa trên định lý Bayes và giả định về sự độc lập giữa các biến dự báo?

Câu 5: Đặc điểm chính của thuật toán gom cụm K-means là gì?

Câu 6: Phương pháp 'Min-Max normalization' thuộc về bước nào trong tiền xử lý dữ liệu?

Câu 7: Thuật toán FP-Growth có ưu điểm nổi bật nào so với thuật toán Apriori trong khai phá luật kết hợp?

Câu 8: Trong phân lớp dữ liệu, hiện tượng mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém trên tập dữ liệu mới được gọi là gì?

Câu 9: Thuật toán DBSCAN thuộc loại gom cụm nào?

Câu 10: Chỉ số Gini Index thường được sử dụng làm tiêu chí để thực hiện việc gì trong thuật toán Decision Tree?

Câu 11: Trong kỹ thuật đánh giá mô hình, 'Confusion Matrix' được sử dụng để làm gì?

Câu 12: Mục tiêu chính của phân tích thành phần chính (PCA) trong khai phá dữ liệu là gì?

Câu 13: Thuật toán gom cụm nào bắt đầu bằng cách coi mỗi đối tượng là một cụm riêng biệt và sau đó tiến hành hợp nhất chúng?

Câu 14: Trong khai phá dữ liệu, 'Outlier' được định nghĩa là gì?

Câu 15: Thuật toán k-Nearest Neighbors (k-NN) được xếp vào loại mô hình học máy nào?

Câu 16: Kỹ thuật 'Binning' thường được sử dụng trong bước tiền xử lý nào để làm mịn dữ liệu nhiễu?

Câu 17: Chỉ số 'Lift' trong khai phá luật kết hợp có giá trị bằng 1 có ý nghĩa gì?

Câu 18: Thao tác nào trong mô hình OLAP cho phép người dùng xem dữ liệu ở mức chi tiết hơn (từ tổng quát đến cụ thể)?

Câu 19: Mục tiêu chính của phương pháp 'Pruning' (cắt tỉa) trong xây dựng cây quyết định là gì?

Câu 20: Kỹ thuật 'Cross-validation' (kiểm tra chéo) thường được sử dụng nhằm mục đích gì?

Câu 21: Thuật toán Support Vector Machine (SVM) tìm kiếm đối tượng nào để thực hiện việc phân lớp?

Câu 22: Khái niệm 'Curse of Dimensionality' (Lời nguyền đa chiều) ám chỉ vấn đề gì?

Câu 23: Trong khai phá dữ liệu văn bản, kỹ thuật TF-IDF được sử dụng để làm gì?

Câu 24: Phân tích giỏ hàng (Market Basket Analysis) là một ứng dụng phổ biến của kỹ thuật nào?

Câu 25: Sự khác biệt chính giữa phân lớp (Classification) và gom cụm (Clustering) là gì?