Bộ 15 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ 15 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong quy trình khám phá tri thức từ dữ liệu (KDD), bước nào tập trung vào việc áp dụng các thuật toán thông minh để trích xuất các mẫu dữ liệu?

Câu 2: Kỹ thuật nào sau đây được sử dụng để giải quyết vấn đề dữ liệu bị thiếu bằng cách thay thế bằng giá trị trung bình hoặc trung vị của thuộc tính đó?

Câu 3: Trong khai phá luật kết hợp, độ hỗ trợ (Support) của một tập phổ biến được định nghĩa là gì?

Câu 4: Thuật toán phân cụm K-means thuộc loại kỹ thuật phân cụm nào sau đây?

Câu 5: Sự khác biệt chính giữa phân lớp (Classification) và hồi quy (Regression) trong khai phá dữ liệu là gì?

Câu 6: Hiện tượng quá khớp (Overfitting) trong mô hình học máy thường dẫn đến hệ quả nào?

Câu 7: Kỹ thuật 'Min-Max Normalization' được sử dụng nhằm mục đích gì trong tiền xử lý dữ liệu?

Câu 8: Trong cây quyết định, chỉ số Entropy được sử dụng để đo lường đại lượng nào?

Câu 9: Giả định cơ bản quan trọng nhất của thuật toán Naive Bayes là gì?

Câu 10: Đặc điểm nổi bật của thuật toán phân cụm DBSCAN so với K-means là gì?

Câu 11: Chỉ số Lift trong luật kết hợp (A implies B) lớn hơn 1 cho biết điều gì?

Câu 12: Trong đánh giá mô hình phân lớp, độ thu hồi (Recall) đo lường điều gì?

Câu 13: Phân tích tương quan (Correlation Analysis) thường được sử dụng trong bước nào của tiền xử lý dữ liệu?

Câu 14: Biểu đồ Dendrogram là công cụ trực quan hóa đặc trưng cho phương pháp khai phá nào?

Câu 15: Mục tiêu chính của phân tích thành phần chính (PCA) trong khai phá dữ liệu là gì?

Câu 16: Trong quá trình xây dựng mô hình, tập dữ liệu kiểm tra (Test set) được sử dụng khi nào?

Câu 17: Chỉ số Gini thường được áp dụng trong thuật toán xây dựng cây quyết định nào?

Câu 18: Khái niệm 'Lời nguyền đa chiều' (Curse of Dimensionality) ám chỉ vấn đề gì?

Câu 19: Thuật toán K-Nearest Neighbors (KNN) được gọi là phương pháp 'Học lười' (Lazy Learner) vì lý do nào?

Câu 20: Phương pháp Z-score được sử dụng để phát hiện điểm ngoại lai dựa trên đại lượng nào?

Câu 21: Kỹ thuật 'Bagging' trong học máy kết hợp nhiều mô hình cơ sở nhằm mục đích chính là gì?

Câu 22: Ma trận nhầm lẫn (Confusion Matrix) cung cấp thông tin gì về mô hình phân lớp?

Câu 23: Trong kiến trúc kho dữ liệu, quá trình ETL bao gồm các bước nào?

Câu 24: Ưu điểm chính của thuật toán FP-Growth so với Apriori trong khai phá luật kết hợp là gì?

Câu 25: Hệ số Silhouette được dùng để đánh giá chất lượng của kỹ thuật nào?