Bộ 13 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ 13 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Lưu ý: Nội dung trong bài Bộ 13 - Trắc nghiệm Khai phá dữ liệu online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong quy trình Khám phá tri thức từ Cơ sở dữ liệu (KDD), bước nào thực hiện việc áp dụng các thuật toán để trích xuất các mẫu (patterns)?

Câu 2: Kỹ thuật 'Data Cleaning' (Làm sạch dữ liệu) thường giải quyết vấn đề nào sau đây trong tập dữ liệu?

Câu 3: Trong khai phá luật kết hợp, chỉ số 'Support' (Độ hỗ trợ) của một luật A kéo theo B được định nghĩa như thế nào?

Câu 4: Độ tin cậy (Confidence) của luật kết hợp 'A kéo theo B' bằng 80% có ý nghĩa gì?

Câu 5: Thuật toán Apriori dựa trên tính chất nào để giảm bớt không gian tìm kiếm các tập mục phổ biến?

Câu 6: Sự khác biệt chính giữa phân lớp (Classification) và gom cụm (Clustering) là gì?

Câu 7: Trong cây quyết định (Decision Tree), tiêu chí 'Information Gain' (Độ lợi thông tin) thường dựa trên khái niệm nào sau đây?

Câu 8: Hiện tượng 'Overfitting' (Quá khớp) trong học máy xảy ra khi nào?

Câu 9: Thuật toán K-means thuộc loại kỹ thuật nào trong khai phá dữ liệu?

Câu 10: Trong thuật toán K-Nearest Neighbors (KNN), giá trị 'k' đại diện cho điều gì?

Câu 11: Đặc điểm chính của thuật toán Naive Bayes là giả định điều gì về các thuộc tính?

Câu 12: Kỹ thuật 'Normalization' (Chuẩn hóa) dữ liệu bằng phương pháp Min-Max đưa giá trị về khoảng nào thông thường?

Câu 13: Trong hệ thống OLAP, thao tác 'Drill-down' (Khoan sâu) có tác dụng gì?

Câu 14: Mục tiêu chính của việc 'Dimensionality Reduction' (Giảm chiều dữ liệu) là gì?

Câu 15: Thuật toán DBSCAN có ưu điểm nổi bật nào so với K-means?

Câu 16: Chỉ số 'Lift' trong khai phá luật kết hợp dùng để làm gì?

Câu 17: Trong cây quyết định, việc 'Pruning' (Tỉa cành) được thực hiện nhằm mục đích gì?

Câu 18: Phương pháp 'k-fold Cross-Validation' dùng để làm gì?

Câu 19: Trong ma trận nhầm lẫn (Confusion Matrix), 'Precision' (Độ chính xác) được tính như thế nào?

Câu 20: Thuật toán 'Random Forest' hoạt động dựa trên nguyên lý nào?

Câu 21: Dữ liệu 'Outlier' (Dữ liệu ngoại lai) là gì?

Câu 22: Hệ số Silhouette (Silhouette Coefficient) được sử dụng để làm gì?

Câu 23: Trong khai phá dữ liệu, 'Market Basket Analysis' (Phân tích giỏ hàng) thường sử dụng kỹ thuật nào?

Câu 24: Mục đích của bước 'Data Integration' (Tích hợp dữ liệu) là gì?

Câu 25: Chỉ số 'F1-Score' được tính dựa trên hai đại lượng nào?