Bộ 12 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong quy trình Khám phá tri thức từ Cơ sở dữ liệu (KDD), bước nào diễn ra ngay sau khi các thuật toán khai phá dữ liệu đã hoàn tất việc trích xuất mẫu?

Câu 2: Kỹ thuật 'Binning' thường được sử dụng trong giai đoạn nào của quá trình tiền xử lý dữ liệu?

Câu 3: Trong khai phá luật kết hợp, chỉ số 'Support' (Độ hỗ trợ) của một tập phổ biến A được định nghĩa là gì?

Câu 4: Hiện tượng 'Overfitting' (Quá khớp) trong học máy và khai phá dữ liệu thường xảy ra khi nào?

Câu 5: Thuật toán K-means thuộc loại kỹ thuật khai phá dữ liệu nào sau đây?

Câu 6: Trong tiền xử lý dữ liệu, mục đích chính của kỹ thuật 'Min-Max Normalization' là gì?

Câu 7: Trong luật kết hợp 'X suy ra Y', chỉ số 'Confidence' (Độ tin cậy) được tính theo công thức nào sau đây?

Câu 8: Thuật toán Naive Bayes dựa trên giả định quan trọng nào về các thuộc tính trong tập dữ liệu?

Câu 9: Đặc điểm chính của phương pháp phân cụm phân cấp (Hierarchical Clustering) là gì?

Câu 10: Trong hệ thống OLAP (Xử lý trực tuyến), thao tác 'Drill-down' có ý nghĩa gì?

Câu 11: Thuật toán phân lớp nào sau đây hoạt động dựa trên nguyên lý tìm kiếm 'siêu phẳng tối ưu' để phân tách các lớp dữ liệu?

Câu 12: Phân tích thành phần chính (PCA) thường được áp dụng với mục đích gì trong khai phá dữ liệu?

Câu 13: Chỉ số 'Lift' trong khai phá luật kết hợp dùng để đánh giá điều gì?

Câu 14: Tại sao thuật toán k-Nearest Neighbors (k-NN) lại được gọi là 'Lazy Learner' (Người học lười biếng)?

Câu 15: Chỉ số F1-score là giá trị trung bình điều hòa (harmonic mean) của hai đại lượng nào?

Câu 16: Trong khai phá dữ liệu văn bản, chỉ số TF-IDF giúp xác định điều gì?

Câu 17: Thuật toán DBSCAN có ưu điểm nổi bật nào so với K-means trong phân cụm dữ liệu?

Câu 18: Khai phá ngoại lệ (Outlier Detection) được ứng dụng phổ biến nhất trong lĩnh vực nào sau đây?

Câu 19: Trong thuật toán Cây quyết định (Decision Tree), độ đo Entropy dùng để đánh giá điều gì tại một nút?

Câu 20: Phương pháp 'Random Forest' hoạt động dựa trên nguyên lý nào?

Câu 21: Trong tích hợp dữ liệu, làm thế nào để xác định sự dư thừa giữa hai thuộc tính định lượng?

Câu 22: Thuật toán lan truyền ngược (Backpropagation) trong Mạng thần kinh nhân tạo có nhiệm vụ chính là gì?

Câu 23: Kỹ thuật 'k-fold Cross-validation' được sử dụng nhằm mục đích gì?

Câu 24: Quá trình 'Feature Engineering' (Kỹ nghệ đặc trưng) bao gồm các hoạt động nào?

Câu 25: Khai phá chuỗi (Sequence Mining) khác với khai phá luật kết hợp ở điểm cơ bản nào?