Bộ 8 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong quy trình khám phá tri thức từ dữ liệu (KDD), bước nào tập trung vào việc loại bỏ nhiễu và dữ liệu không nhất quán?

Câu 2: Trong khai phá luật kết hợp, độ đo nào thể hiện tỷ lệ các giao dịch chứa cả hai tập mục A và B trên tổng số giao dịch?

Câu 3: Thuật toán Apriori dựa trên tính chất cốt lõi nào để cắt tỉa không gian tìm kiếm các tập mục thường xuyên?

Câu 4: Sự khác biệt cơ bản nhất giữa Phân loại (Classification) và Phân cụm (Clustering) trong khai phá dữ liệu là gì?

Câu 5: Chỉ số Gini trong thuật toán xây dựng cây quyết định được sử dụng để đo lường đại lượng nào?

Câu 6: Kỹ thuật 'Phân tích thành phần chính' (PCA) thường được áp dụng trong giai đoạn tiền xử lý dữ liệu nhằm mục đích gì?

Câu 7: Trong mô hình OLAP, thao tác 'Drill-down' có ý nghĩa như thế nào đối với việc quan sát dữ liệu?

Câu 8: Thuật toán Naive Bayes dựa trên giả định 'ngây thơ' nào về các thuộc tính của dữ liệu?

Câu 9: Việc lựa chọn giá trị K không phù hợp trong thuật toán K-means có thể dẫn đến vấn đề nghiêm trọng nào?

Câu 10: Độ đo F1-score được tính toán dựa trên sự kết hợp của hai đại lượng nào sau đây?

Câu 11: Trong xử lý dữ liệu thiếu, phương pháp thay thế bằng giá trị 'Mode' phù hợp nhất với loại thuộc tính nào?

Câu 12: Mục tiêu chính của kỹ thuật 'Rời rạc hóa dữ liệu' (Data Discretization) là gì?

Câu 13: Ưu điểm nổi bật nhất của thuật toán DBSCAN so với thuật toán K-means là gì?

Câu 14: Trong thuật toán ID3, khái niệm 'Entropy' dùng để đại diện cho điều gì?

Câu 15: Hiện tượng 'Overfitting' (Quá khớp) trong học máy và khai phá dữ liệu thường có biểu hiện như thế nào?

Câu 16: Kỹ thuật 'Ensemble Learning' (Học kết hợp) như thuật toán Random Forest hoạt động dựa trên nguyên lý chính nào?

Câu 17: Trong khai phá luật kết hợp, nếu chỉ số 'Lift' của luật A kéo theo B bằng 1, điều này có nghĩa là gì?

Câu 18: Thuật toán FP-Growth có cải tiến quan trọng nào giúp nó thường nhanh hơn thuật toán Apriori?

Câu 19: Kỹ thuật chuẩn hóa dữ liệu 'Min-Max Normalization' thực hiện việc biến đổi dữ liệu về khoảng giá trị nào phổ biến nhất?

Câu 20: Trong thuật toán SVM (Support Vector Machine), 'Kernel trick' được sử dụng nhằm mục đích gì?

Câu 21: Phương pháp 'K-fold Cross-validation' thường được sử dụng trong bước nào của quá trình khai phá dữ liệu?

Câu 22: Khái niệm 'Data Cube' (Khối dữ liệu) là thành phần trung tâm của công nghệ nào sau đây?

Câu 23: Khai phá cấu trúc Web (Web Structure Mining) chủ yếu tập trung vào việc phân tích yếu tố nào?

Câu 24: Thách thức 'Lời nguyền đa chiều' (Curse of Dimensionality) ảnh hưởng như thế nào đến các thuật toán khai phá dữ liệu?

Câu 25: Hệ số Silhouette (Silhouette Coefficient) được sử dụng để đánh giá chất lượng của kỹ thuật nào?