Bộ 8 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ 8 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Lưu ý: Nội dung trong bài Bộ 8 - Trắc nghiệm Khai phá dữ liệu online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong quy trình khám phá tri thức từ dữ liệu (KDD), bước nào tập trung vào việc loại bỏ nhiễu và dữ liệu không nhất quán?

Câu 2: Trong khai phá luật kết hợp, độ đo nào thể hiện tỷ lệ các giao dịch chứa cả hai tập mục A và B trên tổng số giao dịch?

Câu 3: Thuật toán Apriori dựa trên tính chất cốt lõi nào để cắt tỉa không gian tìm kiếm các tập mục thường xuyên?

Câu 4: Sự khác biệt cơ bản nhất giữa Phân loại (Classification) và Phân cụm (Clustering) trong khai phá dữ liệu là gì?

Câu 5: Chỉ số Gini trong thuật toán xây dựng cây quyết định được sử dụng để đo lường đại lượng nào?

Câu 6: Kỹ thuật 'Phân tích thành phần chính' (PCA) thường được áp dụng trong giai đoạn tiền xử lý dữ liệu nhằm mục đích gì?

Câu 7: Trong mô hình OLAP, thao tác 'Drill-down' có ý nghĩa như thế nào đối với việc quan sát dữ liệu?

Câu 8: Thuật toán Naive Bayes dựa trên giả định 'ngây thơ' nào về các thuộc tính của dữ liệu?

Câu 9: Việc lựa chọn giá trị K không phù hợp trong thuật toán K-means có thể dẫn đến vấn đề nghiêm trọng nào?

Câu 10: Độ đo F1-score được tính toán dựa trên sự kết hợp của hai đại lượng nào sau đây?

Câu 11: Trong xử lý dữ liệu thiếu, phương pháp thay thế bằng giá trị 'Mode' phù hợp nhất với loại thuộc tính nào?

Câu 12: Mục tiêu chính của kỹ thuật 'Rời rạc hóa dữ liệu' (Data Discretization) là gì?

Câu 13: Ưu điểm nổi bật nhất của thuật toán DBSCAN so với thuật toán K-means là gì?

Câu 14: Trong thuật toán ID3, khái niệm 'Entropy' dùng để đại diện cho điều gì?

Câu 15: Hiện tượng 'Overfitting' (Quá khớp) trong học máy và khai phá dữ liệu thường có biểu hiện như thế nào?

Câu 16: Kỹ thuật 'Ensemble Learning' (Học kết hợp) như thuật toán Random Forest hoạt động dựa trên nguyên lý chính nào?

Câu 17: Trong khai phá luật kết hợp, nếu chỉ số 'Lift' của luật A kéo theo B bằng 1, điều này có nghĩa là gì?

Câu 18: Thuật toán FP-Growth có cải tiến quan trọng nào giúp nó thường nhanh hơn thuật toán Apriori?

Câu 19: Kỹ thuật chuẩn hóa dữ liệu 'Min-Max Normalization' thực hiện việc biến đổi dữ liệu về khoảng giá trị nào phổ biến nhất?

Câu 20: Trong thuật toán SVM (Support Vector Machine), 'Kernel trick' được sử dụng nhằm mục đích gì?

Câu 21: Phương pháp 'K-fold Cross-validation' thường được sử dụng trong bước nào của quá trình khai phá dữ liệu?

Câu 22: Khái niệm 'Data Cube' (Khối dữ liệu) là thành phần trung tâm của công nghệ nào sau đây?

Câu 23: Khai phá cấu trúc Web (Web Structure Mining) chủ yếu tập trung vào việc phân tích yếu tố nào?

Câu 24: Thách thức 'Lời nguyền đa chiều' (Curse of Dimensionality) ảnh hưởng như thế nào đến các thuật toán khai phá dữ liệu?

Câu 25: Hệ số Silhouette (Silhouette Coefficient) được sử dụng để đánh giá chất lượng của kỹ thuật nào?