Quay lại danh mục Trắc nghiệm Khai phá dữ liệu

Trang chủ
Trắc nghiệm
Trắc nghiệm Khai phá dữ liệu
Bộ 10 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ 10 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Lưu ý: Nội dung trong bài Bộ 10 - Trắc nghiệm Khai phá dữ liệu online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong quy trình khám phá tri thức từ dữ liệu (KDD), bước nào tập trung vào việc loại bỏ dữ liệu nhiễu và dữ liệu không nhất quán?

A. Làm sạch dữ liệu (Data Cleaning)
B. Tích hợp dữ liệu (Data Integration)
C. Biến đổi dữ liệu (Data Transformation)
D. Khai phá dữ liệu (Data Mining)

💡 Lời giải chi tiết:

Theo quy trình KDD tiêu chuẩn, làm sạch dữ liệu là giai đoạn thực hiện các kỹ thuật để xử lý dữ liệu thiếu, khử nhiễu và khắc phục tình trạng không nhất quán trong tập dữ liệu thô. Kết luận Lý giải Làm sạch dữ liệu (Data Cleaning)

Câu 2: Kỹ thuật nào dưới đây thường được sử dụng để giải quyết vấn đề dữ liệu có các thang đo (scale) khác nhau trước khi đưa vào mô hình khai phá?

A. Rời rạc hóa dữ liệu
B. Chuẩn hóa dữ liệu (Normalization)
C. Tổng hợp dữ liệu
D. Lấy mẫu dữ liệu

💡 Lời giải chi tiết:

Chuẩn hóa dữ liệu giúp chuyển đổi các giá trị thuộc tính về một khoảng xác định (như 0 đến 1) để tránh việc các thuộc tính có miền giá trị lớn gây ảnh hưởng quá mức đến kết quả tính toán. Kết luận Lý giải Chuẩn hóa dữ liệu (Normalization)

Câu 3: Trong khai phá luật kết hợp, độ hỗ trợ (Support) của một tập phổ biến A được định nghĩa là gì?

A. Tỷ lệ các giao dịch chứa tập A trên tổng số giao dịch
B. Xác suất có điều kiện để tập B xuất hiện khi đã có tập A
C. Số lượng các thuộc tính khác nhau có trong tập A
D. Mức độ quan trọng của tập A đối với một khách hàng cụ thể

💡 Lời giải chi tiết:

Độ hỗ trợ phản ánh tần suất xuất hiện của một tập mục tiêu trong toàn bộ cơ sở dữ liệu giao dịch để xác định mức độ phổ biến của nó. Kết luận Lý giải Tỷ lệ các giao dịch chứa tập A trên tổng số giao dịch

Câu 4: Thuật toán Apriori dựa trên tính chất cốt lõi nào để giảm bớt không gian tìm kiếm các tập mục tiêu phổ biến?

A. Mọi tập con của một tập mục tiêu phổ biến cũng phải là tập mục tiêu phổ biến
B. Mọi tập cha của một tập mục tiêu phổ biến cũng phải là tập mục tiêu phổ biến
C. Chỉ những tập mục tiêu có độ tin cậy cao mới được xem xét
D. Tổng số lượng mục tiêu trong một tập phải luôn là số chẵn

💡 Lời giải chi tiết:

Tính chất đơn điệu của Apriori khẳng định rằng nếu một tập mục tiêu là phổ biến thì tất cả các tập con của nó cũng phải đạt ngưỡng độ hỗ trợ tối thiểu. Kết luận Lý giải Mọi tập con của một tập mục tiêu phổ biến cũng phải là tập mục tiêu phổ biến

Câu 5: Điểm khác biệt cơ bản nhất giữa Phân lớp (Classification) và Gom cụm (Clustering) là gì?

A. Phân lớp là học có giám sát (đã biết nhãn), còn gom cụm là học không giám sát (chưa biết nhãn)
B. Phân lớp chỉ dùng cho dữ liệu số, còn gom cụm chỉ dùng cho dữ liệu phân loại
C. Gom cụm đòi hỏi tập dữ liệu huấn luyện lớn hơn nhiều so với phân lớp
D. Phân lớp luôn cho kết quả chính xác hơn so với gom cụm

💡 Lời giải chi tiết:

Phân lớp dựa trên các nhãn lớp có sẵn để huấn luyện mô hình dự đoán, trong khi gom cụm tự động tìm cấu trúc nhóm dựa trên sự tương đồng mà không cần nhãn mục tiêu. Kết luận Lý giải Phân lớp là học có giám sát (đã biết nhãn), còn gom cụm là học không giám sát (chưa biết nhãn)

Câu 6: Trong cây quyết định (Decision Tree), chỉ số Entropy được sử dụng để đo lường đại lượng nào?

A. Độ hỗn loạn hoặc độ không thuần khiết của thông tin trong tập dữ liệu
B. Khoảng cách giữa nút gốc và các nút lá
C. Số lượng các nhánh tối đa của một nút
D. Thời gian cần thiết để xây dựng cây quyết định

💡 Lời giải chi tiết:

Entropy là một khái niệm trong lý thuyết thông tin dùng để xác định mức độ ngẫu nhiên hoặc không tinh khiết của các ví dụ trong một tập dữ liệu tại một nút cụ thể. Kết luận Lý giải Độ hỗn loạn hoặc độ không thuần khiết của thông tin trong tập dữ liệu

Câu 7: Giả định quan trọng nhất của thuật toán Naive Bayes là gì?

A. Sự độc lập có điều kiện giữa các thuộc tính dự báo
B. Các thuộc tính phải tuân theo phân phối chuẩn hoàn toàn
C. Dữ liệu không được phép có bất kỳ giá trị thiếu nào
D. Kích thước tập huấn luyện phải bằng kích thước tập kiểm tra

💡 Lời giải chi tiết:

Thuật toán được gọi là 'Naive' (ngây thơ) vì nó giả định rằng sự hiện diện của một thuộc tính cụ thể trong một lớp là hoàn toàn độc lập với sự hiện diện của bất kỳ thuộc tính nào khác. Kết luận Lý giải Sự độc lập có điều kiện giữa các thuộc tính dự báo

Câu 8: Thuật toán K-Nearest Neighbors (KNN) được phân loại là phương pháp học nào?

A. Học lười (Lazy learning)
B. Học tích cực (Eager learning)
C. Học không giám sát
D. Học tăng cường

💡 Lời giải chi tiết:

KNN được gọi là học lười vì nó không xây dựng một mô hình dự báo tường minh trong giai đoạn huấn luyện mà chỉ lưu trữ dữ liệu và thực hiện tính toán khi có truy vấn mới. Kết luận Lý giải Học lười (Lazy learning)

Câu 9: Mục tiêu chính của thuật toán Máy vectơ hỗ trợ (Support Vector Machine - SVM) là gì?

A. Tìm một siêu phẳng phân cách cực đại hóa lề (margin) giữa các lớp
B. Xây dựng một tập hợp các luật kết hợp từ dữ liệu giao dịch
C. Tính toán xác suất hậu nghiệm dựa trên định lý Bayes
D. Phân chia dữ liệu thành K nhóm dựa trên khoảng cách Euclide

💡 Lời giải chi tiết:

SVM hoạt động bằng cách tìm kiếm một ranh giới quyết định (siêu phẳng) sao cho khoảng cách từ ranh giới đó đến các điểm dữ liệu gần nhất của mỗi lớp là lớn nhất. Kết luận Lý giải Tìm một siêu phẳng phân cách cực đại hóa lề (margin) giữa các lớp

Câu 10: Hiện tượng 'Overfitting' (Quá khớp) trong phân lớp dữ liệu xảy ra khi nào?

A. Mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém trên tập dữ liệu mới
B. Mô hình quá đơn giản nên không học được cấu trúc của dữ liệu
C. Dữ liệu huấn luyện quá ít dẫn đến mô hình không thể hội tụ
D. Tốc độ huấn luyện mô hình diễn ra quá nhanh so với dự kiến

💡 Lời giải chi tiết:

Quá khớp xảy ra khi mô hình học cả những nhiễu và chi tiết ngẫu nhiên trong tập huấn luyện, dẫn đến khả năng tổng quát hóa kém trên các dữ liệu chưa từng thấy. Kết luận Lý giải Mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém trên tập dữ liệu mới

Câu 11: Thuật toán K-means là một kỹ thuật gom cụm dựa trên nguyên lý nào?

A. Phân hoạch dữ liệu dựa trên khoảng cách tới các trọng tâm (centroids)
B. Xây dựng cấu trúc phân cấp dạng cây (dendrogram)
C. Tìm các vùng có mật độ dữ liệu cao hơn một ngưỡng xác định
D. Sử dụng các luật logic để nhóm các đối tượng giống nhau

💡 Lời giải chi tiết:

K-means chia tập dữ liệu thành K cụm bằng cách gán mỗi đối tượng vào cụm có trọng tâm gần nó nhất và cập nhật lại trọng tâm liên tục cho đến khi hội tụ. Kết luận Lý giải Phân hoạch dữ liệu dựa trên khoảng cách tới các trọng tâm (centroids)

Câu 12: Trong thuật toán DBSCAN, một điểm được gọi là 'Core Point' (điểm lõi) nếu thỏa mãn điều kiện nào?

A. Có ít nhất 'MinPts' điểm nằm trong vùng lân cận bán kính 'Eps' của nó
B. Nằm ở trung tâm của toàn bộ tập dữ liệu nghiên cứu
C. Là điểm có khoảng cách xa nhất đối với các điểm nhiễu
D. Có giá trị thuộc tính lớn hơn giá trị trung bình của tập dữ liệu

💡 Lời giải chi tiết:

DBSCAN xác định điểm lõi dựa trên mật độ lân cận, yêu cầu số lượng điểm tối thiểu (MinPts) trong một phạm vi khoảng cách (Eps) cho trước. Kết luận Lý giải Có ít nhất 'MinPts' điểm nằm trong vùng lân cận bán kính 'Eps' của nó

Câu 13: Chỉ số Silhouette Coefficient được sử dụng để đánh giá chất lượng của tác vụ nào?

A. Gom cụm dữ liệu
B. Phân lớp dữ liệu
C. Khai phá luật kết hợp
D. Tiền xử lý dữ liệu

💡 Lời giải chi tiết:

Hệ số Silhouette đo lường mức độ giống nhau của một đối tượng với cụm của chính nó so với các cụm khác để đánh giá hiệu quả việc phân nhóm. Kết luận Lý giải Gom cụm dữ liệu

Câu 14: Độ đo 'Recall' (Độ triệu hồi) trong đánh giá mô hình phân lớp được tính như thế nào?

A. Tỷ lệ số điểm Positive dự đoán đúng trên tổng số điểm Positive thực tế
B. Tỷ lệ số điểm Positive dự đoán đúng trên tổng số điểm dự đoán là Positive
C. Tổng số điểm dự đoán đúng trên toàn bộ tập dữ liệu kiểm tra
D. Trung bình cộng của độ chính xác (Precision) và độ lỗi (Error rate)

💡 Lời giải chi tiết:

Recall (còn gọi là Sensitivity) đo lường khả năng của mô hình trong việc tìm ra tất cả các trường hợp thực sự thuộc về lớp tích cực. Kết luận Lý giải Tỷ lệ số điểm Positive dự đoán đúng trên tổng số điểm Positive thực tế

Câu 15: Mục đích chính của kỹ thuật 'K-fold Cross-validation' là gì?

A. Đánh giá hiệu năng của mô hình một cách khách quan và giảm thiểu sai số do chọn tập dữ liệu
B. Tăng tốc độ huấn luyện mô hình bằng cách chia nhỏ dữ liệu
C. Tự động lựa chọn thuật toán khai phá dữ liệu tốt nhất
D. Loại bỏ hoàn toàn các thuộc tính gây nhiễu trong dữ liệu đầu vào

💡 Lời giải chi tiết:

Kiểm tra chéo K-fold chia dữ liệu thành K phần, luân phiên huấn luyện và kiểm tra để đảm bảo mọi điểm dữ liệu đều được dùng để kiểm tra, giúp đánh giá mô hình ổn định hơn. Kết luận Lý giải Đánh giá hiệu năng của mô hình một cách khách quan và giảm thiểu sai số do chọn tập dữ liệu

Câu 16: Kỹ thuật PCA (Principal Component Analysis) thường được dùng cho mục đích nào trong tiền xử lý dữ liệu?

A. Giảm chiều dữ liệu (Dimensionality Reduction)
B. Tích hợp nhiều nguồn dữ liệu khác nhau
C. Gán nhãn cho dữ liệu chưa có nhãn
D. Tăng số lượng thuộc tính thông qua biến đổi phi tuyến

💡 Lời giải chi tiết:

PCA biến đổi các thuộc tính ban đầu có khả năng tương quan thành một tập nhỏ hơn các biến không tương quan gọi là các thành phần chính nhằm giảm độ phức tạp của dữ liệu. Kết luận Lý giải Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 17: Trong khai phá dữ liệu văn bản, chỉ số TF-IDF dùng để làm gì?

A. Đánh giá mức độ quan trọng của một từ trong một văn bản dựa trên toàn bộ tập văn bản
B. Đếm tổng số ký tự có trong một tệp văn bản
C. Xác định lỗi chính tả trong các câu văn
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác

💡 Lời giải chi tiết:

TF-IDF giúp làm nổi bật các từ mang tính đặc trưng của một văn bản bằng cách tăng trọng số cho từ xuất hiện nhiều trong văn bản đó nhưng ít xuất hiện ở các văn bản khác. Kết luận Lý giải Đánh giá mức độ quan trọng của một từ trong một văn bản dựa trên toàn bộ tập văn bản

Câu 18: Thuật toán gom cụm phân cấp (Hierarchical Clustering) thường được biểu diễn trực quan bằng sơ đồ nào?

A. Biểu đồ Dendrogram
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ hộp (Box plot)

💡 Lời giải chi tiết:

Dendrogram là một sơ đồ dạng cây hiển thị trình tự các bước hợp nhất hoặc phân chia các cụm dữ liệu trong gom cụm phân cấp. Kết luận Lý giải Biểu đồ Dendrogram

Câu 19: Dữ liệu ngoại lai (Outliers) trong khai phá dữ liệu thường được hiểu là gì?

A. Những quan sát khác biệt đáng kể so với phần còn lại của dữ liệu
B. Những dữ liệu bị thiếu giá trị ở các thuộc tính quan trọng
C. Các giá trị trung bình của toàn bộ tập dữ liệu
D. Dữ liệu nằm chính xác tại trọng tâm của các cụm

💡 Lời giải chi tiết:

Ngoại lai là những điểm dữ liệu không tuân theo hành vi chung của tập dữ liệu, có thể là nhiễu hoặc chứa đựng thông tin đặc biệt quan trọng như hành vi gian lận. Kết luận Lý giải Những quan sát khác biệt đáng kể so với phần còn lại của dữ liệu

Câu 20: Thuật toán 'Random Forest' hoạt động dựa trên nguyên lý nào?

A. Kết hợp kết quả của nhiều cây quyết định độc lập (Ensemble Learning)
B. Sử dụng một cây quyết định duy nhất với độ sâu tối đa
C. Chuyển đổi dữ liệu sang không gian thứ bậc cao hơn
D. Tính toán khoảng cách giữa các điểm dữ liệu để tạo rừng

💡 Lời giải chi tiết:

Rừng ngẫu nhiên cải thiện độ chính xác và tính ổn định bằng cách xây dựng nhiều cây quyết định trên các mẫu dữ liệu khác nhau và lấy kết quả bỏ phiếu đa số. Kết luận Lý giải Kết hợp kết quả của nhiều cây quyết định độc lập (Ensemble Learning)

Câu 21: Chỉ số 'Lift' trong khai phá luật kết hợp (A -> B) lớn hơn 1 có ý nghĩa gì?

A. Sự xuất hiện của A và B có sự phụ thuộc tích cực vào nhau
B. Sự xuất hiện của A làm giảm khả năng xuất hiện của B
C. và B là hai tập mục tiêu hoàn toàn độc lập
D. Luật kết hợp này không có giá trị thực tiễn

💡 Lời giải chi tiết:

Giá trị Lift > 1 cho thấy A và B xuất hiện cùng nhau thường xuyên hơn mức mong đợi nếu chúng độc lập, chứng tỏ có mối liên hệ tích cực giữa chúng. Kết luận Lý giải Sự xuất hiện của A và B có sự phụ thuộc tích cực vào nhau

Câu 22: Kỹ thuật 'Binning' (chia giỏ) thường được sử dụng trong bước nào của tiền xử lý dữ liệu?

A. Làm mịn dữ liệu để giảm nhiễu (Data Smoothing)
B. Khôi phục các bản ghi bị xóa khỏi cơ sở dữ liệu
C. Tăng kích thước dữ liệu để bù đắp mẫu thiếu
D. Mã hóa dữ liệu văn bản thành dữ liệu hình ảnh

💡 Lời giải chi tiết:

Binning là kỹ thuật nhóm các giá trị số liên tục vào các khoảng (giỏ) nhỏ để giảm bớt ảnh hưởng của các giá trị nhiễu hoặc sai sót nhỏ. Kết luận Lý giải Làm mịn dữ liệu để giảm nhiễu (Data Smoothing)

Câu 23: Trong đánh giá mô hình, 'F1-Score' là đại lượng được tính toán dựa trên sự kết hợp của hai chỉ số nào?

A. Precision (Độ chính xác) và Recall (Độ triệu hồi)
B. Accuracy (Độ chính xác tổng quát) và Error rate (Tỷ lệ lỗi)
C. Support (Độ hỗ trợ) và Confidence (Độ tin cậy)
D. Sensitivity (Độ nhạy) và Specificity (Độ đặc hiệu)

💡 Lời giải chi tiết:

F1-Score là trung bình điều hòa của Precision và Recall, được dùng làm chỉ số đại diện khi cần cân bằng giữa hai đại lượng này, đặc biệt trong bài toán mất cân bằng lớp. Kết luận Lý giải Precision (Độ chính xác) và Recall (Độ triệu hồi)

Câu 24: Hệ thống 'OLAP' (Online Analytical Processing) khác với 'Data Mining' ở điểm cơ bản nào?

A. OLAP dùng để tóm tắt báo cáo, còn Data Mining dùng để tìm kiếm các tri thức ẩn
B. OLAP chỉ dùng cho dữ liệu hiện tại, còn Data Mining chỉ dùng cho dữ liệu quá khứ
C. OLAP đòi hỏi kỹ năng lập trình cao hơn Data Mining
D. Data Mining luôn thực hiện nhanh hơn OLAP trên cùng một tập dữ liệu

💡 Lời giải chi tiết:

Trong khi OLAP hỗ trợ phân tích dữ liệu đa chiều để trả lời các câu hỏi thống kê định sẵn, Data Mining đi sâu vào việc phát hiện các mẫu và mối quan hệ chưa biết trước đó. Kết luận Lý giải OLAP dùng để tóm tắt báo cáo, còn Data Mining dùng để tìm kiếm các tri thức ẩn

Câu 25: Mục tiêu của 'Data Transformation' (Biến đổi dữ liệu) trong khai phá dữ liệu là gì?

A. Chuyển dữ liệu sang định dạng phù hợp nhất cho các thuật toán khai phá
B. Xóa bỏ các bản ghi không quan trọng để tiết kiệm bộ nhớ
C. Tự động sao lưu dữ liệu vào các hệ thống lưu trữ đám mây
D. Thay đổi nội dung dữ liệu để che giấu thông tin cá nhân

💡 Lời giải chi tiết:

Biến đổi dữ liệu bao gồm các hoạt động như chuẩn hóa, kết hợp hoặc rời rạc hóa để giúp các mô hình toán học xử lý dữ liệu hiệu quả và chính xác hơn. Kết luận Lý giải Chuyển dữ liệu sang định dạng phù hợp nhất cho các thuật toán khai phá

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 11 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 155 lượt làm

Làm ngay

Bộ 12 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 172 lượt làm

Làm ngay

Bộ 13 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 189 lượt làm

Làm ngay

Bộ 14 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 206 lượt làm

Làm ngay

Bộ 15 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 223 lượt làm

Làm ngay

Bộ 1 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Bộ trắc nghiệm 185 lượt làm

Làm ngay

Bộ 10 - Trắc nghiệm Khai phá dữ liệu online có đáp án

Kết quả của bạn:

Câu 1: Trong quy trình khám phá tri thức từ dữ liệu (KDD), bước nào tập trung vào việc loại bỏ dữ liệu nhiễu và dữ liệu không nhất quán?

Câu 2: Kỹ thuật nào dưới đây thường được sử dụng để giải quyết vấn đề dữ liệu có các thang đo (scale) khác nhau trước khi đưa vào mô hình khai phá?

Câu 3: Trong khai phá luật kết hợp, độ hỗ trợ (Support) của một tập phổ biến A được định nghĩa là gì?

Câu 4: Thuật toán Apriori dựa trên tính chất cốt lõi nào để giảm bớt không gian tìm kiếm các tập mục tiêu phổ biến?

Câu 5: Điểm khác biệt cơ bản nhất giữa Phân lớp (Classification) và Gom cụm (Clustering) là gì?

Câu 6: Trong cây quyết định (Decision Tree), chỉ số Entropy được sử dụng để đo lường đại lượng nào?

Câu 7: Giả định quan trọng nhất của thuật toán Naive Bayes là gì?

Câu 8: Thuật toán K-Nearest Neighbors (KNN) được phân loại là phương pháp học nào?

Câu 9: Mục tiêu chính của thuật toán Máy vectơ hỗ trợ (Support Vector Machine - SVM) là gì?

Câu 10: Hiện tượng 'Overfitting' (Quá khớp) trong phân lớp dữ liệu xảy ra khi nào?

Câu 11: Thuật toán K-means là một kỹ thuật gom cụm dựa trên nguyên lý nào?

Câu 12: Trong thuật toán DBSCAN, một điểm được gọi là 'Core Point' (điểm lõi) nếu thỏa mãn điều kiện nào?

Câu 13: Chỉ số Silhouette Coefficient được sử dụng để đánh giá chất lượng của tác vụ nào?

Câu 14: Độ đo 'Recall' (Độ triệu hồi) trong đánh giá mô hình phân lớp được tính như thế nào?

Câu 15: Mục đích chính của kỹ thuật 'K-fold Cross-validation' là gì?

Câu 16: Kỹ thuật PCA (Principal Component Analysis) thường được dùng cho mục đích nào trong tiền xử lý dữ liệu?

Câu 17: Trong khai phá dữ liệu văn bản, chỉ số TF-IDF dùng để làm gì?

Câu 18: Thuật toán gom cụm phân cấp (Hierarchical Clustering) thường được biểu diễn trực quan bằng sơ đồ nào?

Câu 19: Dữ liệu ngoại lai (Outliers) trong khai phá dữ liệu thường được hiểu là gì?

Câu 20: Thuật toán 'Random Forest' hoạt động dựa trên nguyên lý nào?

Câu 21: Chỉ số 'Lift' trong khai phá luật kết hợp (A -> B) lớn hơn 1 có ý nghĩa gì?

Câu 22: Kỹ thuật 'Binning' (chia giỏ) thường được sử dụng trong bước nào của tiền xử lý dữ liệu?

Câu 23: Trong đánh giá mô hình, 'F1-Score' là đại lượng được tính toán dựa trên sự kết hợp của hai chỉ số nào?

Câu 24: Hệ thống 'OLAP' (Online Analytical Processing) khác với 'Data Mining' ở điểm cơ bản nào?

Câu 25: Mục tiêu của 'Data Transformation' (Biến đổi dữ liệu) trong khai phá dữ liệu là gì?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top