Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Thời gian còn lại: --:--

Câu 1: Trong phân tích dữ liệu kinh doanh, sự khác biệt cốt lõi giữa 'Phân tích dự báo' (Predictive Analytics) và 'Phân tích mô tả' (Descriptive Analytics) là gì?

Câu 2: Hiện tượng 'Overfitting' (Quá khớp) trong mô hình học máy khi dự báo nhu cầu thị trường thường dẫn đến hệ quả nào sau đây?

Câu 3: Mục đích chính của việc thực hiện 'A/B Testing' trong chiến dịch marketing kỹ thuật số là gì?

Câu 4: Trong khoa học dữ liệu, kỹ thuật 'Feature Selection' (Chọn lọc đặc trưng) có vai trò quan trọng nhất là gì?

Câu 5: Để dự báo khả năng một khách hàng sẽ rời bỏ dịch vụ (Churn Prediction), loại mô hình nào sau đây thường được ưu tiên sử dụng?

Câu 6: Trong bài toán phát hiện gian lận tín dụng, thách thức lớn nhất đối với tập dữ liệu thường là gì?

Câu 7: Chỉ số 'Mean Absolute Error' (MAE) trong đánh giá mô hình hồi quy dự báo doanh thu cho biết điều gì?

Câu 8: Phương pháp 'K-means clustering' thường được ứng dụng phổ biến nhất trong hoạt động kinh doanh nào?

Câu 9: Trong khai phá dữ liệu (Data Mining), chỉ số 'Lift' trong luật kết hợp (Association Rules) lớn hơn 1 có ý nghĩa gì đối với việc bán chéo sản phẩm?

Câu 10: Hiện tượng 'Data Leakage' (Rò rỉ dữ liệu) trong xây dựng mô hình dự báo kinh tế xảy ra khi nào?

Câu 11: Giả định về 'Phương sai sai số không đổi' (Homoscedasticity) trong hồi quy tuyến tính cổ điển có ý nghĩa gì?

Câu 12: Kỹ thuật 'Pruning' (Tỉa cành) trong thuật toán Cây quyết định (Decision Tree) nhằm mục đích chủ yếu là gì?

Câu 13: Sự khác biệt cơ bản giữa 'Học có giám sát' (Supervised Learning) và 'Học không giám sát' (Unsupervised Learning) là gì?

Câu 14: Trong phân tích kinh doanh, tại sao mối tương quan (Correlation) không đồng nghĩa với quan hệ nhân quả (Causation)?

Câu 15: Kỹ thuật 'K-fold Cross-validation' được sử dụng trong quy trình xây dựng mô hình nhằm mục đích gì?

Câu 16: Hệ thống 'Business Intelligence' (BI) khác với 'Data Science' ở điểm trọng tâm nào sau đây?

Câu 17: Việc thực hiện 'Standardization' (Chuẩn hóa) dữ liệu trước khi đưa vào mô hình Clustering có lợi ích gì?

Câu 18: Tại sao mô hình 'Random Forest' thường có hiệu suất tốt hơn một cây quyết định đơn lẻ (Single Decision Tree)?

Câu 19: Trong phân tích chuỗi thời gian (Time Series), yếu tố 'Tính mùa vụ' (Seasonality) được hiểu là gì?

Câu 20: Quy trình 'Tokenization' trong phân tích dữ liệu văn bản (NLP) phục vụ mục đích gì trong kinh doanh?

Câu 21: Vai trò của 'Hàm kích hoạt' (Activation Function) trong mạng thần kinh nhân tạo (Neural Networks) là gì?

Câu 22: Khi đánh giá mô hình phân loại khách hàng tiềm năng, chỉ số 'Recall' (Độ nhạy) cao có ý nghĩa gì đối với đội ngũ bán hàng?

Câu 23: Trong kiến trúc dữ liệu hiện đại, quá trình 'ETL' (Extract, Transform, Load) thực hiện nhiệm vụ gì?

Câu 24: Ý nghĩa của giá trị 'P-value' nhỏ hơn 0.05 trong một kiểm định giả thuyết kinh tế là gì?

Câu 25: Mô hình hồi quy Logistic (Logistic Regression) trả về kết quả đầu ra dưới dạng nào?