Bộ 8 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Thời gian còn lại: --:--

Câu 1: Sự khác biệt chính giữa Business Intelligence (BI) và Khoa học dữ liệu (Data Science) trong doanh nghiệp là gì?

Câu 2: Trong quy trình chuẩn công nghiệp về khai phá dữ liệu (CRISP-DM), giai đoạn nào được thực hiện đầu tiên?

Câu 3: Hiện tượng 'Overfitting' (Quá khớp) trong xây dựng mô hình dự báo kinh tế xảy ra khi nào?

Câu 4: Mục đích chính của việc sử dụng 'A/B Testing' trong marketing kỹ thuật số là gì?

Câu 5: Thuật toán K-means Clustering thường được ứng dụng vào bài toán kinh doanh nào sau đây?

Câu 6: Trong bước làm sạch dữ liệu, kỹ thuật 'Normalization' (Chuẩn hóa) nhằm mục đích gì?

Câu 7: Dữ liệu nào sau đây được phân loại là 'Dữ liệu phi cấu trúc' (Unstructured Data)?

Câu 8: Hệ thống gợi ý (Recommender System) sử dụng phương pháp 'Collaborative Filtering' dựa trên nguyên lý nào?

Câu 9: Trong phân tích chuỗi thời gian kinh tế, tính 'Dừng' (Stationarity) của dữ liệu có nghĩa là gì?

Câu 10: Thành phần nào trong 5V của Big Data mô tả tốc độ mà dữ liệu được tạo ra và cần được xử lý?

Câu 11: Trong bài toán dự báo khách hàng rời bỏ (Churn Prediction), chỉ số 'Recall' (Độ nhạy) cho biết điều gì?

Câu 12: Sự khác biệt cơ bản giữa học máy có giám sát (Supervised Learning) và học máy không giám sát (Unsupervised Learning) là gì?

Câu 13: Trong phân tích kinh tế, tại sao 'Tương quan' (Correlation) không đồng nghĩa với 'Nhân quả' (Causation)?

Câu 14: Kỹ thuật 'Imputation' trong tiền xử lý dữ liệu có nghĩa là gì?

Câu 15: Mô hình Hồi quy Logistic (Logistic Regression) thường được ưu tiên sử dụng cho loại biến phụ thuộc nào?

Câu 16: Trong Cây quyết định (Decision Tree), chỉ số 'Entropy' được dùng để đo lường điều gì?

Câu 17: Khái niệm 'ETL' trong kỹ thuật dữ liệu (Data Engineering) là viết tắt của các bước nào?

Câu 18: Trong kinh tế học số, 'Độ co giãn của cầu theo giá' có thể được ước lượng chính xác nhất qua mô hình nào?

Câu 19: Phân tích giỏ hàng (Market Basket Analysis) sử dụng chỉ số 'Lift' để đo lường điều gì?

Câu 20: Ứng dụng nào sau đây của Xử lý ngôn ngữ tự nhiên (NLP) phổ biến nhất trong phân tích kinh doanh?

Câu 21: Tại sao tính 'Khả năng mở rộng' (Scalability) của điện toán đám mây lại quan trọng đối với Khoa học dữ liệu?

Câu 22: Thuật toán Rừng ngẫu nhiên (Random Forest) hoạt động dựa trên cơ chế nào sau đây?

Câu 23: Trong tối ưu hóa mô hình, thuật toán 'Gradient Descent' thực hiện nhiệm vụ gì?

Câu 24: Giá trị 'P-value' trong kiểm định giả thuyết thống kê có ý nghĩa gì?

Câu 25: Chỉ số 'Giá trị vòng đời khách hàng' (Customer Lifetime Value - CLV) giúp doanh nghiệp quyết định điều gì?