Bộ 14 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Thời gian còn lại: --:--

Câu 1: Trong lĩnh vực khoa học dữ liệu, thành phần nào sau đây đóng vai trò là 'nguyên liệu' đầu vào cốt lõi để tạo ra giá trị kinh doanh?

Câu 2: Mô hình học máy nào sau đây thường được sử dụng nhất để dự báo một giá trị liên tục, chẳng hạn như doanh thu bán hàng tháng tới?

Câu 3: Trong phân tích khách hàng, kỹ thuật nào giúp doanh nghiệp chia nhóm khách hàng có đặc điểm hành vi tương đồng mà không cần biết trước nhãn nhóm?

Câu 4: Chỉ số 'R-squared' (Hệ số xác định) trong mô hình hồi quy có ý nghĩa chính là gì?

Câu 5: Khi xây dựng mô hình dự báo nợ xấu ngân hàng, nếu mô hình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng rất kém trên dữ liệu thực tế mới, hiện tượng này gọi là gì?

Câu 6: Kỹ thuật 'A/B Testing' trong kinh doanh trực tuyến thường được sử dụng nhằm mục đích chính nào?

Câu 7: Trong ma trận nhầm lẫn (Confusion Matrix), 'Precision' (Độ chính xác) được định nghĩa như thế nào?

Câu 8: Dữ liệu nào sau đây được phân loại là dữ liệu phi cấu trúc (Unstructured Data)?

Câu 9: Mục tiêu chính của bước 'Làm sạch dữ liệu' (Data Cleaning) trong quy trình khoa học dữ liệu là gì?

Câu 10: Thuật toán 'Apriori' thường được ứng dụng trong bài toán kinh doanh nào dưới đây?

Câu 11: Trong kiểm định giả thuyết thống kê, giá trị 'p-value' nhỏ hơn mức ý nghĩa (ví dụ p < 0.05) có nghĩa là gì?

Câu 12: Phương pháp 'K-fold Cross-Validation' được sử dụng chủ yếu để làm gì?

Câu 13: Hệ thống gợi ý (Recommendation Systems) sử dụng kỹ thuật 'Collaborative Filtering' dựa trên thông tin nào?

Câu 14: Sự khác biệt chính giữa 'Kho dữ liệu' (Data Warehouse) và 'Hồ dữ liệu' (Data Lake) là gì?

Câu 15: Trong mô hình cây quyết định (Decision Tree), khái niệm 'Gini Impurity' hoặc 'Entropy' dùng để đo lường điều gì?

Câu 16: Thuật toán 'Random Forest' cải thiện kết quả so với một 'Decision Tree' đơn lẻ chủ yếu bằng cách nào?

Câu 17: Trong kinh tế học, việc nhầm lẫn giữa 'Tương quan' (Correlation) và 'Nhân quả' (Causation) có thể dẫn đến hệ quả gì?

Câu 18: Khái niệm 'Bias' (Độ lệch) trong một mô hình học máy mô tả điều gì?

Câu 19: Phân tích cảm xúc (Sentiment Analysis) thường sử dụng kỹ thuật nào trong khoa học dữ liệu để hiểu ý kiến khách hàng?

Câu 20: Trong bài toán dự đoán khách hàng rời bỏ (Churn Prediction), tại sao chỉ số 'Recall' thường quan trọng hơn 'Accuracy' nếu dữ liệu bị mất cân bằng?

Câu 21: Mô hình ARIMA (AutoRegressive Integrated Moving Average) thường được áp dụng cho loại dữ liệu nào?

Câu 22: Vai trò của 'Feature Engineering' (Kỹ nghệ đặc trưng) trong quy trình xây dựng mô hình là gì?

Câu 23: Việc sử dụng 'L1 Regularization' (Lasso) trong hồi quy có tác dụng đặc biệt nào sau đây?

Câu 24: Trong phân tích dữ liệu lớn (Big Data), đặc tính 'Velocity' (Tốc độ) đề cập đến điều gì?

Câu 25: Khi nói về đạo đức trong khoa học dữ liệu, 'Algorithmic Bias' (Định kiến thuật toán) có thể gây ra vấn đề gì?