Bộ 4 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Thời gian còn lại: --:--

Câu 1: Trong khoa học dữ liệu kinh doanh, sự khác biệt cốt lõi giữa dữ liệu có cấu trúc (structured data) và dữ liệu phi cấu trúc (unstructured data) là gì?

Câu 2: Loại hình phân tích nào trong khoa học dữ liệu tập trung vào việc trả lời câu hỏi 'Điều gì nên làm?' để tối ưu hóa kết quả kinh doanh?

Câu 3: Trong bối cảnh kinh tế, mô hình hồi quy tuyến tính thường được sử dụng nhất để thực hiện nhiệm vụ nào sau đây?

Câu 4: Khi xây dựng mô hình dự báo khách hàng rời bỏ (Churn Prediction), biến mục tiêu (target variable) thường có đặc điểm gì?

Câu 5: Đặc trưng 'Veracity' (Tính xác thực) trong mô hình 5V của Big Data đề cập đến vấn đề nào?

Câu 6: Nguyên tắc 'Data Minimization' (Tối thiểu hóa dữ liệu) theo quy định GDPR có nghĩa là gì?

Câu 7: Trong đánh giá rủi ro tín dụng, mô hình nào thường được ưu tiên nhờ khả năng giải thích (interpretability) cao cho các cơ quan quản lý?

Câu 8: Kỹ thuật 'Imputation' trong giai đoạn tiền xử lý dữ liệu được sử dụng để giải quyết vấn đề gì?

Câu 9: Tại sao độ đo 'Recall' thường quan trọng hơn 'Precision' trong bài toán phát hiện gian lận tài chính (Fraud Detection)?

Câu 10: Trong thử nghiệm A/B (A/B Testing) của marketing kỹ thuật số, giá trị 'p-value' nhỏ hơn mức ý nghĩa (ví dụ 0.05) cho thấy điều gì?

Câu 11: Thuật toán K-means thường được ứng dụng trong kinh doanh nhằm mục đích chính là gì?

Câu 12: Biểu đồ hộp (Box Plot) là công cụ hữu ích nhất để thực hiện nhiệm vụ nào trong phân tích dữ liệu kinh doanh?

Câu 13: Sự khác biệt chính về triết lý lưu trữ giữa Data Warehouse và Data Lake là gì?

Câu 14: Quy trình ETL (Extract, Transform, Load) đóng vai trò gì trong kiến trúc dữ liệu của doanh nghiệp?

Câu 15: Phân tích cảm xúc (Sentiment Analysis) sử dụng kỹ thuật nào để hiểu phản hồi của khách hàng về sản phẩm?

Câu 16: Kỹ thuật 'Regularization' (như Lasso hoặc Ridge) được áp dụng trong mô hình học máy với mục đích chính là gì?

Câu 17: Trong phân tích giỏ hàng (Market Basket Analysis), chỉ số 'Lift' lớn hơn 1 giữa sản phẩm A và B có ý nghĩa gì?

Câu 18: Tại sao mô hình Random Forest thường cho kết quả tốt hơn một cây quyết định (Decision Tree) đơn lẻ?

Câu 19: Thách thức lớn nhất khi tính toán ROI (Tỷ suất hoàn vốn) của các dự án khoa học dữ liệu là gì?

Câu 20: Mục tiêu chính của việc sử dụng 'Lập chỉ mục' (Indexing) trong cơ sở dữ liệu kinh doanh là gì?

Câu 21: Trong kỹ thuật đặc trưng (Feature Engineering), việc 'One-Hot Encoding' được thực hiện khi nào?

Câu 22: Yếu tố 'Tính mùa vụ' (Seasonality) trong phân tích chuỗi thời gian kinh doanh thường phản ánh điều gì?

Câu 23: Hệ thống khuyến nghị (Recommender Systems) sử dụng 'Collaborative Filtering' dựa trên nguyên lý nào?

Câu 24: Trong kinh tế học dữ liệu, sự khác biệt giữa tương quan (correlation) và nhân quả (causation) là gì?

Câu 25: Mô hình phân tích RFM trong quản trị quan hệ khách hàng (CRM) bao gồm ba yếu tố nào?