Bộ 3 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh
Thời gian còn lại: --:--
Kết quả của bạn:
Bạn đã đúng:
Bạn đã sai:
Tổng số câu:
Câu 1:Trong mô hình '4V' của Big Data được ứng dụng trong kinh doanh, đặc điểm 'Veracity' đề cập đến yếu tố nào?
💡 Lời giải chi tiết:
Theo các tài liệu chuẩn về khoa học dữ liệu, Veracity tập trung vào việc đảm bảo chất lượng, tính xác thực và độ tin cậy của nguồn dữ liệu trước khi đưa vào phân tích. Kết luận Lý giải Độ tin cậy và tính chính xác của dữ liệu
Câu 2:Kỹ thuật học máy nào là phù hợp nhất để phân loại khách hàng vào các nhóm có hành vi mua sắm tương đồng mà không có nhãn trước?
💡 Lời giải chi tiết:
Phân cụm là một phương pháp học không giám sát giúp tự động nhóm các đối tượng có đặc điểm tương đồng mà không cần dữ liệu đã được gán nhãn trước. Kết luận Lý giải Phân cụm (Clustering)
Câu 3:Chỉ số 'Churn Rate' trong phân tích dữ liệu kinh doanh được hiểu là gì?
💡 Lời giải chi tiết:
Trong quản trị quan hệ khách hàng, Churn Rate là chỉ số đo lường tỷ lệ khách hàng rời bỏ doanh nghiệp trong một khoảng thời gian nhất định. Kết luận Lý giải Tỷ lệ khách hàng ngừng sử dụng sản phẩm hoặc dịch vụ
Câu 4:Trong thương mại điện tử, phương pháp 'A/B Testing' được sử dụng chủ yếu để làm gì?
💡 Lời giải chi tiết:
A/B Testing là phương pháp thực nghiệm so sánh hai phiên bản (A và B) nhằm xác định phiên bản nào mang lại kết quả tốt hơn dựa trên một mục tiêu cụ thể. Kết luận Lý giải So sánh hai phiên bản của một biến số để xác định hiệu quả cao hơn
Câu 5:Mục đích chính của việc sử dụng mô hình 'Hồi quy Logistic' (Logistic Regression) trong lĩnh vực tài chính ngân hàng là gì?
💡 Lời giải chi tiết:
Hồi quy Logistic là mô hình phân loại nhị phân phổ biến được dùng để dự báo xác suất xảy ra của một sự kiện, chẳng hạn như khả năng khách hàng vỡ nợ. Kết luận Lý giải Ước tính xác suất một khách hàng sẽ vỡ nợ
Câu 6:Hệ thống gợi ý (Recommendation System) sử dụng phương pháp 'Collaborative Filtering' dựa trên yếu tố nào?
💡 Lời giải chi tiết:
Lọc cộng tác (Collaborative Filtering) đưa ra gợi ý bằng cách phân tích sự tương đồng trong hành vi và sở thích của các người dùng khác nhau. Kết luận Lý giải Hành vi và sự tương đồng giữa các người dùng
Câu 7:Hiện tượng 'Overfitting' (Quá khớp) trong xây dựng mô hình dự báo kinh doanh dẫn đến hệ quả nào?
💡 Lời giải chi tiết:
Overfitting xảy ra khi mô hình quá phức tạp, học cả nhiễu của dữ liệu huấn luyện khiến khả năng dự báo trên dữ liệu thực tế bị giảm sút. Kết luận Lý giải Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới
Câu 8:Trong phân tích chuỗi thời gian (Time Series Analysis), yếu tố 'Seasonality' đề cập đến điều gì?
💡 Lời giải chi tiết:
Tính mùa vụ (Seasonality) mô tả những biến động lặp đi lặp lại trong dữ liệu theo các khoảng thời gian cố định như tuần, tháng hoặc quý. Kết luận Lý giải Sự lặp lại của các biến động theo chu kỳ thời gian cố định
Câu 9:Thuật toán 'Market Basket Analysis' (Phân tích giỏ hàng) thường sử dụng kỹ thuật nào để tìm ra mối liên hệ giữa các sản phẩm?
💡 Lời giải chi tiết:
Khai phá luật kết hợp là kỹ thuật cốt lõi giúp xác định xác suất các mặt hàng được mua cùng nhau trong một giao dịch bán lẻ. Kết luận Lý giải Khai phá luật kết hợp (Association Rule Mining)
Câu 10:Tại sao việc 'Làm sạch dữ liệu' (Data Cleaning) lại quan trọng nhất trong quy trình khoa học dữ liệu?
💡 Lời giải chi tiết:
Nguyên tắc 'Garbage In, Garbage Out' nhấn mạnh rằng chất lượng của mô hình phụ thuộc trực tiếp vào tính chính xác của dữ liệu đầu vào. Kết luận Lý giải Vì dữ liệu đầu vào sai lệch sẽ dẫn đến kết quả dự báo sai
Câu 11:Trong khoa học dữ liệu, 'Feature Engineering' là quá trình gì?
💡 Lời giải chi tiết:
Feature Engineering là kỹ thuật trích xuất, lựa chọn và biến đổi các đặc trưng từ dữ liệu thô nhằm giúp thuật toán học máy hoạt động hiệu quả hơn. Kết luận Lý giải Lựa chọn và biến đổi các biến đầu vào để cải thiện mô hình
Câu 12:Phân tích cảm xúc (Sentiment Analysis) sử dụng kỹ thuật nào để đánh giá ý kiến khách hàng?
💡 Lời giải chi tiết:
Xử lý ngôn ngữ tự nhiên là lĩnh vực giúp máy tính hiểu, phân tích và trích xuất cảm xúc tích cực hoặc tiêu cực từ văn bản của con người. Kết luận Lý giải Xử lý ngôn ngữ tự nhiên (NLP)
Câu 13:Mục tiêu chính của việc sử dụng 'Data Warehouse' trong một doanh nghiệp lớn là gì?
💡 Lời giải chi tiết:
Kho dữ liệu (Data Warehouse) được thiết kế để tập hợp dữ liệu từ nhiều nguồn khác nhau nhằm hỗ trợ quá trình báo cáo và ra quyết định chiến lược. Kết luận Lý giải Tích hợp và lưu trữ dữ liệu lịch sử để phục vụ phân tích
Câu 14:Trong ma trận nhầm lẫn (Confusion Matrix), chỉ số 'Precision' đo lường điều gì?
💡 Lời giải chi tiết:
Độ chính xác (Precision) xác định trong số các trường hợp mô hình dự báo là dương tính thì có bao nhiêu trường hợp thực sự là dương tính. Kết luận Lý giải Tỷ lệ dự báo đúng trên tổng số các trường hợp dự báo dương tính
Câu 15:Quy định GDPR của Liên minh Châu Âu có tác động gì lớn nhất đến khoa học dữ liệu trong kinh doanh?
💡 Lời giải chi tiết:
GDPR thiết lập các tiêu chuẩn nghiêm ngặt về quyền riêng tư, đòi hỏi doanh nghiệp phải có sự đồng ý của người dùng khi xử lý dữ liệu cá nhân. Kết luận Lý giải Thắt chặt việc thu thập và sử dụng dữ liệu cá nhân của người dùng
Câu 16:Thuật toán 'Random Forest' được phân loại vào nhóm phương pháp nào?
💡 Lời giải chi tiết:
Random Forest là một phương pháp học tổ hợp kết hợp kết quả từ nhiều cây quyết định để cải thiện độ chính xác và giảm hiện tượng quá khớp. Kết luận Lý giải Phương pháp tổ hợp (Ensemble Learning)
Câu 17:Khái niệm 'Correlation does not imply causation' (Tương quan không có nghĩa là nhân quả) có ý nghĩa gì trong phân tích kinh doanh?
💡 Lời giải chi tiết:
Trong khoa học dữ liệu, mối quan hệ thống kê giữa hai biến không đủ để khẳng định sự tồn tại của mối quan hệ nguyên nhân - kết quả. Kết luận Lý giải Việc hai sự việc xảy ra cùng nhau không chứng minh cái này gây ra cái kia
Câu 18:Ứng dụng nào sau đây sử dụng kỹ thuật 'Dự báo chuỗi thời gian' (Time Series Forecasting)?
💡 Lời giải chi tiết:
Dự báo chuỗi thời gian sử dụng dữ liệu lịch sử theo trình tự thời gian để ước tính các giá trị trong tương lai, như nhu cầu hàng hóa. Kết luận Lý giải Dự báo nhu cầu hàng tồn kho theo tháng
Câu 19:Vai trò của 'Data Scientist' khác với 'Data Analyst' ở điểm cốt lõi nào?
💡 Lời giải chi tiết:
Trong khi Data Analyst thường tập trung vào mô tả dữ liệu hiện tại, Data Scientist thường thiết kế các thuật toán và mô hình dự báo để giải quyết vấn đề. Kết luận Lý giải Data Scientist tập trung nhiều hơn vào việc xây dựng mô hình dự báo phức tạp
Câu 20:Trong quy trình khoa học dữ liệu, bước 'Exploratory Data Analysis' (EDA) nhằm mục đích gì?
💡 Lời giải chi tiết:
EDA là bước quan trọng giúp nhà phân tích hiểu rõ phân phối của dữ liệu và các mối quan hệ tiềm ẩn trước khi áp dụng các mô hình phức tạp. Kết luận Lý giải Khám phá cấu trúc, đặc điểm và tìm ra các quy luật sơ bộ của dữ liệu
Câu 21:Một doanh nghiệp muốn tối ưu hóa giá bán sản phẩm dựa trên nhu cầu thị trường thay đổi liên tục sẽ sử dụng kỹ thuật nào?
💡 Lời giải chi tiết:
Định giá động sử dụng các thuật toán khoa học dữ liệu để điều chỉnh giá sản phẩm linh hoạt dựa trên nguồn cung, nhu cầu và hành vi khách hàng. Kết luận Lý giải Định giá động (Dynamic Pricing)
Câu 22:Tại sao 'Tính giải thích được' (Explainability) lại quan trọng đối với các mô hình AI trong xét duyệt tín dụng?
💡 Lời giải chi tiết:
Tính giải thích được giúp doanh nghiệp tuân thủ pháp lý và giải trình được các quyết định quan trọng gây ảnh hưởng trực tiếp đến khách hàng. Kết luận Lý giải Để hiểu lý do tại sao một khách hàng bị từ chối vay và đảm bảo tính công bằng
Câu 23:Phát hiện gian lận (Fraud Detection) trong giao dịch trực tuyến thường dựa trên kỹ thuật nào?
💡 Lời giải chi tiết:
Phát hiện bất thường xác định các giao dịch có hành vi khác biệt đáng kể so với mô hình thông thường của người dùng để cảnh báo gian lận. Kết luận Lý giải Phát hiện bất thường (Anomaly Detection)
Câu 24:Trong khoa học dữ liệu, 'Data Lake' khác với 'Data Warehouse' ở điểm nào?
💡 Lời giải chi tiết:
Data Lake cho phép lưu trữ dữ liệu ở định dạng tự nhiên (thô) mà không cần cấu trúc hóa trước, tạo sự linh hoạt cho các phân tích sau này. Kết luận Lý giải Data Lake lưu trữ cả dữ liệu thô, chưa cấu trúc với khối lượng lớn
Câu 25:Chỉ số ROI (Return on Investment) trong các dự án khoa học dữ liệu được dùng để làm gì?
💡 Lời giải chi tiết:
ROI là thước đo tài chính quan trọng để đánh giá liệu giá trị kinh doanh mang lại có xứng đáng với nguồn lực đã bỏ ra cho dự án dữ liệu hay không. Kết luận Lý giải Đo lường hiệu quả kinh tế so với chi phí đầu tư vào dự án