Bộ 7 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh
Thời gian còn lại: --:--
Kết quả của bạn:
Bạn đã đúng:
Bạn đã sai:
Tổng số câu:
Câu 1:Mục tiêu cốt lõi của Khoa học dữ liệu (Data Science) trong bối cảnh quản trị doanh nghiệp hiện đại là gì?
💡 Lời giải chi tiết:
Theo các chuyên gia quản trị, khoa học dữ liệu giúp chuyển đổi dữ liệu thô thành tri thức hữu ích để đưa ra các chiến lược kinh doanh chính xác. Kết luận Lý giải: Trích xuất các thông tin có giá trị từ dữ liệu để hỗ trợ và tối ưu hóa việc ra quyết định.
Câu 2:Trong mô hình 5Vs của Big Data, đặc điểm 'Veracity' đề cập đến yếu tố nào?
💡 Lời giải chi tiết:
Veracity là khía cạnh quan trọng đảm bảo dữ liệu không bị nhiễu hoặc sai lệch trước khi đưa vào phân tích kinh doanh. Kết luận Lý giải: Độ tin cậy và tính chính xác của dữ liệu thu thập được.
Câu 3:Loại hình phân tích nào trả lời cho câu hỏi 'Điều gì có khả năng xảy ra trong tương lai?' dựa trên dữ liệu lịch sử?
💡 Lời giải chi tiết:
Phân tích dự đoán sử dụng các mô hình thống kê và thuật toán máy học để xác định xác suất của các kết quả trong tương lai. Kết luận Lý giải: Phân tích dự đoán (Predictive Analytics).
Câu 4:Trong kinh tế học, tại sao việc phân biệt giữa 'Tương quan' (Correlation) và 'Nhân quả' (Causation) lại cực kỳ quan trọng khi phân tích dữ liệu?
💡 Lời giải chi tiết:
Tương quan chỉ cho thấy hai biến biến thiên cùng nhau, trong khi nhân quả xác định mối quan hệ tác động trực tiếp cần thiết cho việc lập chính sách. Kết luận Lý giải: Vì việc nhầm lẫn tương quan là nhân quả có thể dẫn đến các quyết định đầu tư sai lầm.
Câu 5:Kỹ thuật 'A/B Testing' thường được sử dụng phổ biến nhất trong lĩnh vực nào của kinh doanh?
💡 Lời giải chi tiết:
A/B Testing cho phép doanh nghiệp so sánh hai phiên bản của một sản phẩm hoặc chiến dịch để xác định phiên bản nào hiệu quả hơn. Kết luận Lý giải: Marketing kỹ thuật số và tối ưu hóa trải nghiệm người dùng.
Câu 6:Dữ liệu 'phi cấu trúc' (Unstructured Data) trong kinh tế thường bao gồm những gì?
💡 Lời giải chi tiết:
Dữ liệu phi cấu trúc không có định dạng dòng-cột cố định và chiếm phần lớn dữ liệu được tạo ra hiện nay. Kết luận Lý giải: Các bài đánh giá của khách hàng, hình ảnh, và video trên mạng xã hội.
Câu 7:Thuật toán 'K-Means Clustering' thường được ứng dụng vào bài toán kinh doanh nào sau đây?
💡 Lời giải chi tiết:
Gom cụm (Clustering) giúp doanh nghiệp nhóm các khách hàng có đặc điểm tương đồng để triển khai các chiến dịch marketing cá nhân hóa. Kết luận Lý giải: Phân khúc khách hàng dựa trên hành vi mua sắm.
Câu 8:Trong quá trình tiền xử lý dữ liệu, 'Dữ liệu khuyết' (Missing Data) nên được xử lý như thế nào để đảm bảo tính khách quan?
💡 Lời giải chi tiết:
Việc lựa chọn phương pháp xử lý dữ liệu khuyết phụ thuộc vào tỷ lệ dữ liệu mất mát và bản chất của biến số đó. Kết luận Lý giải: Tùy bối cảnh để chọn xóa, thay thế bằng giá trị trung bình hoặc dùng mô hình dự báo để điền.
Câu 9:Hiện tượng 'Overfitting' (Quá khớp) trong một mô hình dự báo kinh tế có nghĩa là gì?
💡 Lời giải chi tiết:
Overfitting khiến mô hình mất đi khả năng tổng quát hóa, làm giảm độ tin cậy khi áp dụng vào thực tế kinh doanh. Kết luận Lý giải: Mô hình học quá kỹ các nhiễu của dữ liệu huấn luyện dẫn đến dự báo kém trên dữ liệu mới.
Câu 10:Chỉ số KPI 'Customer Churn Rate' thường được dự báo bằng kỹ thuật nào trong khoa học dữ liệu?
💡 Lời giải chi tiết:
Dự báo khách hàng rời bỏ là bài toán phân loại nhị phân (rời bỏ hoặc không rời bỏ) dựa trên các đặc điểm hành vi. Kết luận Lý giải: Mô hình phân loại (Classification) như Logistic Regression hoặc Random Forest.
Câu 11:Trong lĩnh vực tài chính, 'Sentiment Analysis' (Phân tích cảm xúc) thường được dùng để làm gì?
💡 Lời giải chi tiết:
Cảm xúc của đám đông là một yếu tố quan trọng ảnh hưởng đến tâm lý thị trường và giá trị tài sản tài chính. Kết luận Lý giải: Phân tích thái độ của nhà đầu tư từ tin tức và mạng xã hội để dự báo biến động thị trường.
Câu 12:Khái niệm 'Data Warehouse' khác với 'Data Lake' ở điểm cơ bản nào?
💡 Lời giải chi tiết:
Data Warehouse phù hợp cho việc phân tích báo cáo cố định, trong khi Data Lake linh hoạt hơn cho các mục đích khám phá dữ liệu. Kết luận Lý giải: Data Warehouse lưu trữ dữ liệu đã được xử lý và có cấu trúc, còn Data Lake lưu trữ dữ liệu thô.
Câu 13:Quy định GDPR của Liên minh Châu Âu có tác động gì đến việc triển khai khoa học dữ liệu trong doanh nghiệp?
💡 Lời giải chi tiết:
GDPR buộc các nhà khoa học dữ liệu phải tuân thủ tính minh bạch và bảo mật khi thu thập thông tin người dùng. Kết luận Lý giải: Đặt ra các tiêu chuẩn nghiêm ngặt về bảo vệ quyền riêng tư và xử lý dữ liệu cá nhân.
Câu 14:Tại sao việc 'Trực quan hóa dữ liệu' (Data Visualization) lại quan trọng đối với các nhà quản lý?
💡 Lời giải chi tiết:
Não bộ con người xử lý thông tin hình ảnh nhanh hơn nhiều so với các con số khô khan trong các bảng tính lớn. Kết luận Lý giải: Vì nó giúp biến các tập dữ liệu phức tạp thành các hình ảnh dễ hiểu để ra quyết định nhanh chóng.
Câu 15:Trong bài toán phát hiện gian lận thẻ tín dụng, tại sao độ chính xác tổng thể (Accuracy) không phải là thước đo tốt nhất?
💡 Lời giải chi tiết:
Với tập dữ liệu mất cân bằng, một mô hình dự báo 'tất cả là bình thường' vẫn có Accuracy cao nhưng hoàn toàn vô dụng. Kết luận Lý giải: Vì các giao dịch gian lận chiếm tỷ lệ rất nhỏ so với giao dịch thông thường.
Câu 16:Vai trò chính của 'Feature Engineering' trong xây dựng mô hình máy học là gì?
💡 Lời giải chi tiết:
Kỹ thuật đặc trưng giúp mô hình học được các quy luật sâu sắc hơn từ dữ liệu thô thông qua việc biến đổi thông tin. Kết luận Lý giải: Tạo ra các biến số mới từ dữ liệu gốc để cải thiện hiệu suất của mô hình.
Câu 17:Thuật ngữ 'Học có giám sát' (Supervised Learning) có đặc điểm nào sau đây?
💡 Lời giải chi tiết:
Trong học có giám sát, thuật toán học cách ánh xạ từ đầu vào đến đầu ra dựa trên các ví dụ đã biết trước. Kết luận Lý giải: Mô hình được huấn luyện trên dữ liệu đã được gán nhãn (có kết quả mục tiêu).
Câu 18:Ứng dụng nào sau đây của Khoa học dữ liệu giúp tối ưu hóa chuỗi cung ứng?
💡 Lời giải chi tiết:
Dự báo nhu cầu chính xác giúp doanh nghiệp giảm chi phí lưu kho và tránh tình trạng cháy hàng. Kết luận Lý giải: Dự báo nhu cầu hàng hóa để tối ưu hóa mức tồn kho.
Câu 19:Lợi ích lớn nhất của việc sử dụng 'Cloud Computing' (Điện toán đám mây) trong khoa học dữ liệu kinh doanh là gì?
💡 Lời giải chi tiết:
Điện toán đám mây cung cấp sức mạnh tính toán lớn theo yêu cầu, phù hợp với các dự án Big Data biến động. Kết luận Lý giải: Khả năng mở rộng tài nguyên tính toán linh hoạt và giảm chi phí đầu tư hạ tầng ban đầu.
Câu 20:Trong phân tích hồi quy, hệ số R-squared (Hệ số xác định) cho biết điều gì?
💡 Lời giải chi tiết:
R-squared là một thước đo độ phù hợp của mô hình, cho thấy mức độ dữ liệu thực tế sát với đường hồi quy. Kết luận Lý giải: Tỷ lệ phần trăm sự biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
Câu 21:Hệ thống khuyến nghị (Recommender Systems) trên các trang thương mại điện tử hoạt động dựa trên nguyên lý nào?
💡 Lời giải chi tiết:
Lọc cộng tác giúp hệ thống gợi ý những sản phẩm phù hợp với sở thích cá nhân dựa trên dữ liệu cộng đồng. Kết luận Lý giải: Dựa trên lịch sử mua hàng và hành vi của người dùng tương đồng (Collaborative Filtering).
Câu 22:Tại sao các ngân hàng thường sử dụng 'Decision Trees' (Cây quyết định) để xét duyệt khoản vay?
💡 Lời giải chi tiết:
Trong tài chính, khả năng giải thích mô hình (Explainability) là yêu cầu pháp lý quan trọng để đảm bảo tính minh bạch. Kết luận Lý giải: Vì tính diễn giải cao, giúp giải thích rõ ràng lý do tại sao một khách hàng bị từ chối vay.
Câu 23:Khái niệm 'Data Mining' (Khai phá dữ liệu) khác gì với thống kê truyền thống?
💡 Lời giải chi tiết:
Data Mining sử dụng các kỹ thuật tính toán mạnh mẽ để tìm kiếm các mối quan hệ chưa biết trong các tập dữ liệu khổng lồ. Kết luận Lý giải: Thống kê tập trung vào kiểm định giả thuyết, còn Data Mining tập trung vào phát hiện các mẫu tiềm ẩn trong dữ liệu lớn.
Câu 24:Thách thức lớn nhất khi triển khai dự án Khoa học dữ liệu trong một doanh nghiệp truyền thống thường là gì?
💡 Lời giải chi tiết:
Sự thay đổi về tư duy và khả năng tiếp nhận công nghệ mới thường là rào cản lớn hơn so với các vấn đề kỹ thuật thuần túy. Kết luận Lý giải: Văn hóa doanh nghiệp và sự thiếu hụt kỹ năng về tư duy dữ liệu của nhân sự.
Câu 25:Trong chu kỳ sống của một dự án Khoa học dữ liệu (CRISP-DM), bước đầu tiên quan trọng nhất là gì?
💡 Lời giải chi tiết:
Nếu không hiểu rõ mục tiêu kinh doanh, các phân tích dữ liệu sau đó sẽ không mang lại giá trị thực tiễn. Kết luận Lý giải: Thấu hiểu bài toán kinh doanh (Business Understanding).