Quay lại danh mục Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Trang chủ
Trắc nghiệm
Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh
Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Lưu ý: Nội dung trong bài Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong phân tích dữ liệu kinh doanh, sự khác biệt cốt lõi giữa 'Phân tích dự báo' (Predictive Analytics) và 'Phân tích mô tả' (Descriptive Analytics) là gì?

A. Phân tích mô tả tóm tắt các sự kiện đã xảy ra trong quá khứ, trong khi phân tích dự báo sử dụng mô hình để ước tính các kết quả có thể xảy ra trong tương lai.
B. Phân tích mô tả chỉ dùng cho dữ liệu định tính, còn phân tích dự báo chỉ dùng cho dữ liệu định lượng.
C. Phân tích dự báo giúp hiểu rõ nguyên nhân gốc rễ của vấn đề, còn phân tích mô tả đưa ra các khuyến nghị hành động.
D. Cả hai loại hình này đều tập trung vào việc tối ưu hóa các quyết định hiện tại mà không quan tâm đến dữ liệu lịch sử.

💡 Lời giải chi tiết:

Theo khung lý thuyết về phân tích dữ liệu của Gartner, phân tích mô tả trả lời câu hỏi 'điều gì đã xảy ra' dựa trên dữ liệu lịch sử, còn phân tích dự báo tập trung vào việc dự đoán các xu hướng tương lai. Kết luận Lý giải: Phân tích mô tả tóm tắt các sự kiện đã xảy ra trong quá khứ, trong khi phân tích dự báo sử dụng mô hình để ước tính các kết quả có thể xảy ra trong tương lai.

Câu 2: Hiện tượng 'Overfitting' (Quá khớp) trong mô hình học máy khi dự báo nhu cầu thị trường thường dẫn đến hệ quả nào sau đây?

A. Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng dự báo kém chính xác trên dữ liệu thực tế mới.
B. Mô hình có độ lỗi cao trên cả dữ liệu huấn luyện và dữ liệu kiểm thử.
C. Mô hình trở nên quá đơn giản và không bắt kịp các xu hướng phức tạp của thị trường.
D. Thời gian huấn luyện mô hình được rút ngắn đáng kể nhưng độ chính xác không đổi.

💡 Lời giải chi tiết:

Quá khớp xảy ra khi mô hình học cả những nhiễu trong dữ liệu huấn luyện, khiến nó mất khả năng tổng quát hóa trên dữ liệu chưa từng thấy. Kết luận Lý giải: Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng dự báo kém chính xác trên dữ liệu thực tế mới.

Câu 3: Mục đích chính của việc thực hiện 'A/B Testing' trong chiến dịch marketing kỹ thuật số là gì?

A. So sánh hiệu quả giữa hai phiên bản của một yếu tố để xác định phiên bản nào mang lại tỷ lệ chuyển đổi cao hơn.
B. Tự động tạo ra các nội dung quảng cáo mới mà không cần sự can thiệp của con người.
C. Dự báo tổng doanh thu của doanh nghiệp trong vòng 5 năm tới dựa trên dữ liệu kinh tế vĩ mô.
D. Thu thập dữ liệu cá nhân của khách hàng một cách bí mật để phục vụ việc bán hàng trực tiếp.

💡 Lời giải chi tiết:

Theo các phương pháp thực nghiệm trong kinh doanh, A/B Testing là một thử nghiệm ngẫu nhiên có kiểm soát nhằm so sánh hai biến thể để tìm ra phương án tối ưu. Kết luận Lý giải: So sánh hiệu quả giữa hai phiên bản của một yếu tố để xác định phiên bản nào mang lại tỷ lệ chuyển đổi cao hơn.

Câu 4: Trong khoa học dữ liệu, kỹ thuật 'Feature Selection' (Chọn lọc đặc trưng) có vai trò quan trọng nhất là gì?

A. Giảm bớt các biến không liên quan hoặc dư thừa để cải thiện hiệu suất và tính giải thích của mô hình.
B. Tăng số lượng cột trong tập dữ liệu để làm cho mô hình trở nên phức tạp và chuyên sâu hơn.
C. Chuyển đổi toàn bộ dữ liệu định tính thành dữ liệu định lượng mà không làm mất thông tin.
D. Thay thế các giá trị bị thiếu trong tập dữ liệu bằng giá trị trung bình của toàn bộ cột.

💡 Lời giải chi tiết:

Việc chọn lọc đặc trưng giúp loại bỏ nhiễu, giảm chi phí tính toán và tránh hiện tượng đa cộng tuyến trong các mô hình kinh tế lượng. Kết luận Lý giải: Giảm bớt các biến không liên quan hoặc dư thừa để cải thiện hiệu suất và tính giải thích của mô hình.

Câu 5: Để dự báo khả năng một khách hàng sẽ rời bỏ dịch vụ (Churn Prediction), loại mô hình nào sau đây thường được ưu tiên sử dụng?

A. Mô hình Phân loại (Classification).
B. Mô hình Gom cụm (Clustering).
C. Mô hình Kết hợp (Association Rules).
D. Mô hình Hồi quy tuyến tính (Linear Regression).

💡 Lời giải chi tiết:

Dự báo rời bỏ là bài toán xác định nhãn (rời bỏ hoặc ở lại), do đó nó thuộc về nhóm học có giám sát với mục tiêu phân loại. Kết luận Lý giải: Mô hình Phân loại (Classification).

Câu 6: Trong bài toán phát hiện gian lận tín dụng, thách thức lớn nhất đối với tập dữ liệu thường là gì?

A. Sự mất cân bằng nghiêm trọng giữa số lượng giao dịch gian lận và giao dịch hợp pháp.
B. Dữ liệu quá sạch khiến các mô hình học máy không tìm thấy sự khác biệt.
C. Tất cả các giao dịch đều có đặc điểm giống hệt nhau về mặt thống kê.
D. Dữ liệu chỉ bao gồm các biến định tính và không có bất kỳ con số nào.

💡 Lời giải chi tiết:

Trong thực tế kinh doanh, các giao dịch gian lận chỉ chiếm một tỷ lệ rất nhỏ so với giao dịch bình thường, gây khó khăn cho việc huấn luyện mô hình nhận diện gian lận. Kết luận Lý giải: Sự mất cân bằng nghiêm trọng giữa số lượng giao dịch gian lận và giao dịch hợp pháp.

Câu 7: Chỉ số 'Mean Absolute Error' (MAE) trong đánh giá mô hình hồi quy dự báo doanh thu cho biết điều gì?

A. Độ lệch trung bình về giá trị tuyệt đối giữa doanh thu dự báo và doanh thu thực tế.
B. Tỷ lệ phần trăm sai số so với tổng doanh thu thực tế của doanh nghiệp.
C. Mức độ biến động của dữ liệu doanh thu so với giá trị trung bình trong quá khứ.
D. Khả năng giải thích của các biến độc lập đối với sự biến thiên của doanh thu.

💡 Lời giải chi tiết:

MAE là một thước đo phổ biến đo lường độ lớn trung bình của các lỗi trong một tập hợp các dự báo mà không xem xét hướng của chúng. Kết luận Lý giải: Độ lệch trung bình về giá trị tuyệt đối giữa doanh thu dự báo và doanh thu thực tế.

Câu 8: Phương pháp 'K-means clustering' thường được ứng dụng phổ biến nhất trong hoạt động kinh doanh nào?

A. Phân khúc khách hàng dựa trên hành vi mua sắm và nhân khẩu học.
B. Dự báo chính xác giá cổ phiếu trong phiên giao dịch ngày mai.
C. Xác định mối quan hệ nhân quả giữa chi phí quảng cáo và lợi nhuận.
D. Tự động hóa quy trình trả lời email khách hàng bằng trí tuệ nhân tạo.

💡 Lời giải chi tiết:

K-means là thuật toán học không giám sát dùng để nhóm các đối tượng có đặc điểm tương đồng vào cùng một cụm, rất hữu ích cho việc chia phân khúc thị trường. Kết luận Lý giải: Phân khúc khách hàng dựa trên hành vi mua sắm và nhân khẩu học.

Câu 9: Trong khai phá dữ liệu (Data Mining), chỉ số 'Lift' trong luật kết hợp (Association Rules) lớn hơn 1 có ý nghĩa gì đối với việc bán chéo sản phẩm?

A. Việc mua sản phẩm A làm tăng khả năng khách hàng sẽ mua thêm sản phẩm B.
B. Việc mua sản phẩm A hoàn toàn không ảnh hưởng đến quyết định mua sản phẩm B.
C. Sản phẩm A và sản phẩm B là hai mặt hàng thay thế nhau hoàn toàn.
D. Khách hàng mua sản phẩm A thường có xu hướng trả lại sản phẩm B.

💡 Lời giải chi tiết:

Chỉ số Lift lớn hơn 1 cho thấy sự xuất hiện của mặt hàng này có tác động tích cực đến sự xuất hiện của mặt hàng kia vượt mức ngẫu nhiên. Kết luận Lý giải: Việc mua sản phẩm A làm tăng khả năng khách hàng sẽ mua thêm sản phẩm B.

Câu 10: Hiện tượng 'Data Leakage' (Rò rỉ dữ liệu) trong xây dựng mô hình dự báo kinh tế xảy ra khi nào?

A. Thông tin từ tương lai hoặc thông tin không có sẵn tại thời điểm dự báo được đưa vào tập huấn luyện.
B. Dữ liệu cá nhân của khách hàng bị tin tặc đánh cắp từ cơ sở dữ liệu của doanh nghiệp.
C. Mô hình dự báo có độ chính xác quá thấp khiến doanh nghiệp bị thua lỗ trên thị trường.
D. Dữ liệu huấn luyện và dữ liệu kiểm thử hoàn toàn tách biệt và không có điểm chung.

💡 Lời giải chi tiết:

Rò rỉ dữ liệu làm cho mô hình có vẻ rất chính xác khi thử nghiệm nhưng thất bại hoàn toàn khi triển khai thực tế vì nó sử dụng thông tin lẽ ra không được biết trước. Kết luận Lý giải: Thông tin từ tương lai hoặc thông tin không có sẵn tại thời điểm dự báo được đưa vào tập huấn luyện.

Câu 11: Giả định về 'Phương sai sai số không đổi' (Homoscedasticity) trong hồi quy tuyến tính cổ điển có ý nghĩa gì?

A. Độ biến động của sai số là hằng số đối với tất cả các giá trị của biến độc lập.
B. Các biến độc lập trong mô hình phải có mối tương quan hoàn hảo với nhau.
C. Giá trị của biến phụ thuộc luôn phải lớn hơn 0 trong mọi trường hợp.
D. Sai số của mô hình phải tuân theo phân phối chuẩn với trung bình bằng 1.

💡 Lời giải chi tiết:

Theo lý thuyết Gauss-Markov, homoscedasticity đảm bảo rằng các ước lượng bình phương tối thiểu là ước lượng không chệch tốt nhất. Kết luận Lý giải: Độ biến động của sai số là hằng số đối với tất cả các giá trị của biến độc lập.

Câu 12: Kỹ thuật 'Pruning' (Tỉa cành) trong thuật toán Cây quyết định (Decision Tree) nhằm mục đích chủ yếu là gì?

A. Giảm độ phức tạp của cây để hạn chế hiện tượng quá khớp (overfitting).
B. Tăng số lượng các nhánh để cây có thể bao phủ được tất cả các trường hợp ngoại lệ.
C. Loại bỏ hoàn toàn các biến định lượng ra khỏi mô hình cây quyết định.
D. Chuyển đổi cây quyết định thành một mô hình hồi quy tuyến tính đơn giản.

💡 Lời giải chi tiết:

Tỉa cành giúp loại bỏ các phần của cây cung cấp ít sức mạnh phân loại, từ đó làm mô hình gọn nhẹ và tổng quát hơn. Kết luận Lý giải: Giảm độ phức tạp của cây để hạn chế hiện tượng quá khớp (overfitting).

Câu 13: Sự khác biệt cơ bản giữa 'Học có giám sát' (Supervised Learning) và 'Học không giám sát' (Unsupervised Learning) là gì?

A. Học có giám sát sử dụng dữ liệu đã được gán nhãn, trong khi học không giám sát tìm cấu trúc ẩn trong dữ liệu chưa gán nhãn.
B. Học không giám sát luôn mang lại độ chính xác cao hơn học có giám sát trong mọi bài toán kinh tế.
C. Học có giám sát chỉ áp dụng cho dữ liệu văn bản, còn học không giám sát chỉ áp dụng cho dữ liệu hình ảnh.
D. Học không giám sát yêu cầu sự can thiệp liên tục của con người vào quá trình máy tính thực hiện tính toán.

💡 Lời giải chi tiết:

Học có giám sát dựa trên các cặp đầu vào-đầu ra đã biết để học hàm mục tiêu, còn học không giám sát tự khám phá các mẫu từ dữ liệu đầu vào. Kết luận Lý giải: Học có giám sát sử dụng dữ liệu đã được gán nhãn, trong khi học không giám sát tìm cấu trúc ẩn trong dữ liệu chưa gán nhãn.

Câu 14: Trong phân tích kinh doanh, tại sao mối tương quan (Correlation) không đồng nghĩa với quan hệ nhân quả (Causation)?

A. Vì hai biến có thể biến động cùng nhau do tác động của một biến thứ ba hoặc do ngẫu nhiên mà không có sự tác động trực tiếp.
B. Vì mối tương quan chỉ tồn tại khi các số liệu kinh tế là hoàn toàn chính xác và không có sai số.
C. Vì quan hệ nhân quả chỉ có thể được chứng minh bằng các thuật toán học máy phức tạp nhất.
D. Vì tương quan chỉ áp dụng cho dữ liệu trong quá khứ, còn nhân quả chỉ áp dụng cho dữ liệu tương lai.

💡 Lời giải chi tiết:

Theo nguyên lý thống kê, sự đồng biến giữa hai đại lượng có thể do các yếu tố gây nhiễu (confounding variables) chứ không nhất thiết biến này gây ra biến kia. Kết luận Lý giải: Vì hai biến có thể biến động cùng nhau do tác động của một biến thứ ba hoặc do ngẫu nhiên mà không có sự tác động trực tiếp.

Câu 15: Kỹ thuật 'K-fold Cross-validation' được sử dụng trong quy trình xây dựng mô hình nhằm mục đích gì?

A. Đánh giá hiệu suất ổn định của mô hình trên các tập dữ liệu con khác nhau để đảm bảo tính tổng quát.
B. Tăng kích thước của tập dữ liệu huấn luyện lên gấp K lần so với ban đầu.
C. Tự động sửa các lỗi sai về chính tả trong tập dữ liệu văn bản của doanh nghiệp.
D. Loại bỏ hoàn toàn nhu cầu về việc thu thập thêm dữ liệu mới trong tương lai.

💡 Lời giải chi tiết:

Cross-validation giúp ước lượng khách quan hơn về hiệu suất của mô hình bằng cách chia dữ liệu thành nhiều phần và luân phiên huấn luyện/kiểm tra. Kết luận Lý giải: Đánh giá hiệu suất ổn định của mô hình trên các tập dữ liệu con khác nhau để đảm bảo tính tổng quát.

Câu 16: Hệ thống 'Business Intelligence' (BI) khác với 'Data Science' ở điểm trọng tâm nào sau đây?

A. BI tập trung vào việc báo cáo và theo dõi các chỉ số hiện tại, trong khi Data Science tập trung vào dự báo và tối ưu hóa.
B. BI chỉ sử dụng dữ liệu từ nguồn bên ngoài, còn Data Science chỉ sử dụng dữ liệu nội bộ của công ty.
C. Data Science không yêu cầu kỹ năng lập trình, trong khi BI yêu cầu kiến thức chuyên sâu về mã nguồn mở.
D. BI là một phần mềm cụ thể, còn Data Science là một quy trình quản lý nhân sự trong doanh nghiệp.

💡 Lời giải chi tiết:

BI thường giải quyết các câu hỏi về trạng thái hiện tại của doanh nghiệp thông qua dashboard, còn Data Science đi sâu vào việc khai phá các quy luật phức tạp và dự đoán. Kết luận Lý giải: BI tập trung vào việc báo cáo và theo dõi các chỉ số hiện tại, trong khi Data Science tập trung vào dự báo và tối ưu hóa.

Câu 17: Việc thực hiện 'Standardization' (Chuẩn hóa) dữ liệu trước khi đưa vào mô hình Clustering có lợi ích gì?

A. Đảm bảo rằng các biến có thang đo khác nhau đóng góp công bằng vào việc tính toán khoảng cách.
B. Chuyển đổi toàn bộ các giá trị âm trong dữ liệu thành giá trị dương để dễ tính toán.
C. Làm cho tập dữ liệu nhỏ lại để giảm dung lượng lưu trữ trên hệ thống đám mây.
D. Loại bỏ tất cả các dòng dữ liệu có chứa thông tin khách hàng không đầy đủ.

💡 Lời giải chi tiết:

Nhiều thuật toán dựa trên khoảng cách (như K-means) sẽ bị chi phối bởi các biến có giá trị lớn nếu dữ liệu không được đưa về cùng một thang đo. Kết luận Lý giải: Đảm bảo rằng các biến có thang đo khác nhau đóng góp công bằng vào việc tính toán khoảng cách.

Câu 18: Tại sao mô hình 'Random Forest' thường có hiệu suất tốt hơn một cây quyết định đơn lẻ (Single Decision Tree)?

A. Bằng cách kết hợp nhiều cây và lấy trung bình kết quả, nó giúp giảm phương sai và tránh quá khớp.
B. Vì nó sử dụng một thuật toán toán học hoàn toàn khác và không dựa trên cấu trúc cây.
C. Nó yêu cầu ít dữ liệu hơn đáng kể so với một cây quyết định đơn lẻ để đạt độ chính xác tương đương.
D. Nó luôn đảm bảo tìm ra nghiệm tối ưu toàn cục mà không cần bất kỳ bước thử nghiệm nào.

💡 Lời giải chi tiết:

Random Forest là một phương pháp ensemble (học kết hợp) sử dụng kỹ thuật bagging để cải thiện tính ổn định và độ chính xác của dự báo. Kết luận Lý giải: Bằng cách kết hợp nhiều cây và lấy trung bình kết quả, nó giúp giảm phương sai và tránh quá khớp.

Câu 19: Trong phân tích chuỗi thời gian (Time Series), yếu tố 'Tính mùa vụ' (Seasonality) được hiểu là gì?

A. Sự lặp lại của các biến động theo các khoảng thời gian cố định như tuần, tháng hoặc quý.
B. Sự tăng trưởng hoặc suy giảm dài hạn của dữ liệu theo một hướng nhất định.
C. Những biến động ngẫu nhiên không thể dự báo được do các cú sốc thị trường đột ngột.
D. Tổng số lượng quan sát thu thập được trong một năm tài chính của doanh nghiệp.

💡 Lời giải chi tiết:

Tính mùa vụ phản ánh các mẫu dữ liệu lặp lại có chu kỳ trong một năm hoặc các khoảng thời gian ngắn hơn do tác động của thời tiết, lễ hội hoặc lịch làm việc. Kết luận Lý giải: Sự lặp lại của các biến động theo các khoảng thời gian cố định như tuần, tháng hoặc quý.

Câu 20: Quy trình 'Tokenization' trong phân tích dữ liệu văn bản (NLP) phục vụ mục đích gì trong kinh doanh?

A. Chia nhỏ các đoạn văn bản dài thành các đơn vị từ hoặc cụm từ có nghĩa để máy tính có thể xử lý.
B. Mã hóa thông tin thẻ tín dụng của khách hàng để đảm bảo an toàn bảo mật khi thanh toán.
C. Dịch tự động các phản hồi của khách hàng từ tiếng nước ngoài sang tiếng bản địa.
D. Xác định vị trí địa lý của khách hàng dựa trên địa chỉ IP khi họ truy cập trang web.

💡 Lời giải chi tiết:

Tokenization là bước tiền xử lý cơ bản để chuyển văn bản thô thành dạng mà các mô hình học máy có thể phân tích thông tin định lượng. Kết luận Lý giải: Chia nhỏ các đoạn văn bản dài thành các đơn vị từ hoặc cụm từ có nghĩa để máy tính có thể xử lý.

Câu 21: Vai trò của 'Hàm kích hoạt' (Activation Function) trong mạng thần kinh nhân tạo (Neural Networks) là gì?

A. Giới thiệu tính phi tuyến vào mô hình, cho phép mạng học các mẫu phức tạp trong dữ liệu.
B. Tự động tắt máy tính khi mô hình đã hoàn thành quá trình huấn luyện lâu dài.
C. Kết nối trực tiếp mạng thần kinh với cơ sở dữ liệu SQL của doanh nghiệp.
D. Đảm bảo rằng tất cả các trọng số trong mạng luôn bằng nhau và không thay đổi.

💡 Lời giải chi tiết:

Nếu không có hàm kích hoạt phi tuyến, mạng thần kinh dù có bao nhiêu lớp cũng chỉ hoạt động tương đương một mô hình hồi quy tuyến tính đơn giản. Kết luận Lý giải: Giới thiệu tính phi tuyến vào mô hình, cho phép mạng học các mẫu phức tạp trong dữ liệu.

Câu 22: Khi đánh giá mô hình phân loại khách hàng tiềm năng, chỉ số 'Recall' (Độ nhạy) cao có ý nghĩa gì đối với đội ngũ bán hàng?

A. Mô hình có khả năng tìm ra hầu hết các khách hàng thực sự có tiềm năng mà không bỏ sót họ.
B. Mô hình đảm bảo rằng mọi khách hàng được dự báo là tiềm năng thì chắc chắn sẽ mua hàng.
C. Mô hình giúp giảm thiểu tối đa chi phí quảng cáo cho mỗi lượt click vào trang web.
D. Mô hình có tốc độ dự báo nhanh nhất so với các chỉ số đo lường hiệu suất khác.

💡 Lời giải chi tiết:

Recall đo lường tỷ lệ các trường hợp dương tính thực sự được mô hình xác định đúng, giúp doanh nghiệp tránh bỏ lỡ các cơ hội kinh doanh. Kết luận Lý giải: Mô hình có khả năng tìm ra hầu hết các khách hàng thực sự có tiềm năng mà không bỏ sót họ.

Câu 23: Trong kiến trúc dữ liệu hiện đại, quá trình 'ETL' (Extract, Transform, Load) thực hiện nhiệm vụ gì?

A. Trích xuất dữ liệu từ các nguồn, biến đổi chúng cho phù hợp và tải vào kho dữ liệu.
B. Mã hóa dữ liệu để bảo vệ bí mật kinh doanh trước các đối thủ cạnh tranh trên thị trường.
C. Xóa bỏ toàn bộ dữ liệu cũ để nhường chỗ cho các dữ liệu mới được thu thập hàng ngày.
D. Tự động gửi báo cáo doanh thu qua tin nhắn điện thoại cho ban lãnh đạo công ty.

💡 Lời giải chi tiết:

ETL là quy trình nền tảng để làm sạch và tích hợp dữ liệu từ nhiều nguồn khác nhau vào một hệ thống thống nhất để phân tích. Kết luận Lý giải: Trích xuất dữ liệu từ các nguồn, biến đổi chúng cho phù hợp và tải vào kho dữ liệu.

Câu 24: Ý nghĩa của giá trị 'P-value' nhỏ hơn 0.05 trong một kiểm định giả thuyết kinh tế là gì?

A. Có bằng chứng thống kê để bác bỏ giả thuyết không (H0) và chấp nhận sự khác biệt có ý nghĩa.
B. Mô hình dự báo hoàn toàn sai và không thể sử dụng để ra quyết định kinh doanh.
C. Xác suất để kết quả xảy ra do ngẫu nhiên là rất cao (trên 95%).
D. Dữ liệu thu thập được không đủ lớn để đưa ra bất kỳ kết luận nào về mặt thống kê.

💡 Lời giải chi tiết:

Theo quy ước phổ biến, p-value thấp cho thấy kết quả quan sát được rất ít khả năng xảy ra nếu giả thuyết không là đúng. Kết luận Lý giải: Có bằng chứng thống kê để bác bỏ giả thuyết không (H0) và chấp nhận sự khác biệt có ý nghĩa.

Câu 25: Mô hình hồi quy Logistic (Logistic Regression) trả về kết quả đầu ra dưới dạng nào?

A. Xác suất nằm trong khoảng từ 0 đến 1 cho một phân loại mục tiêu.
B. Một giá trị số thực bất kỳ từ âm vô cùng đến dương vô cùng.
C. Một danh sách các từ khóa liên quan đến hành vi của khách hàng.
D. Một biểu đồ hình cột hiển thị sự thay đổi của giá cả theo thời gian.

💡 Lời giải chi tiết:

Hồi quy Logistic sử dụng hàm sigmoid để ánh xạ kết quả đầu ra thành xác suất của một biến cố nhị phân. Kết luận Lý giải: Xác suất nằm trong khoảng từ 0 đến 1 cho một phân loại mục tiêu.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 3 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 229 lượt làm

Làm ngay

Bộ 4 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 246 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 263 lượt làm

Làm ngay

Bộ 6 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 280 lượt làm

Làm ngay

Bộ 7 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 297 lượt làm

Làm ngay

Bộ 8 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 115 lượt làm

Làm ngay

Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Kết quả của bạn:

Câu 1: Trong phân tích dữ liệu kinh doanh, sự khác biệt cốt lõi giữa 'Phân tích dự báo' (Predictive Analytics) và 'Phân tích mô tả' (Descriptive Analytics) là gì?

Câu 2: Hiện tượng 'Overfitting' (Quá khớp) trong mô hình học máy khi dự báo nhu cầu thị trường thường dẫn đến hệ quả nào sau đây?

Câu 3: Mục đích chính của việc thực hiện 'A/B Testing' trong chiến dịch marketing kỹ thuật số là gì?

Câu 4: Trong khoa học dữ liệu, kỹ thuật 'Feature Selection' (Chọn lọc đặc trưng) có vai trò quan trọng nhất là gì?

Câu 5: Để dự báo khả năng một khách hàng sẽ rời bỏ dịch vụ (Churn Prediction), loại mô hình nào sau đây thường được ưu tiên sử dụng?

Câu 6: Trong bài toán phát hiện gian lận tín dụng, thách thức lớn nhất đối với tập dữ liệu thường là gì?

Câu 7: Chỉ số 'Mean Absolute Error' (MAE) trong đánh giá mô hình hồi quy dự báo doanh thu cho biết điều gì?

Câu 8: Phương pháp 'K-means clustering' thường được ứng dụng phổ biến nhất trong hoạt động kinh doanh nào?

Câu 9: Trong khai phá dữ liệu (Data Mining), chỉ số 'Lift' trong luật kết hợp (Association Rules) lớn hơn 1 có ý nghĩa gì đối với việc bán chéo sản phẩm?

Câu 10: Hiện tượng 'Data Leakage' (Rò rỉ dữ liệu) trong xây dựng mô hình dự báo kinh tế xảy ra khi nào?

Câu 11: Giả định về 'Phương sai sai số không đổi' (Homoscedasticity) trong hồi quy tuyến tính cổ điển có ý nghĩa gì?

Câu 12: Kỹ thuật 'Pruning' (Tỉa cành) trong thuật toán Cây quyết định (Decision Tree) nhằm mục đích chủ yếu là gì?

Câu 13: Sự khác biệt cơ bản giữa 'Học có giám sát' (Supervised Learning) và 'Học không giám sát' (Unsupervised Learning) là gì?

Câu 14: Trong phân tích kinh doanh, tại sao mối tương quan (Correlation) không đồng nghĩa với quan hệ nhân quả (Causation)?

Câu 15: Kỹ thuật 'K-fold Cross-validation' được sử dụng trong quy trình xây dựng mô hình nhằm mục đích gì?

Câu 16: Hệ thống 'Business Intelligence' (BI) khác với 'Data Science' ở điểm trọng tâm nào sau đây?

Câu 17: Việc thực hiện 'Standardization' (Chuẩn hóa) dữ liệu trước khi đưa vào mô hình Clustering có lợi ích gì?

Câu 18: Tại sao mô hình 'Random Forest' thường có hiệu suất tốt hơn một cây quyết định đơn lẻ (Single Decision Tree)?

Câu 19: Trong phân tích chuỗi thời gian (Time Series), yếu tố 'Tính mùa vụ' (Seasonality) được hiểu là gì?

Câu 20: Quy trình 'Tokenization' trong phân tích dữ liệu văn bản (NLP) phục vụ mục đích gì trong kinh doanh?

Câu 21: Vai trò của 'Hàm kích hoạt' (Activation Function) trong mạng thần kinh nhân tạo (Neural Networks) là gì?

Câu 22: Khi đánh giá mô hình phân loại khách hàng tiềm năng, chỉ số 'Recall' (Độ nhạy) cao có ý nghĩa gì đối với đội ngũ bán hàng?

Câu 23: Trong kiến trúc dữ liệu hiện đại, quá trình 'ETL' (Extract, Transform, Load) thực hiện nhiệm vụ gì?

Câu 24: Ý nghĩa của giá trị 'P-value' nhỏ hơn 0.05 trong một kiểm định giả thuyết kinh tế là gì?

Câu 25: Mô hình hồi quy Logistic (Logistic Regression) trả về kết quả đầu ra dưới dạng nào?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top