Quay lại danh mục Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Trang chủ
Trắc nghiệm
Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh
Bộ 15 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ 15 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Lưu ý: Nội dung trong bài Bộ 15 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong mô hình 5V của Big Data, yếu tố 'Velocity' (Tốc độ) đề cập đến khía cạnh nào sau đây trong kinh doanh?

A. Tốc độ dữ liệu được tạo ra và xử lý để đưa ra quyết định kịp thời.
B. Sự đa dạng của các loại định dạng dữ liệu từ nhiều nguồn khác nhau.
C. Độ tin cậy và tính chính xác của dữ liệu thu thập được.
D. Khối lượng dữ liệu khổng lồ mà doanh nghiệp cần lưu trữ.

💡 Lời giải chi tiết:

Theo phân tích phổ biến, Velocity đại diện cho tốc độ dữ liệu được tạo ra và yêu cầu phải được xử lý nhanh chóng để đáp ứng nhu cầu ra quyết định trong thực tế kinh doanh. Kết luận Lý giải Tốc độ dữ liệu được tạo ra và xử lý để đưa ra quyết định kịp thời.

Câu 2: Khi một ngân hàng sử dụng dữ liệu lịch sử về thu nhập và nợ để dự báo khả năng vỡ nợ của khách hàng mới, họ đang áp dụng loại học máy nào?

A. Học không giám sát (Unsupervised Learning).
B. Học củng cố (Reinforcement Learning).
C. Học có giám sát (Supervised Learning).
D. Học sâu (Deep Learning) không gắn nhãn.

💡 Lời giải chi tiết:

Học có giám sát được sử dụng khi mô hình được huấn luyện trên dữ liệu đã có nhãn mục tiêu cụ thể, ở đây là trạng thái vỡ nợ hoặc không vỡ nợ của khách hàng. Kết luận Lý giải Học có giám sát (Supervised Learning).

Câu 3: Kỹ thuật nào sau đây phù hợp nhất để một doanh nghiệp bán lẻ tự động phân nhóm khách hàng dựa trên hành vi mua sắm mà không có tiêu chí định trước?

A. Hồi quy tuyến tính (Linear Regression).
B. Phân cụm (Clustering).
C. Phân lớp (Classification).
D. Kiểm định giả thuyết (Hypothesis Testing).

💡 Lời giải chi tiết:

Phân cụm là một phương pháp học không giám sát dùng để nhóm các đối tượng có đặc điểm tương đồng mà không cần nhãn dữ liệu có sẵn. Kết luận Lý giải Phân cụm (Clustering).

Câu 4: Tại sao việc xử lý 'Outliers' (Giá trị ngoại lai) lại là bước cực kỳ quan trọng trong tiền xử lý dữ liệu kinh tế?

A. Vì chúng giúp tăng dung lượng lưu trữ của cơ sở dữ liệu.
B. Vì chúng luôn đại diện cho các giao dịch gian lận trong mọi trường hợp.
C. Vì chúng có thể làm sai lệch các chỉ số thống kê như trung bình cộng và gây nhiễu cho mô hình dự báo.
D. Vì chúng làm cho việc trực quan hóa dữ liệu trở nên đẹp mắt hơn.

💡 Lời giải chi tiết:

Theo nguyên tắc thống kê, các giá trị ngoại lai có thể gây ảnh hưởng nghiêm trọng đến các tham số của mô hình và dẫn đến những kết luận sai lệch về xu hướng chung. Kết luận Lý giải Vì chúng có thể làm sai lệch các chỉ số thống kê như trung bình cộng và gây nhiễu cho mô hình dự báo.

Câu 5: Trong mô hình hồi quy tuyến tính, chỉ số 'R-squared' (Hệ số xác định) mang ý nghĩa gì?

A. Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
B. Mức độ sai lệch trung bình giữa giá trị dự báo và giá trị thực tế.
C. Xác suất để mô hình đưa ra dự báo chính xác 100%.
D. Số lượng các biến độc lập có ý nghĩa thống kê trong mô hình.

💡 Lời giải chi tiết:

R-squared là một thước đo thống kê cho biết mức độ phù hợp của mô hình bằng cách thể hiện tỷ lệ phần trăm sự biến động của biến mục tiêu được giải thích bởi mô hình. Kết luận Lý giải Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.

Câu 6: Hiện tượng 'Overfitting' (Quá khớp) trong khoa học dữ liệu xảy ra khi nào?

A. Mô hình quá đơn giản và không nắm bắt được xu hướng của dữ liệu.
B. Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu thực tế mới.
C. Dữ liệu huấn luyện có quá ít mẫu so với số lượng biến độc lập.
D. Mô hình có độ chính xác như nhau trên cả tập huấn luyện và tập kiểm tra.

💡 Lời giải chi tiết:

Quá khớp xảy ra khi mô hình học quá chi tiết cả những nhiễu trong tập dữ liệu huấn luyện, dẫn đến khả năng tổng quát hóa kém đối với các dữ liệu mà nó chưa từng thấy. Kết luận Lý giải Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu thực tế mới.

Câu 7: Trong Marketing, kỹ thuật 'A/B Testing' chủ yếu được sử dụng nhằm mục đích gì?

A. Để thu thập thông tin cá nhân của tất cả khách hàng tiềm năng.
B. Để dự báo doanh thu của doanh nghiệp trong 5 năm tới.
C. Để so sánh hiệu quả của hai phiên bản khác nhau của một yếu tố nhằm tối ưu hóa chuyển đổi.
D. Để tự động hóa quy trình sản xuất hàng hóa trong nhà máy.

💡 Lời giải chi tiết:

A/B Testing là phương pháp thực nghiệm trong đó hai phiên bản được so sánh để xác định phiên bản nào đạt được mục tiêu kinh doanh tốt hơn. Kết luận Lý giải Để so sánh hiệu quả của hai phiên bản khác nhau của một yếu tố nhằm tối ưu hóa chuyển đổi.

Câu 8: Thuật ngữ 'Churn Prediction' trong kinh doanh dịch vụ đề cập đến bài toán nào?

A. Dự đoán giá cổ phiếu của đối thủ cạnh tranh trên thị trường.
B. Dự đoán khả năng khách hàng sẽ ngừng sử dụng dịch vụ của doanh nghiệp.
C. Dự đoán số lượng nhân viên sẽ nghỉ hưu trong năm tới.
D. Dự đoán thời điểm máy móc trong nhà xưởng sẽ bị hỏng.

💡 Lời giải chi tiết:

Dự đoán rời bỏ khách hàng (Churn Prediction) là một bài toán phân lớp quan trọng giúp doanh nghiệp chủ động thực hiện các biện pháp giữ chân khách hàng. Kết luận Lý giải Dự đoán khả năng khách hàng sẽ ngừng sử dụng dịch vụ của doanh nghiệp.

Câu 9: Trong quy trình Khoa học dữ liệu, bước ETL (Extract, Transform, Load) có vai trò chính là gì?

A. Xây dựng các thuật toán học sâu phức tạp.
B. Trình bày kết quả phân tích cho ban lãnh đạo thông qua biểu đồ.
C. Trích xuất, biến đổi và nạp dữ liệu từ các nguồn khác nhau vào kho lưu trữ để phân tích.
D. Bảo mật dữ liệu khỏi các cuộc tấn công từ hacker bên ngoài.

💡 Lời giải chi tiết:

ETL là quy trình nền tảng để chuẩn bị dữ liệu sạch và nhất quán trước khi tiến hành các phân tích chuyên sâu hoặc xây dựng mô hình. Kết luận Lý giải Trích xuất, biến đổi và nạp dữ liệu từ các nguồn khác nhau vào kho lưu trữ để phân tích.

Câu 10: Chỉ số 'Recall' (Độ gợi nhớ) đặc biệt quan trọng hơn 'Accuracy' (Độ chính xác tổng thể) trong tình huống kinh doanh nào sau đây?

A. Dự báo thời tiết hàng ngày để nhân viên đi làm.
B. Phát hiện gian lận thẻ tín dụng nhằm tránh bỏ sót các giao dịch nguy hiểm.
C. Phân loại email rác thông thường vào hòm thư spam.
D. Gợi ý phim cho người dùng trên nền tảng trực tuyến.

💡 Lời giải chi tiết:

Trong phát hiện gian lận, việc bỏ sót một trường hợp gian lận thực tế gây thiệt hại lớn hơn nhiều so với việc kiểm tra nhầm một giao dịch hợp pháp, do đó Recall cần được ưu tiên. Kết luận Lý giải Phát hiện gian lận thẻ tín dụng nhằm tránh bỏ sót các giao dịch nguy hiểm.

Câu 11: Sự khác biệt cốt lõi giữa 'Correlation' (Tương quan) và 'Causation' (Nhân quả) trong phân tích kinh tế là gì?

A. Tương quan luôn dẫn đến quan hệ nhân quả trong mọi tập dữ liệu lớn.
B. Nhân quả chỉ xuất hiện khi hai biến có chỉ số tương quan bằng 0.
C. Sự tương quan về số liệu không khẳng định chắc chắn rằng biến này gây ra biến kia.
D. Tương quan chỉ dùng cho dữ liệu định tính, còn nhân quả dùng cho dữ liệu định lượng.

💡 Lời giải chi tiết:

Một sai lầm phổ biến trong phân tích dữ liệu là đánh đồng việc hai biến biến thiên cùng nhau với việc chúng có quan hệ nguyên nhân - kết quả trực tiếp. Kết luận Lý giải Sự tương quan về số liệu không khẳng định chắc chắn rằng biến này gây ra biến kia.

Câu 12: Ứng dụng nào sau đây là ví dụ điển hình của 'Sentiment Analysis' (Phân tích cảm xúc) trong quản trị trải nghiệm khách hàng?

A. Tính toán tổng doanh thu theo tháng của một cửa hàng.
B. Tự động phân loại đánh giá của khách hàng trên mạng xã hội là tích cực hay tiêu cực.
C. Dự báo lượng hàng tồn kho cần thiết cho mùa lễ hội.
D. Quản lý danh sách lương và thưởng của nhân viên cuối năm.

💡 Lời giải chi tiết:

Phân tích cảm xúc sử dụng xử lý ngôn ngữ tự nhiên để hiểu thái độ và ý kiến của khách hàng từ các dữ liệu văn bản không cấu trúc. Kết luận Lý giải Tự động phân loại đánh giá của khách hàng trên mạng xã hội là tích cực hay tiêu cực.

Câu 13: Trong tiền xử lý dữ liệu, phương pháp 'Imputation' đề cập đến việc gì?

A. Xóa bỏ hoàn toàn các cột có chứa giá trị không hợp lệ.
B. Mã hóa các biến phân loại thành các con số để đưa vào mô hình.
C. Thay thế các giá trị bị thiếu bằng các giá trị ước tính hợp lý như trung bình hoặc trung vị.
D. Nhân bản dữ liệu để tăng kích thước mẫu huấn luyện.

💡 Lời giải chi tiết:

Thay vì loại bỏ dữ liệu quý giá, kỹ thuật Imputation giúp duy trì kích thước mẫu bằng cách điền vào các khoảng trống dữ liệu bằng các ước lượng thống kê. Kết luận Lý giải Thay thế các giá trị bị thiếu bằng các giá trị ước tính hợp lý như trung bình hoặc trung vị.

Câu 14: Lợi ích chính của việc sử dụng 'Random Forest' so với một 'Decision Tree' (Cây quyết định) đơn lẻ là gì?

A. Dễ dàng giải thích cho những người không có chuyên môn về kỹ thuật.
B. Tốc độ huấn luyện mô hình nhanh hơn gấp nhiều lần.
C. Giảm thiểu biến số và tránh hiện tượng quá khớp bằng cách kết hợp nhiều cây quyết định.
D. Yêu cầu ít dữ liệu hơn để đạt được độ chính xác tương đương.

💡 Lời giải chi tiết:

Random Forest là một phương pháp Ensemble giúp cải thiện độ ổn định và độ chính xác dự báo bằng cách lấy trung bình kết quả từ một tập hợp các cây quyết định độc lập. Kết luận Lý giải Giảm thiểu biến số và tránh hiện tượng quá khớp bằng cách kết hợp nhiều cây quyết định.

Câu 15: Thuật toán 'Apriori' thường được các doanh nghiệp thương mại điện tử sử dụng cho mục đích nào?

A. Để tìm ra các quy tắc kết hợp giữa các sản phẩm mà khách hàng thường mua cùng nhau.
B. Để tối ưu hóa lộ trình vận chuyển hàng hóa của các tài xế.
C. Để xác định thời điểm khách hàng chuẩn bị rời bỏ dịch vụ.
D. Để tự động trả lời các câu hỏi thường gặp của khách hàng.

💡 Lời giải chi tiết:

Phân tích giỏ hàng (Market Basket Analysis) thông qua thuật toán Apriori giúp doanh nghiệp hiểu được mối liên hệ giữa các mặt hàng để thực hiện chiến lược bán chéo (cross-selling) hiệu quả. Kết luận Lý giải Để tìm ra các quy tắc kết hợp giữa các sản phẩm mà khách hàng thường mua cùng nhau.

Câu 16: Trong bối cảnh Khoa học dữ liệu, 'Feature Engineering' (Kỹ thuật đặc trưng) có ý nghĩa như thế nào?

A. Là quá trình sửa chữa các phần cứng máy tính dùng để chạy mô hình.
B. Là việc tạo ra các biến mới từ dữ liệu thô để giúp mô hình học tập hiệu quả hơn.
C. Là quá trình thiết kế giao diện đồ họa cho ứng dụng phân tích dữ liệu.
D. Là việc thuê các kỹ sư chuyên về dữ liệu cho phòng ban kinh doanh.

💡 Lời giải chi tiết:

Kỹ thuật đặc trưng đóng vai trò quyết định đến hiệu suất của mô hình học máy bằng cách cung cấp các thông tin có ý nghĩa hơn từ dữ liệu gốc. Kết luận Lý giải Là việc tạo ra các biến mới từ dữ liệu thô để giúp mô hình học tập hiệu quả hơn.

Câu 17: Quy định bảo vệ dữ liệu chung (GDPR) của Liên minh Châu Âu có ảnh hưởng quan trọng nhất như thế nào đến Khoa học dữ liệu?

A. Yêu cầu mọi mô hình học máy phải được lập trình bằng ngôn ngữ Python.
B. Bắt buộc các doanh nghiệp phải chia sẻ dữ liệu miễn phí cho cộng đồng.
C. Áp đặt các tiêu chuẩn nghiêm ngặt về quyền riêng tư và bảo vệ dữ liệu cá nhân của người dùng.
D. Cấm sử dụng hoàn toàn trí tuệ nhân tạo trong các hoạt động kinh doanh.

💡 Lời giải chi tiết:

GDPR thiết lập khung pháp lý chặt chẽ buộc các nhà khoa học dữ liệu phải cân nhắc kỹ lưỡng về tính tuân thủ pháp luật và đạo đức khi xử lý dữ liệu cá nhân. Kết luận Lý giải Áp đặt các tiêu chuẩn nghiêm ngặt về quyền riêng tư và bảo vệ dữ liệu cá nhân của người dùng.

Câu 18: Sự khác biệt chính giữa 'Data Lake' (Hồ dữ liệu) và 'Data Warehouse' (Kho dữ liệu) là gì?

A. Data Lake chỉ chứa dữ liệu dạng văn bản, còn Data Warehouse chỉ chứa hình ảnh.
B. Data Lake lưu trữ dữ liệu thô ở mọi định dạng, còn Data Warehouse lưu trữ dữ liệu đã được cấu trúc và xử lý.
C. Data Warehouse có chi phí lưu trữ thấp hơn nhiều so với Data Lake.
D. Data Lake chỉ dành cho các doanh nghiệp nhỏ, còn Data Warehouse dành cho tập đoàn lớn.

💡 Lời giải chi tiết:

Hồ dữ liệu cho phép lưu giữ dữ liệu ở trạng thái nguyên bản để linh hoạt trong phân tích sau này, trong khi Kho dữ liệu tối ưu hóa cho các báo cáo có cấu trúc định kỳ. Kết luận Lý giải Data Lake lưu trữ dữ liệu thô ở mọi định dạng, còn Data Warehouse lưu trữ dữ liệu đã được cấu trúc và xử lý.

Câu 19: Loại dữ liệu nào sau đây được coi là 'Unstructured Data' (Dữ liệu không cấu trúc) trong kinh doanh?

A. Bảng danh sách sản phẩm với giá tiền và mã kho trong SQL.
B. Các file ghi âm cuộc gọi chăm sóc khách hàng và các bài đăng trên mạng xã hội.
C. File Excel chứa thông tin lương thưởng của nhân viên theo từng tháng.
D. Báo cáo doanh thu định dạng CSV với các cột được định nghĩa rõ ràng.

💡 Lời giải chi tiết:

Dữ liệu không cấu trúc không có định dạng dòng-cột cứng nhắc, chiếm phần lớn dữ liệu được tạo ra hiện nay và đòi hỏi các kỹ thuật xử lý đặc biệt như NLP hoặc Computer Vision. Kết luận Lý giải Các file ghi âm cuộc gọi chăm sóc khách hàng và các bài đăng trên mạng xã hội.

Câu 20: Trong ma trận nhầm lẫn (Confusion Matrix), trường hợp 'False Positive' (Dương tính giả) có nghĩa là gì?

A. Mô hình dự báo là không và thực tế cũng là không.
B. Mô hình dự báo là có nhưng thực tế lại là không.
C. Mô hình dự báo là có và thực tế cũng là có.
D. Mô hình dự báo là không nhưng thực tế lại là có.

💡 Lời giải chi tiết:

Dương tính giả xảy ra khi mô hình đưa ra một cảnh báo hoặc dự báo có sự kiện xảy ra trong khi sự kiện đó không hề có trong thực tế. Kết luận Lý giải Mô hình dự báo là có nhưng thực tế lại là không.

Câu 21: Vai trò chính của 'Prescriptive Analytics' (Phân tích kê đơn) trong chuỗi cung ứng là gì?

A. Chỉ đơn thuần mô tả lại những gì đã xảy ra trong quá khứ.
B. Dự báo nhu cầu hàng hóa của khách hàng trong tương lai.
C. Đưa ra các khuyến nghị hành động cụ thể để tối ưu hóa quy trình và giảm thiểu chi phí.
D. Kiểm kê số lượng hàng hóa hiện có trong kho một cách thủ công.

💡 Lời giải chi tiết:

Phân tích kê đơn vượt xa việc dự báo bằng cách sử dụng các thuật toán tối ưu hóa để chỉ ra hành động tốt nhất mà doanh nghiệp nên thực hiện. Kết luận Lý giải Đưa ra các khuyến nghị hành động cụ thể để tối ưu hóa quy trình và giảm thiểu chi phí.

Câu 22: Kỹ thuật 'Cross-Validation' (Kiểm tra chéo) thường được sử dụng nhằm mục đích gì?

A. Để tăng tốc độ tính toán của các bộ vi xử lý máy tính.
B. Để đánh giá khả năng tổng quát hóa của mô hình trên các tập dữ liệu độc lập.
C. Để tự động thu thập thêm dữ liệu từ các trang web đối thủ.
D. Để thay thế hoàn toàn vai trò của các nhà khoa học dữ liệu trong doanh nghiệp.

💡 Lời giải chi tiết:

Kiểm tra chéo giúp đảm bảo rằng hiệu suất của mô hình không phải là kết quả của sự may mắn trên một tập dữ liệu cụ thể và đánh giá độ tin cậy của mô hình trên dữ liệu mới. Kết luận Lý giải Để đánh giá khả năng tổng quát hóa của mô hình trên các tập dữ liệu độc lập.

Câu 23: Tại sao các mô hình học máy trong tuyển dụng có thể gây ra định kiến (Bias) đối với một nhóm ứng viên nhất định?

A. Vì máy tính có cảm xúc cá nhân và thiên vị các ứng viên có học vấn cao.
B. Vì dữ liệu lịch sử dùng để huấn luyện mô hình có chứa các quyết định thiên vị trong quá khứ.
C. Vì thuật toán học máy được thiết kế để luôn loại bỏ những người có kinh nghiệm.
D. Vì các ứng viên cố tình cung cấp dữ liệu sai lệch cho mô hình.

💡 Lời giải chi tiết:

Định kiến trong AI thường phản chiếu những thành kiến đã tồn tại sẵn trong dữ liệu lịch sử mà con người tạo ra và dùng để huấn luyện thuật toán. Kết luận Lý giải Vì dữ liệu lịch sử dùng để huấn luyện mô hình có chứa các quyết định thiên vị trong quá khứ.

Câu 24: Đặc điểm cơ bản của dữ liệu chuỗi thời gian (Time Series) được dùng trong dự báo chứng khoán là gì?

A. Các điểm dữ liệu hoàn toàn độc lập và không liên quan gì đến nhau.
B. Dữ liệu được thu thập tại một thời điểm duy nhất từ nhiều nguồn khác nhau.
C. Các quan sát được thu thập theo một trình tự thời gian liên tục và có tính phụ thuộc lẫn nhau.
D. Dữ liệu chỉ bao gồm các thông tin định tính như cảm xúc của nhà đầu tư.

💡 Lời giải chi tiết:

Dữ liệu chuỗi thời gian yêu cầu các kỹ thuật phân tích đặc thù vì thứ tự thời gian của các quan sát chứa đựng thông tin về xu hướng và tính chu kỳ. Kết luận Lý giải Các quan sát được thu thập theo một trình tự thời gian liên tục và có tính phụ thuộc lẫn nhau.

Câu 25: Công cụ nào sau đây thường được sử dụng phổ biến nhất để truy vấn dữ liệu từ các cơ sở dữ liệu quan hệ trong doanh nghiệp?

A. Photoshop.
B. SQL (Structured Query Language).
C. HTML/CSS.
D. PowerPoint.

💡 Lời giải chi tiết:

SQL là ngôn ngữ tiêu chuẩn và thiết yếu nhất để các nhà phân tích tương tác, truy xuất và quản lý dữ liệu trong hầu hết các hệ quản trị cơ sở dữ liệu doanh nghiệp hiện nay. Kết luận Lý giải SQL (Structured Query Language).

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 1 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 195 lượt làm

Làm ngay

Bộ 2 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 212 lượt làm

Làm ngay

Bộ 3 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 229 lượt làm

Làm ngay

Bộ 4 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 246 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 263 lượt làm

Làm ngay

Bộ 6 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Bộ trắc nghiệm 280 lượt làm

Làm ngay

Bộ 15 - Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh

Kết quả của bạn:

Câu 1: Trong mô hình 5V của Big Data, yếu tố 'Velocity' (Tốc độ) đề cập đến khía cạnh nào sau đây trong kinh doanh?

Câu 2: Khi một ngân hàng sử dụng dữ liệu lịch sử về thu nhập và nợ để dự báo khả năng vỡ nợ của khách hàng mới, họ đang áp dụng loại học máy nào?

Câu 3: Kỹ thuật nào sau đây phù hợp nhất để một doanh nghiệp bán lẻ tự động phân nhóm khách hàng dựa trên hành vi mua sắm mà không có tiêu chí định trước?

Câu 4: Tại sao việc xử lý 'Outliers' (Giá trị ngoại lai) lại là bước cực kỳ quan trọng trong tiền xử lý dữ liệu kinh tế?

Câu 5: Trong mô hình hồi quy tuyến tính, chỉ số 'R-squared' (Hệ số xác định) mang ý nghĩa gì?

Câu 6: Hiện tượng 'Overfitting' (Quá khớp) trong khoa học dữ liệu xảy ra khi nào?

Câu 7: Trong Marketing, kỹ thuật 'A/B Testing' chủ yếu được sử dụng nhằm mục đích gì?

Câu 8: Thuật ngữ 'Churn Prediction' trong kinh doanh dịch vụ đề cập đến bài toán nào?

Câu 9: Trong quy trình Khoa học dữ liệu, bước ETL (Extract, Transform, Load) có vai trò chính là gì?

Câu 10: Chỉ số 'Recall' (Độ gợi nhớ) đặc biệt quan trọng hơn 'Accuracy' (Độ chính xác tổng thể) trong tình huống kinh doanh nào sau đây?

Câu 11: Sự khác biệt cốt lõi giữa 'Correlation' (Tương quan) và 'Causation' (Nhân quả) trong phân tích kinh tế là gì?

Câu 12: Ứng dụng nào sau đây là ví dụ điển hình của 'Sentiment Analysis' (Phân tích cảm xúc) trong quản trị trải nghiệm khách hàng?

Câu 13: Trong tiền xử lý dữ liệu, phương pháp 'Imputation' đề cập đến việc gì?

Câu 14: Lợi ích chính của việc sử dụng 'Random Forest' so với một 'Decision Tree' (Cây quyết định) đơn lẻ là gì?

Câu 15: Thuật toán 'Apriori' thường được các doanh nghiệp thương mại điện tử sử dụng cho mục đích nào?

Câu 16: Trong bối cảnh Khoa học dữ liệu, 'Feature Engineering' (Kỹ thuật đặc trưng) có ý nghĩa như thế nào?

Câu 17: Quy định bảo vệ dữ liệu chung (GDPR) của Liên minh Châu Âu có ảnh hưởng quan trọng nhất như thế nào đến Khoa học dữ liệu?

Câu 18: Sự khác biệt chính giữa 'Data Lake' (Hồ dữ liệu) và 'Data Warehouse' (Kho dữ liệu) là gì?

Câu 19: Loại dữ liệu nào sau đây được coi là 'Unstructured Data' (Dữ liệu không cấu trúc) trong kinh doanh?

Câu 20: Trong ma trận nhầm lẫn (Confusion Matrix), trường hợp 'False Positive' (Dương tính giả) có nghĩa là gì?

Câu 21: Vai trò chính của 'Prescriptive Analytics' (Phân tích kê đơn) trong chuỗi cung ứng là gì?

Câu 22: Kỹ thuật 'Cross-Validation' (Kiểm tra chéo) thường được sử dụng nhằm mục đích gì?

Câu 23: Tại sao các mô hình học máy trong tuyển dụng có thể gây ra định kiến (Bias) đối với một nhóm ứng viên nhất định?

Câu 24: Đặc điểm cơ bản của dữ liệu chuỗi thời gian (Time Series) được dùng trong dự báo chứng khoán là gì?

Câu 25: Công cụ nào sau đây thường được sử dụng phổ biến nhất để truy vấn dữ liệu từ các cơ sở dữ liệu quan hệ trong doanh nghiệp?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top