Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc tính 'Variety' đề cập đến yếu tố nào sau đây?

Câu 2: Thành phần nào trong kiến trúc Hadoop Distributed File System (HDFS) chịu trách nhiệm lưu trữ dữ liệu thực tế?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong việc xử lý dữ liệu lặp đi lặp lại?

Câu 4: Đặc tính 'Velocity' trong Big Data nhấn mạnh vào khía cạnh nào?

Câu 5: Trong lập trình MapReduce, giai đoạn nào thực hiện việc thu thập và nhóm các cặp key-value trung gian có cùng key?

Câu 6: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây thuộc loại 'Graph Database'?

Câu 7: Khái niệm 'Data Lake' được hiểu chính xác nhất là gì?

Câu 8: Định lý CAP phát biểu rằng một hệ thống phân tán chỉ có thể đảm bảo tối đa hai trong ba yếu tố nào?

Câu 9: Công cụ nào trong hệ sinh thái Hadoop được thiết kế để cung cấp giao diện truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

Câu 10: Đặc tính 'Veracity' của Big Data liên quan trực tiếp đến vấn đề nào?

Câu 11: Apache Kafka thường được sử dụng trong các hệ thống Big Data với vai trò chủ yếu là gì?

Câu 12: Trong hệ sinh thái Hadoop 2.x trở lên, thành phần nào chịu trách nhiệm quản lý tài nguyên và lập lịch cho các ứng dụng?

Câu 13: Kiểu lưu trữ dữ liệu theo cột (Columnar Storage) như Apache Parquet mang lại lợi ích lớn nhất trong trường hợp nào?

Câu 14: Trong Apache Spark, RDD (Resilient Distributed Dataset) có đặc điểm quan trọng nào?

Câu 15: Thuật ngữ 'Data Sharding' trong các cơ sở dữ liệu Big Data có nghĩa là gì?

Câu 16: Yếu tố nào được coi là quan trọng nhất trong 5V để biến Big Data thành kết quả thực tế cho doanh nghiệp?

Câu 17: Cơ sở dữ liệu NoSQL nào được thiết kế dựa trên mô hình BigTable của Google và chạy trên nền HDFS?

Câu 18: Sự khác biệt chính giữa ETL (Extract, Transform, Load) truyền thống và ELT trong Big Data là gì?

Câu 19: Apache Zookeeper đóng vai trò gì trong một cluster Big Data?

Câu 20: Ước tính phổ biến hiện nay cho thấy dữ liệu phi cấu trúc chiếm khoảng bao nhiêu phần trăm trong tổng lượng dữ liệu của doanh nghiệp?

Câu 21: Ứng dụng nào sau đây của Big Data sử dụng kỹ thuật Xử lý ngôn ngữ tự nhiên (NLP) để hiểu cảm xúc khách hàng?

Câu 22: Mục tiêu chính của việc sử dụng 'Replication' trong HDFS là gì?

Câu 23: Đặc điểm nào dưới đây là ưu điểm nổi bật của cơ sở dữ liệu Cassandra?

Câu 24: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 25: Trong ngữ cảnh Big Data, 'Edge Computing' đóng vai trò như thế nào so với điện toán đám mây trung tâm?