Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc tính 'Variety' đề cập đến yếu tố nào sau đây?

Câu 2: Thành phần nào trong kiến trúc Hadoop Distributed File System (HDFS) chịu trách nhiệm lưu trữ dữ liệu thực tế?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong việc xử lý dữ liệu lặp đi lặp lại?

Câu 4: Đặc tính 'Velocity' trong Big Data nhấn mạnh vào khía cạnh nào?

Câu 5: Trong lập trình MapReduce, giai đoạn nào thực hiện việc thu thập và nhóm các cặp key-value trung gian có cùng key?

Câu 6: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây thuộc loại 'Graph Database'?

Câu 7: Khái niệm 'Data Lake' được hiểu chính xác nhất là gì?

Câu 8: Định lý CAP phát biểu rằng một hệ thống phân tán chỉ có thể đảm bảo tối đa hai trong ba yếu tố nào?

Câu 9: Công cụ nào trong hệ sinh thái Hadoop được thiết kế để cung cấp giao diện truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

Câu 10: Đặc tính 'Veracity' của Big Data liên quan trực tiếp đến vấn đề nào?

Câu 11: Apache Kafka thường được sử dụng trong các hệ thống Big Data với vai trò chủ yếu là gì?

Câu 12: Trong hệ sinh thái Hadoop 2.x trở lên, thành phần nào chịu trách nhiệm quản lý tài nguyên và lập lịch cho các ứng dụng?

Câu 13: Kiểu lưu trữ dữ liệu theo cột (Columnar Storage) như Apache Parquet mang lại lợi ích lớn nhất trong trường hợp nào?

Câu 14: Trong Apache Spark, RDD (Resilient Distributed Dataset) có đặc điểm quan trọng nào?

Câu 15: Thuật ngữ 'Data Sharding' trong các cơ sở dữ liệu Big Data có nghĩa là gì?

Câu 16: Yếu tố nào được coi là quan trọng nhất trong 5V để biến Big Data thành kết quả thực tế cho doanh nghiệp?

Câu 17: Cơ sở dữ liệu NoSQL nào được thiết kế dựa trên mô hình BigTable của Google và chạy trên nền HDFS?

Câu 18: Sự khác biệt chính giữa ETL (Extract, Transform, Load) truyền thống và ELT trong Big Data là gì?

Câu 19: Apache Zookeeper đóng vai trò gì trong một cluster Big Data?

Câu 20: Ước tính phổ biến hiện nay cho thấy dữ liệu phi cấu trúc chiếm khoảng bao nhiêu phần trăm trong tổng lượng dữ liệu của doanh nghiệp?

Câu 21: Ứng dụng nào sau đây của Big Data sử dụng kỹ thuật Xử lý ngôn ngữ tự nhiên (NLP) để hiểu cảm xúc khách hàng?

Câu 22: Mục tiêu chính của việc sử dụng 'Replication' trong HDFS là gì?

Câu 23: Đặc điểm nào dưới đây là ưu điểm nổi bật của cơ sở dữ liệu Cassandra?

Câu 24: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 25: Trong ngữ cảnh Big Data, 'Edge Computing' đóng vai trò như thế nào so với điện toán đám mây trung tâm?