Bộ 15 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Big Data, đặc điểm nào mô tả về sự không đồng nhất và đa dạng của các loại dữ liệu?

Câu 2: Thành phần nào trong kiến trúc Hadoop chịu trách nhiệm quản lý việc lưu trữ dữ liệu phân tán trên các nút?

Câu 3: Trong hệ sinh thái Hadoop, NameNode đóng vai trò gì trong cụm HDFS?

Câu 4: Đặc trưng 'Velocity' trong Big Data nhấn mạnh vào khía cạnh nào sau đây?

Câu 5: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây được phân loại vào nhóm 'Document Store'?

Câu 6: Lợi thế chính của Apache Spark so với MapReduce truyền thống trong xử lý dữ liệu lớn là gì?

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán chỉ có thể đảm bảo tối đa hai trong ba yếu tố nào?

Câu 8: Công cụ nào trong hệ sinh thái Hadoop được thiết kế để chuyển giao dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ (RDBMS)?

Câu 9: Khái niệm 'Data Lake' khác với 'Data Warehouse' ở điểm cốt lõi nào?

Câu 10: Trong mô hình 5V, 'Veracity' đề cập đến vấn đề nào của dữ liệu?

Câu 11: Thành phần YARN trong Hadoop 2.x đóng vai trò chủ chốt là gì?

Câu 12: Loại dữ liệu nào sau đây được coi là dữ liệu 'phi cấu trúc' (Unstructured Data)?

Câu 13: Apache Hive cung cấp cơ chế nào để người dùng tương tác với dữ liệu trong Hadoop?

Câu 14: Thư viện nào của Apache Spark chuyên dùng cho các thuật toán học máy (Machine Learning)?

Câu 15: Giai đoạn 'Shuffle' trong mô hình MapReduce có chức năng chính là gì?

Câu 16: Định dạng lưu trữ cột (Columnar Storage) như Apache Parquet mang lại lợi ích gì cho các truy vấn phân tích Big Data?

Câu 17: Apache Kafka thường được sử dụng trong kiến trúc Big Data với vai trò gì?

Câu 18: Khái niệm 'Sharding' trong các cơ sở dữ liệu Big Data có nghĩa là gì?

Câu 19: Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 20: Trong hệ sinh thái Big Data, công cụ Apache Zookeeper thường được dùng để làm gì?

Câu 21: Loại cơ sở dữ liệu NoSQL nào là phù hợp nhất để lưu trữ và phân tích các mối quan hệ phức tạp như mạng xã hội?

Câu 22: Hệ thống quản trị cơ sở dữ liệu Apache Cassandra nổi tiếng với đặc điểm nào?

Câu 23: Trong quá trình ETL cho Big Data, chữ 'T' (Transform) đại diện cho công việc nào?

Câu 24: Một 'Data Scientist' làm việc với Big Data thường sử dụng kỹ thuật nào để dự báo xu hướng tương lai?

Câu 25: Tại sao 'In-memory computing' lại trở nên quan trọng trong kỷ nguyên Big Data?