Bộ 15 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 15 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 15 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Big Data, đặc điểm nào mô tả về sự không đồng nhất và đa dạng của các loại dữ liệu?

Câu 2: Thành phần nào trong kiến trúc Hadoop chịu trách nhiệm quản lý việc lưu trữ dữ liệu phân tán trên các nút?

Câu 3: Trong hệ sinh thái Hadoop, NameNode đóng vai trò gì trong cụm HDFS?

Câu 4: Đặc trưng 'Velocity' trong Big Data nhấn mạnh vào khía cạnh nào sau đây?

Câu 5: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây được phân loại vào nhóm 'Document Store'?

Câu 6: Lợi thế chính của Apache Spark so với MapReduce truyền thống trong xử lý dữ liệu lớn là gì?

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán chỉ có thể đảm bảo tối đa hai trong ba yếu tố nào?

Câu 8: Công cụ nào trong hệ sinh thái Hadoop được thiết kế để chuyển giao dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ (RDBMS)?

Câu 9: Khái niệm 'Data Lake' khác với 'Data Warehouse' ở điểm cốt lõi nào?

Câu 10: Trong mô hình 5V, 'Veracity' đề cập đến vấn đề nào của dữ liệu?

Câu 11: Thành phần YARN trong Hadoop 2.x đóng vai trò chủ chốt là gì?

Câu 12: Loại dữ liệu nào sau đây được coi là dữ liệu 'phi cấu trúc' (Unstructured Data)?

Câu 13: Apache Hive cung cấp cơ chế nào để người dùng tương tác với dữ liệu trong Hadoop?

Câu 14: Thư viện nào của Apache Spark chuyên dùng cho các thuật toán học máy (Machine Learning)?

Câu 15: Giai đoạn 'Shuffle' trong mô hình MapReduce có chức năng chính là gì?

Câu 16: Định dạng lưu trữ cột (Columnar Storage) như Apache Parquet mang lại lợi ích gì cho các truy vấn phân tích Big Data?

Câu 17: Apache Kafka thường được sử dụng trong kiến trúc Big Data với vai trò gì?

Câu 18: Khái niệm 'Sharding' trong các cơ sở dữ liệu Big Data có nghĩa là gì?

Câu 19: Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 20: Trong hệ sinh thái Big Data, công cụ Apache Zookeeper thường được dùng để làm gì?

Câu 21: Loại cơ sở dữ liệu NoSQL nào là phù hợp nhất để lưu trữ và phân tích các mối quan hệ phức tạp như mạng xã hội?

Câu 22: Hệ thống quản trị cơ sở dữ liệu Apache Cassandra nổi tiếng với đặc điểm nào?

Câu 23: Trong quá trình ETL cho Big Data, chữ 'T' (Transform) đại diện cho công việc nào?

Câu 24: Một 'Data Scientist' làm việc với Big Data thường sử dụng kỹ thuật nào để dự báo xu hướng tương lai?

Câu 25: Tại sao 'In-memory computing' lại trở nên quan trọng trong kỷ nguyên Big Data?