Bộ 13 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Mô hình 5Vs của Dữ liệu lớn (Big Data) bao gồm những yếu tố nào sau đây?

Câu 2: Thành phần nào trong hệ sinh thái Hadoop chịu trách nhiệm lưu trữ dữ liệu phân tán?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn Hadoop MapReduce trong xử lý dữ liệu?

Câu 4: Trong hệ thống HDFS, nút nào đóng vai trò quản lý metadata và điều phối truy cập tệp tin?

Câu 5: Định lý CAP trong hệ thống cơ sở dữ liệu phân tán khẳng định không thể đồng thời đạt được cả ba yếu tố nào?

Câu 6: Hai giai đoạn chính trong mô hình lập trình MapReduce là gì?

Câu 7: Công cụ nào sau đây được sử dụng để thu thập và vận chuyển các dòng dữ liệu nhật ký (log) lớn vào Hadoop?

Câu 8: Sự khác biệt cốt lõi giữa Data Lake và Data Warehouse là gì?

Câu 9: Trong Hadoop 2.x, YARN đóng vai trò gì?

Câu 10: Đặc tính 'Veracity' trong Big Data đề cập đến khía cạnh nào?

Câu 11: Cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

Câu 12: Cấu trúc dữ liệu cơ bản của Apache Spark là gì?

Câu 13: Apache Hive cung cấp khả năng nào cho người dùng Hadoop?

Câu 14: Dữ liệu từ các bài đăng trên mạng xã hội như Facebook hoặc Twitter thường được phân loại là loại dữ liệu nào?

Câu 15: Edge Computing giúp ích gì cho các hệ thống Big Data và IoT?

Câu 16: Trong quy trình xử lý dữ liệu, ETL là viết tắt của cụm từ nào?

Câu 17: Cơ sở dữ liệu Apache Cassandra được thiết kế theo mô hình nào để tối ưu hóa khả năng mở rộng?

Câu 18: Mục tiêu chính của Khoa học dữ liệu (Data Science) trong bối cảnh Big Data là gì?

Câu 19: Apache Kafka thường được sử dụng cho mục đích nào trong kiến trúc Big Data?

Câu 20: Lỗi 'Single Point of Failure' trong cụm Hadoop 1.x liên quan đến thành phần nào?

Câu 21: Quy định GDPR của Liên minh Châu Âu ảnh hưởng như thế nào đến việc xử lý Big Data?

Câu 22: Cơ chế 'Micro-batching' là đặc điểm xử lý dòng của công cụ nào?

Câu 23: Đặc tính 'Variety' của Big Data nhấn mạnh vào yếu tố nào?

Câu 24: Hệ thống nào giúp quản lý cấu hình và đồng bộ hóa các dịch vụ trong môi trường phân tán?

Câu 25: Tại sao 'Value' được coi là chữ V quan trọng nhất trong mô hình Big Data?