Bộ 13 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 13 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 13 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Mô hình 5Vs của Dữ liệu lớn (Big Data) bao gồm những yếu tố nào sau đây?

Câu 2: Thành phần nào trong hệ sinh thái Hadoop chịu trách nhiệm lưu trữ dữ liệu phân tán?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn Hadoop MapReduce trong xử lý dữ liệu?

Câu 4: Trong hệ thống HDFS, nút nào đóng vai trò quản lý metadata và điều phối truy cập tệp tin?

Câu 5: Định lý CAP trong hệ thống cơ sở dữ liệu phân tán khẳng định không thể đồng thời đạt được cả ba yếu tố nào?

Câu 6: Hai giai đoạn chính trong mô hình lập trình MapReduce là gì?

Câu 7: Công cụ nào sau đây được sử dụng để thu thập và vận chuyển các dòng dữ liệu nhật ký (log) lớn vào Hadoop?

Câu 8: Sự khác biệt cốt lõi giữa Data Lake và Data Warehouse là gì?

Câu 9: Trong Hadoop 2.x, YARN đóng vai trò gì?

Câu 10: Đặc tính 'Veracity' trong Big Data đề cập đến khía cạnh nào?

Câu 11: Cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

Câu 12: Cấu trúc dữ liệu cơ bản của Apache Spark là gì?

Câu 13: Apache Hive cung cấp khả năng nào cho người dùng Hadoop?

Câu 14: Dữ liệu từ các bài đăng trên mạng xã hội như Facebook hoặc Twitter thường được phân loại là loại dữ liệu nào?

Câu 15: Edge Computing giúp ích gì cho các hệ thống Big Data và IoT?

Câu 16: Trong quy trình xử lý dữ liệu, ETL là viết tắt của cụm từ nào?

Câu 17: Cơ sở dữ liệu Apache Cassandra được thiết kế theo mô hình nào để tối ưu hóa khả năng mở rộng?

Câu 18: Mục tiêu chính của Khoa học dữ liệu (Data Science) trong bối cảnh Big Data là gì?

Câu 19: Apache Kafka thường được sử dụng cho mục đích nào trong kiến trúc Big Data?

Câu 20: Lỗi 'Single Point of Failure' trong cụm Hadoop 1.x liên quan đến thành phần nào?

Câu 21: Quy định GDPR của Liên minh Châu Âu ảnh hưởng như thế nào đến việc xử lý Big Data?

Câu 22: Cơ chế 'Micro-batching' là đặc điểm xử lý dòng của công cụ nào?

Câu 23: Đặc tính 'Variety' của Big Data nhấn mạnh vào yếu tố nào?

Câu 24: Hệ thống nào giúp quản lý cấu hình và đồng bộ hóa các dịch vụ trong môi trường phân tán?

Câu 25: Tại sao 'Value' được coi là chữ V quan trọng nhất trong mô hình Big Data?