Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc điểm 'Veracity' đề cập đến khía cạnh nào?

Câu 2: Thành phần nào trong kiến trúc HDFS chịu trách nhiệm quản lý Metadata và điều phối truy cập của khách hàng?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong nhiều tác vụ xử lý dữ liệu?

Câu 4: Trong hệ sinh thái Hadoop, công cụ nào được sử dụng để truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

Câu 5: Đặc tính nào của RDD (Resilient Distributed Dataset) trong Spark cho phép hệ thống tự phục hồi khi một nút gặp sự cố?

Câu 6: Hệ quản trị cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

Câu 8: Định dạng tệp tin nào thường được ưu tiên trong Big Data để tối ưu hóa việc truy vấn theo cột và nén dữ liệu?

Câu 9: Thành phần YARN (Yet Another Resource Negotiator) trong Hadoop đóng vai trò chủ chốt là gì?

Câu 10: Dữ liệu thu thập từ các cảm biến IoT hoặc luồng dữ liệu mạng xã hội thường được phân loại vào nhóm nào?

Câu 11: Trong kỹ thuật MapReduce, giai đoạn 'Shuffle' có nhiệm vụ chính là gì?

Câu 12: Đâu là khái niệm chính xác nhất về 'Data Lake'?

Câu 13: Hệ thống Apache Kafka thường được sử dụng cho mục đích nào trong các dự án Big Data?

Câu 14: Giá trị 'Replication Factor' mặc định trong hệ thống HDFS của Hadoop là bao nhiêu?

Câu 15: Apache Sqoop là công cụ được thiết kế để thực hiện nhiệm vụ gì?

Câu 16: Khái niệm 'Velocity' trong Big Data nhấn mạnh vào yếu tố nào?

Câu 17: Trong Apache Spark, hành động (Action) khác với biến đổi (Transformation) ở điểm nào?

Câu 18: Apache HBase là loại cơ sở dữ liệu gì trong hệ sinh thái Big Data?

Câu 19: Mục tiêu chính của 'Data Sharding' là gì?

Câu 20: Thành phần nào giúp Apache Spark Streaming có thể xử lý luồng dữ liệu theo thời gian thực?

Câu 21: Trong Big Data, kỹ thuật 'In-memory processing' có nhược điểm tiềm tàng nào quan trọng nhất?

Câu 22: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 23: Thuật ngữ 'Dark Data' trong lĩnh vực Big Data dùng để chỉ loại dữ liệu nào?

Câu 24: Công cụ Apache Flume thường được ứng dụng hiệu quả nhất trong trường hợp nào?

Câu 25: Mô hình 'BASE' trong hệ thống NoSQL là viết tắt của các đặc tính nào?