Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc điểm 'Veracity' đề cập đến khía cạnh nào?

Câu 2: Thành phần nào trong kiến trúc HDFS chịu trách nhiệm quản lý Metadata và điều phối truy cập của khách hàng?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong nhiều tác vụ xử lý dữ liệu?

Câu 4: Trong hệ sinh thái Hadoop, công cụ nào được sử dụng để truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

Câu 5: Đặc tính nào của RDD (Resilient Distributed Dataset) trong Spark cho phép hệ thống tự phục hồi khi một nút gặp sự cố?

Câu 6: Hệ quản trị cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

Câu 8: Định dạng tệp tin nào thường được ưu tiên trong Big Data để tối ưu hóa việc truy vấn theo cột và nén dữ liệu?

Câu 9: Thành phần YARN (Yet Another Resource Negotiator) trong Hadoop đóng vai trò chủ chốt là gì?

Câu 10: Dữ liệu thu thập từ các cảm biến IoT hoặc luồng dữ liệu mạng xã hội thường được phân loại vào nhóm nào?

Câu 11: Trong kỹ thuật MapReduce, giai đoạn 'Shuffle' có nhiệm vụ chính là gì?

Câu 12: Đâu là khái niệm chính xác nhất về 'Data Lake'?

Câu 13: Hệ thống Apache Kafka thường được sử dụng cho mục đích nào trong các dự án Big Data?

Câu 14: Giá trị 'Replication Factor' mặc định trong hệ thống HDFS của Hadoop là bao nhiêu?

Câu 15: Apache Sqoop là công cụ được thiết kế để thực hiện nhiệm vụ gì?

Câu 16: Khái niệm 'Velocity' trong Big Data nhấn mạnh vào yếu tố nào?

Câu 17: Trong Apache Spark, hành động (Action) khác với biến đổi (Transformation) ở điểm nào?

Câu 18: Apache HBase là loại cơ sở dữ liệu gì trong hệ sinh thái Big Data?

Câu 19: Mục tiêu chính của 'Data Sharding' là gì?

Câu 20: Thành phần nào giúp Apache Spark Streaming có thể xử lý luồng dữ liệu theo thời gian thực?

Câu 21: Trong Big Data, kỹ thuật 'In-memory processing' có nhược điểm tiềm tàng nào quan trọng nhất?

Câu 22: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 23: Thuật ngữ 'Dark Data' trong lĩnh vực Big Data dùng để chỉ loại dữ liệu nào?

Câu 24: Công cụ Apache Flume thường được ứng dụng hiệu quả nhất trong trường hợp nào?

Câu 25: Mô hình 'BASE' trong hệ thống NoSQL là viết tắt của các đặc tính nào?