Bộ 9 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 9 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong mô hình '5Vs' của Dữ liệu lớn (Big Data), đặc điểm 'Variety' (Đa dạng) chủ yếu đề cập đến vấn đề gì?

Câu 2: Thành phần nào trong kiến trúc Hadoop Distributed File System (HDFS) chịu trách nhiệm lưu trữ dữ liệu thực tế dưới dạng các 'block'?

Câu 3: Tại sao Apache Spark thường có tốc độ xử lý dữ liệu nhanh hơn MapReduce của Hadoop truyền thống?

Câu 4: Theo định lý CAP trong hệ thống phân tán, ba yếu tố nào không thể đồng thời đạt được ở mức tối ưu nhất?

Câu 5: Cơ sở dữ liệu NoSQL nào sau đây được phân loại vào nhóm 'Document Store' (Lưu trữ tài liệu)?

Câu 6: Đặc điểm chính phân biệt giữa Data Lake và Data Warehouse là gì?

Câu 7: Apache Kafka thường được sử dụng trong hệ sinh thái Big Data với mục đích chính là gì?

Câu 8: Công cụ nào sau đây được sử dụng để chuyển đổi dữ liệu giữa Hadoop và các cơ sở dữ liệu quan hệ (RDBMS) như MySQL hoặc Oracle?

Câu 9: Trong mô hình 5Vs, chữ 'V' nào đại diện cho tính chính xác và độ tin cậy của dữ liệu?

Câu 10: Thành phần YARN (Yet Another Resource Negotiator) trong Hadoop 2.x có chức năng chính là gì?

Câu 11: Quy trình ETL trong xử lý dữ liệu truyền thống bao gồm các bước nào theo thứ tự?

Câu 12: Trong lập trình MapReduce, giai đoạn 'Reduce' thực hiện nhiệm vụ gì?

Câu 13: Apache HBase là loại cơ sở dữ liệu nào trong hệ sinh thái Big Data?

Câu 14: Apache Hive được tạo ra nhằm mục đích gì cho người dùng Hadoop?

Câu 15: Loại dữ liệu nào sau đây được coi là 'Dữ liệu không cấu trúc' (Unstructured Data)?

Câu 16: Khái niệm 'RDD' (Resilient Distributed Dataset) là thành phần cốt lõi của công nghệ nào?

Câu 17: Mục tiêu chính của việc sử dụng 'Data Warehouse' trong doanh nghiệp là gì?

Câu 18: Trong bối cảnh Big Data, thuật ngữ 'Velocity' (Tốc độ) có ý nghĩa như thế nào?

Câu 19: Hệ quản trị cơ sở dữ liệu nào sau đây dựa trên mô hình đồ thị (Graph Database) và thường dùng để phân tích mối quan hệ mạng xã hội?

Câu 20: Apache Zookeeper đóng vai trò gì trong một cụm máy chủ Big Data phân tán?

Câu 21: Ưu điểm nổi bật nhất của Apache Cassandra so với các cơ sở dữ liệu truyền thống là gì?

Câu 22: Kiến trúc Lambda (Lambda Architecture) trong xử lý dữ liệu lớn được thiết kế để giải quyết vấn đề gì?

Câu 23: Thuật ngữ 'Data Governance' (Quản trị dữ liệu) đề cập đến nội dung nào sau đây?

Câu 24: Kỹ thuật 'Sharding' trong các cơ sở dữ liệu Big Data thường được hiểu là gì?

Câu 25: Ứng dụng nào sau đây là một ví dụ điển hình của 'Predictive Analytics' (Phân tích dự báo) sử dụng Big Data?