Bộ 8 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong đặc trưng 5Vs của Dữ liệu lớn, yếu tố 'Velocity' (Tốc độ) đề cập chủ yếu đến khía cạnh nào?

Câu 2: Hệ thống tệp phân tán Hadoop (HDFS) lưu trữ các tệp tin lớn bằng cách nào để đảm bảo tính chịu lỗi?

Câu 3: Trong mô hình lập trình MapReduce, nhiệm vụ chính của giai đoạn 'Reduce' là gì?

Câu 4: Sự khác biệt cốt lõi giữa 'Data Lake' (Hồ dữ liệu) và 'Data Warehouse' (Kho dữ liệu) là gì?

Câu 5: Định lý CAP trong hệ thống phân tán khẳng định rằng một hệ thống không thể đồng thời đảm bảo cả 3 yếu tố nào?

Câu 6: Tại sao Apache Spark thường được coi là nhanh hơn MapReduce trong nhiều tác vụ xử lý dữ liệu?

Câu 7: Công nghệ nào sau đây đóng vai trò là một hệ thống tin nhắn phân tán (distributed messaging system) phổ biến trong kiến trúc Big Data?

Câu 8: Đặc trưng 'Veracity' (Tính xác thực) trong Dữ liệu lớn giải quyết vấn đề nào sau đây?

Câu 9: Lợi ích chính của việc sử dụng lưu trữ dạng cột (Columnar Storage) như Apache Parquet trong Big Data là gì?

Câu 10: Thành phần YARN (Yet Another Resource Negotiator) trong kiến trúc Hadoop 2.x có nhiệm vụ gì?

Câu 11: Cơ sở dữ liệu NoSQL nào sau đây được phân loại vào nhóm 'Graph Database' (Cơ sở dữ liệu đồ thị)?

Câu 12: Khía cạnh 'Value' (Giá trị) trong mô hình 5Vs của Big Data ám chỉ điều gì?

Câu 13: Phân tích dự báo (Predictive Analytics) trong Big Data thường được sử dụng để làm gì?

Câu 14: Trong hệ sinh thái Hadoop, công cụ Apache Zookeeper thường được dùng để thực hiện chức năng nào?

Câu 15: Kiến trúc Lambda (Lambda Architecture) trong xử lý dữ liệu lớn được thiết kế để giải quyết vấn đề gì?

Câu 16: Khái niệm 'Lazy Evaluation' (Đánh giá lười biếng) trong Apache Spark có ý nghĩa như thế nào?

Câu 17: Trong đặc trưng 'Variety' (Sự đa dạng), loại dữ liệu nào chiếm tỷ trọng lớn nhất trong các tổ chức hiện nay theo ước tính của các chuyên gia?

Câu 18: Mô hình ELT (Extract, Load, Transform) khác với mô hình ETL truyền thống ở điểm căn bản nào khi xử lý Big Data?

Câu 19: Nhiệm vụ chính của NameNode trong kiến trúc HDFS của Hadoop là gì?

Câu 20: Công cụ nào trong hệ sinh thái Hadoop cho phép người dùng sử dụng ngôn ngữ truy vấn giống SQL để phân tích dữ liệu trên HDFS?

Câu 21: Trong ngữ cảnh Big Data, 'Dark Data' (Dữ liệu tối) được hiểu là gì?

Câu 22: Vai trò của Metadata trong quản trị dữ liệu lớn (Data Governance) là gì?

Câu 23: Trong quá trình MapReduce, giai đoạn 'Shuffle and Sort' diễn ra vào thời điểm nào?

Câu 24: Ưu điểm lớn nhất của việc sử dụng 'Commodity Hardware' (Phần cứng phổ thông) trong cụm Hadoop là gì?

Câu 25: Thuật ngữ 'In-memory computing' (Tính toán trong bộ nhớ) có liên quan mật thiết nhất đến công cụ nào sau đây?