Quay lại danh mục Trắc nghiệm Dữ liệu lớn (BigData)

Trang chủ
Trắc nghiệm
Trắc nghiệm Dữ liệu lớn (BigData)
Bộ 6 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 6 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 6 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong mô hình 5 chữ 'V' của Dữ liệu lớn (Big Data), đặc tính 'Velocity' tập trung vào khía cạnh nào?

A. Sự đa dạng của các loại định dạng dữ liệu khác nhau.
B. Tốc độ dữ liệu được tạo ra và tốc độ cần được xử lý.
C. Độ tin cậy và tính chính xác của nguồn dữ liệu.
D. Tổng dung lượng lưu trữ cần thiết cho hệ thống.

💡 Lời giải chi tiết:

Theo định nghĩa phổ biến, 'Velocity' mô tả tốc độ luồng dữ liệu liên tục được sinh ra và yêu cầu xử lý thời gian thực hoặc gần thời gian thực. Kết luận Lý giải: Tốc độ dữ liệu được tạo ra và tốc độ cần được xử lý.

Câu 2: Thành phần nào trong kiến trúc Hadoop Distributed File System (HDFS) chịu trách nhiệm quản lý 'metadata' của toàn hệ thống?

A. DataNode.
B. Resource Manager.
C. NameNode.
D. TaskTracker.

💡 Lời giải chi tiết:

NameNode đóng vai trò là máy chủ quản lý cấu trúc thư mục, vị trí các khối dữ liệu và các siêu dữ liệu quan trọng của HDFS. Kết luận Lý giải: NameNode.

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong các tác vụ xử lý dữ liệu lặp đi lặp lại?

A. Vì Spark sử dụng ngôn ngữ lập trình Python thay cho Java.
B. Vì Spark không cần sử dụng hệ thống tệp phân tán.
C. Vì Spark thực hiện tính toán trên bộ nhớ (In-memory processing) thay vì ghi xuống đĩa liên tục.
D. Vì Spark chỉ hỗ trợ xử lý dữ liệu có cấu trúc.

💡 Lời giải chi tiết:

Khả năng lưu trữ dữ liệu trung gian trên RAM giúp Spark giảm thiểu độ trễ từ việc truy xuất ổ đĩa so với mô hình MapReduce truyền thống. Kết luận Lý giải: Vì Spark thực hiện tính toán trên bộ nhớ (In-memory processing) thay vì ghi xuống đĩa liên tục.

Câu 4: Định lý CAP (Brewer's theorem) cho rằng một hệ thống dữ liệu phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

A. Chi phí, Hiệu suất, Độ tin cậy.
B. Tính nhất quán, Tính sẵn sàng, Khả năng chịu lỗi phân vùng.
C. Bảo mật, Tính toàn vẹn, Tính riêng tư.
D. Dung lượng, Tốc độ, Độ chính xác.

💡 Lời giải chi tiết:

Định lý CAP chỉ ra rằng trong môi trường phân tán, hệ thống chỉ có thể tối ưu hóa tối đa hai trong ba yếu tố: Consistency, Availability và Partition Tolerance. Kết luận Lý giải: Tính nhất quán, Tính sẵn sàng, Khả năng chịu lỗi phân vùng.

Câu 5: Trong hệ sinh thái Big Data, Apache Kafka thường được sử dụng với mục đích chính là gì?

A. Lưu trữ dữ liệu dài hạn như một kho dữ liệu.
B. Nền tảng truyền tin (messaging) và xử lý luồng (streaming) dữ liệu thời gian thực.
C. Công cụ trực quan hóa dữ liệu trên web.
D. Quản trị các truy vấn SQL cho cơ sở dữ liệu quan hệ.

💡 Lời giải chi tiết:

Apache Kafka là một hệ thống phân tán được thiết kế để xử lý các luồng dữ liệu lớn với độ trễ cực thấp giữa nhà cung cấp và người tiêu thụ dữ liệu. Kết luận Lý giải: Nền tảng truyền tin (messaging) và xử lý luồng (streaming) dữ liệu thời gian thực.

Câu 6: Định dạng tệp tin nào sau đây được thiết kế theo dạng cột (columnar storage) để tối ưu hóa hiệu suất truy vấn trong Big Data?

A. JSON.
B. CSV.
C. Apache Parquet.
D. XML.

💡 Lời giải chi tiết:

Apache Parquet lưu trữ dữ liệu theo cột, cho phép nén tốt hơn và chỉ đọc các cột cần thiết, giúp tăng tốc độ xử lý các truy vấn phân tích. Kết luận Lý giải: Apache Parquet.

Câu 7: Sự khác biệt cốt lõi giữa 'Data Lake' và 'Data Warehouse' là gì?

A. Data Lake chỉ lưu trữ dữ liệu văn bản, Data Warehouse lưu trữ hình ảnh.
B. Data Lake lưu trữ dữ liệu thô chưa cấu trúc, trong khi Data Warehouse lưu trữ dữ liệu đã được xử lý và có cấu trúc rõ ràng.
C. Data Warehouse có chi phí lưu trữ thấp hơn Data Lake.
D. Data Lake không hỗ trợ các công cụ phân tích dữ liệu.

💡 Lời giải chi tiết:

Data Lake chấp nhận mọi định dạng dữ liệu ở trạng thái nguyên bản, còn Data Warehouse yêu cầu sơ đồ cấu trúc (schema) trước khi nạp dữ liệu. Kết luận Lý giải: Data Lake lưu trữ dữ liệu thô chưa cấu trúc, trong khi Data Warehouse lưu trữ dữ liệu đã được xử lý và có cấu trúc rõ ràng.

Câu 8: Trong kiến trúc Hadoop, thành phần YARN (Yet Another Resource Negotiator) đóng vai trò gì?

A. Hệ thống tệp tin phân tán.
B. Công cụ thực hiện các phép toán Map và Reduce.
C. Quản lý tài nguyên hệ thống và lập lịch thực hiện các tác vụ ứng dụng.
D. Công cụ chuyển đổi dữ liệu từ SQL sang NoSQL.

💡 Lời giải chi tiết:

YARN đóng vai trò như 'hệ điều hành' của Hadoop, quản lý việc phân bổ tài nguyên máy tính cho các ứng dụng khác nhau chạy trên cụm. Kết luận Lý giải: Quản lý tài nguyên hệ thống và lập lịch thực hiện các tác vụ ứng dụng.

Câu 9: Đặc tính 'Veracity' trong dữ liệu lớn liên quan đến vấn đề nào dưới đây?

A. Kích thước của tập dữ liệu.
B. Chất lượng, độ tin cậy và sự không chắc chắn của dữ liệu.
C. Giá trị kinh tế mà dữ liệu mang lại.
D. Tốc độ phản hồi của hệ thống cơ sở dữ liệu.

💡 Lời giải chi tiết:

Veracity đề cập đến sự nhiễu loạn, sai lệch hoặc độ không chính xác của dữ liệu thô cần được xử lý để đảm bảo kết quả phân tích đáng tin cậy. Kết luận Lý giải: Chất lượng, độ tin cậy và sự không chắc chắn của dữ liệu.

Câu 10: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây thuộc loại 'Document-oriented'?

A. Redis.
B. Neo4j.
C. MongoDB.
D. Cassandra.

💡 Lời giải chi tiết:

MongoDB lưu trữ dữ liệu dưới dạng các tài liệu linh hoạt (BSON), cho phép các trường dữ liệu thay đổi giữa các bản ghi mà không cần schema cố định. Kết luận Lý giải: MongoDB.

Câu 11: Trong quy trình ETL truyền thống, bước 'Transform' (Chuyển đổi) có mục đích chính là gì?

A. Sao lưu dữ liệu gốc sang ổ cứng ngoài.
B. Lấy dữ liệu từ các nguồn khác nhau như SQL, tệp tin phẳng.
C. Làm sạch, định dạng và áp dụng các quy tắc nghiệp vụ để dữ liệu sẵn sàng cho phân tích.
D. Nạp dữ liệu cuối cùng vào kho lưu trữ đích.

💡 Lời giải chi tiết:

Bước Transform đảm bảo dữ liệu từ nhiều nguồn khác nhau được đồng nhất về định dạng và loại bỏ các lỗi sai sót trước khi sử dụng. Kết luận Lý giải: Làm sạch, định dạng và áp dụng các quy tắc nghiệp vụ để dữ liệu sẵn sàng cho phân tích.

Câu 12: Tại sao 'Phân tích dự báo' (Predictive Analytics) lại quan trọng trong ứng dụng Big Data?

A. Vì nó giúp mô tả chính xác những gì đã xảy ra trong quá khứ.
B. Vì nó sử dụng dữ liệu lịch sử và thuật toán thống kê để đưa ra các dự đoán về xu hướng tương lai.
C. Vì nó giúp giảm kích thước dữ liệu xuống mức tối thiểu.
D. Vì nó chỉ tập trung vào việc hiển thị dữ liệu bằng biểu đồ.

💡 Lời giải chi tiết:

Phân tích dự báo khai thác sức mạnh của Big Data để nhận diện các mô hình hành vi, giúp doanh nghiệp chủ động đưa ra các quyết định trước khi sự việc xảy ra. Kết luận Lý giải: Vì nó sử dụng dữ liệu lịch sử và thuật toán thống kê để đưa ra các dự đoán về xu hướng tương lai.

Câu 13: Apache Hive được sử dụng trong hệ sinh thái Hadoop nhằm mục đích gì?

A. Cung cấp giao diện giống SQL để truy vấn dữ liệu được lưu trữ trên HDFS.
B. Tăng tốc độ ghi dữ liệu trực tiếp vào ổ đĩa.
C. Quản lý việc bảo mật mạng cho các node trong cụm.
D. Tạo ra các mô hình học máy phức tạp.

💡 Lời giải chi tiết:

Hive giúp các nhà phân tích dữ liệu quen thuộc với SQL có thể thao tác với dữ liệu lớn trên Hadoop mà không cần viết mã Java MapReduce phức tạp. Kết luận Lý giải: Cung cấp giao diện giống SQL để truy vấn dữ liệu được lưu trữ trên HDFS.

Câu 14: Khái niệm 'Data Anonymization' (Ẩn danh dữ liệu) trong quản trị Big Data nhằm giải quyết vấn đề nào?

A. Tăng tốc độ truy cập dữ liệu.
B. Bảo vệ quyền riêng tư cá nhân bằng cách loại bỏ các thông tin định danh trực tiếp.
C. Nén dữ liệu để tiết kiệm không gian lưu trữ.
D. Phục hồi dữ liệu bị mất sau sự cố phần cứng.

💡 Lời giải chi tiết:

Ẩn danh dữ liệu là một kỹ thuật bảo mật quan trọng để tuân thủ các quy định như GDPR, đảm bảo thông tin cá nhân không bị lộ diện trong quá trình phân tích. Kết luận Lý giải: Bảo vệ quyền riêng tư cá nhân bằng cách loại bỏ các thông tin định danh trực tiếp.

Câu 15: Trong Spark, 'RDD' (Resilient Distributed Dataset) là gì?

A. Một loại cơ sở dữ liệu quan hệ mới.
B. Một tập hợp dữ liệu chỉ đọc, phân tán trên các node của cụm với khả năng chịu lỗi cao.
C. Một công cụ để quản lý phần cứng máy chủ.
D. Định dạng nén hình ảnh dành cho Big Data.

💡 Lời giải chi tiết:

RDD là cấu trúc dữ liệu cơ bản của Spark, cho phép thực hiện các phép toán song song và tự động phục hồi khi một node gặp sự cố. Kết luận Lý giải: Một tập hợp dữ liệu chỉ đọc, phân tán trên các node của cụm với khả năng chịu lỗi cao.

Câu 16: Thuật ngữ 'Horizontal Scaling' (Mở rộng quy mô theo chiều ngang) trong Big Data có nghĩa là gì?

A. Nâng cấp CPU và RAM cho một máy chủ hiện có.
B. Thay thế ổ cứng cũ bằng ổ cứng có dung lượng lớn hơn.
C. Thêm nhiều máy chủ mới vào hệ thống để cùng chia sẻ tải công việc.
D. Sử dụng các thuật toán nén dữ liệu mạnh hơn.

💡 Lời giải chi tiết:

Mở rộng theo chiều ngang cho phép các hệ thống Big Data duy trì hiệu suất bằng cách phân tán khối lượng xử lý sang nhiều thiết bị rẻ tiền thay vì nâng cấp một thiết bị đắt tiền. Kết luận Lý giải: Thêm nhiều máy chủ mới vào hệ thống để cùng chia sẻ tải công việc.

Câu 17: Hệ thống cơ sở dữ liệu đồ thị (Graph Database) như Neo4j phù hợp nhất cho loại dữ liệu nào?

A. Dữ liệu kế toán tài chính thuần túy.
B. Dữ liệu có mối quan hệ phức tạp và kết nối chéo như mạng xã hội hoặc phát hiện gian lận.
C. Dữ liệu lưu trữ các tệp video dung lượng lớn.
D. Dữ liệu cảm biến nhiệt độ đơn giản theo thời gian.

💡 Lời giải chi tiết:

Cơ sở dữ liệu đồ thị tối ưu hóa việc lưu trữ và truy vấn các mối quan hệ giữa các thực thể, điều mà các DB quan hệ thường gặp khó khăn về hiệu suất. Kết luận Lý giải: Dữ liệu có mối quan hệ phức tạp và kết nối chéo như mạng xã hội hoặc phát hiện gian lận.

Câu 18: Trong mô hình MapReduce, giai đoạn 'Shuffle and Sort' nằm giữa hai pha nào?

A. Nạp dữ liệu và pha Map.
B. Pha Map và pha Reduce.
C. Pha Reduce và pha xuất kết quả.
D. Pha lọc dữ liệu và pha nén dữ liệu.

💡 Lời giải chi tiết:

Sau khi pha Map kết thúc, hệ thống phải sắp xếp và di chuyển các cặp key-value tương ứng về cùng một reducer để thực hiện pha tổng hợp. Kết luận Lý giải: Pha Map và pha Reduce.

Câu 19: Mục tiêu cuối cùng của đặc tính 'Value' trong Big Data là gì?

A. Tích lũy càng nhiều dữ liệu càng tốt.
B. Chuyển đổi dữ liệu thô thành thông tin hữu ích có thể thúc đẩy hành động hoặc mang lại lợi ích kinh tế.
C. Tăng chi phí đầu tư cho hạ tầng công nghệ thông tin.
D. Đảm bảo mọi dữ liệu đều được lưu trữ vĩnh viễn.

💡 Lời giải chi tiết:

Dữ liệu chỉ thực sự có ý nghĩa nếu nó mang lại hiểu biết sâu sắc (insights) giúp giải quyết vấn đề hoặc tạo ra giá trị mới cho tổ chức. Kết luận Lý giải: Chuyển đổi dữ liệu thô thành thông tin hữu ích có thể thúc đẩy hành động hoặc mang lại lợi ích kinh tế.

Câu 20: Cơ chế 'Replication' trong HDFS có tác dụng chính là gì?

A. Làm cho dữ liệu xử lý nhanh hơn bằng cách nhân bản mã nguồn.
B. Đảm bảo tính sẵn sàng và an toàn của dữ liệu bằng cách lưu trữ các bản sao của mỗi khối dữ liệu trên nhiều máy chủ khác nhau.
C. Mã hóa dữ liệu để ngăn chặn tin tặc.
D. Xóa các dữ liệu trùng lặp để tiết kiệm không gian lưu trữ.

💡 Lời giải chi tiết:

HDFS mặc định tạo ra 3 bản sao của mỗi khối dữ liệu để đề phòng trường hợp một hoặc nhiều máy chủ gặp sự cố vật lý. Kết luận Lý giải: Đảm bảo tính sẵn sàng và an toàn của dữ liệu bằng cách lưu trữ các bản sao của mỗi khối dữ liệu trên nhiều máy chủ khác nhau.

Câu 21: Khái niệm 'Schema-on-read' thường được liên kết với công nghệ nào sau đây?

A. Cơ sở dữ liệu quan hệ (RDBMS).
B. Hệ thống quản lý kho dữ liệu truyền thống.
C. Data Lake và các hệ thống NoSQL.
D. Phần mềm bảng tính Microsoft Excel.

💡 Lời giải chi tiết:

Schema-on-read cho phép nạp dữ liệu thô vào hệ thống và cấu trúc chỉ được xác định khi người dùng thực hiện truy vấn để đọc dữ liệu. Kết luận Lý giải: Data Lake và các hệ thống NoSQL.

Câu 22: Trong phân tích Big Data, 'Phân tích chẩn đoán' (Diagnostic Analytics) tập trung trả lời câu hỏi nào?

A. Điều gì sẽ xảy ra tiếp theo?
B. Tại sao một sự việc đã xảy ra?
C. Chúng ta nên làm gì để điều đó xảy ra?
D. Hiện tại đang có bao nhiêu dữ liệu?

💡 Lời giải chi tiết:

Phân tích chẩn đoán tìm kiếm nguyên nhân gốc rễ và các mối tương quan để giải thích cho các kết quả đã được quan sát trong dữ liệu quá khứ. Kết luận Lý giải: Tại sao một sự việc đã xảy ra?

Câu 23: Hệ thống 'In-memory database' mang lại ưu điểm vượt trội nào cho xử lý dữ liệu lớn?

A. Khả năng lưu trữ lượng dữ liệu lớn hơn nhiều so với đĩa cứng.
B. Giảm thiểu thời gian truy cập dữ liệu do không phải thực hiện các thao tác vào/ra (I/O) trên đĩa vật lý.
C. Đảm bảo dữ liệu không bao giờ bị mất khi mất điện.
D. Tự động sửa lỗi phần cứng máy chủ.

💡 Lời giải chi tiết:

Việc truy xuất dữ liệu từ RAM nhanh hơn hàng nghìn lần so với từ đĩa cứng, giúp đáp ứng các yêu cầu xử lý dữ liệu cực nhanh. Kết luận Lý giải: Giảm thiểu thời gian truy cập dữ liệu do không phải thực hiện các thao tác vào/ra (I/O) trên đĩa vật lý.

Câu 24: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để kết hợp hai phương thức xử lý nào?

A. Xử lý cục bộ và xử lý đám mây.
B. Xử lý theo lô (Batch processing) và xử lý luồng (Stream processing).
C. Xử lý văn bản và xử lý hình ảnh.
D. Xử lý có cấu trúc và xử lý mã hóa.

💡 Lời giải chi tiết:

Kiến trúc Lambda sử dụng Batch layer để đảm bảo tính chính xác toàn diện và Speed layer để cung cấp các kết quả thời gian thực ngay lập tức. Kết luận Lý giải: Xử lý theo lô (Batch processing) và xử lý luồng (Stream processing).

Câu 25: Trong bối cảnh điện toán đám mây, 'Serverless Big Data' (ví dụ như Google BigQuery) có ưu điểm gì?

A. Người dùng không cần quản lý hoặc thiết lập cơ sở hạ tầng máy chủ bên dưới.
B. Dữ liệu được lưu trữ miễn phí hoàn toàn.
C. Hệ thống chỉ hoạt động được khi có sự can thiệp thủ công của kỹ sư.
D. Hạn chế số lượng truy vấn để đảm bảo an toàn.

💡 Lời giải chi tiết:

Mô hình Serverless cho phép các nhà phân tích tập trung vào viết truy vấn SQL mà không phải lo lắng về việc cấu hình hay nâng cấp phần cứng. Kết luận Lý giải: Người dùng không cần quản lý hoặc thiết lập cơ sở hạ tầng máy chủ bên dưới.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 7 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 242 lượt làm

Làm ngay

Bộ 8 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 259 lượt làm

Làm ngay

Bộ 9 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 276 lượt làm

Làm ngay

Bộ 10 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 293 lượt làm

Làm ngay

Bộ 11 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 110 lượt làm

Làm ngay

Bộ 12 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 127 lượt làm

Làm ngay

Bộ 6 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Kết quả của bạn:

Câu 1: Trong mô hình 5 chữ 'V' của Dữ liệu lớn (Big Data), đặc tính 'Velocity' tập trung vào khía cạnh nào?

Câu 2: Thành phần nào trong kiến trúc Hadoop Distributed File System (HDFS) chịu trách nhiệm quản lý 'metadata' của toàn hệ thống?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong các tác vụ xử lý dữ liệu lặp đi lặp lại?

Câu 4: Định lý CAP (Brewer's theorem) cho rằng một hệ thống dữ liệu phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

Câu 5: Trong hệ sinh thái Big Data, Apache Kafka thường được sử dụng với mục đích chính là gì?

Câu 6: Định dạng tệp tin nào sau đây được thiết kế theo dạng cột (columnar storage) để tối ưu hóa hiệu suất truy vấn trong Big Data?

Câu 7: Sự khác biệt cốt lõi giữa 'Data Lake' và 'Data Warehouse' là gì?

Câu 8: Trong kiến trúc Hadoop, thành phần YARN (Yet Another Resource Negotiator) đóng vai trò gì?

Câu 9: Đặc tính 'Veracity' trong dữ liệu lớn liên quan đến vấn đề nào dưới đây?

Câu 10: Hệ quản trị cơ sở dữ liệu NoSQL nào sau đây thuộc loại 'Document-oriented'?

Câu 11: Trong quy trình ETL truyền thống, bước 'Transform' (Chuyển đổi) có mục đích chính là gì?

Câu 12: Tại sao 'Phân tích dự báo' (Predictive Analytics) lại quan trọng trong ứng dụng Big Data?

Câu 13: Apache Hive được sử dụng trong hệ sinh thái Hadoop nhằm mục đích gì?

Câu 14: Khái niệm 'Data Anonymization' (Ẩn danh dữ liệu) trong quản trị Big Data nhằm giải quyết vấn đề nào?

Câu 15: Trong Spark, 'RDD' (Resilient Distributed Dataset) là gì?

Câu 16: Thuật ngữ 'Horizontal Scaling' (Mở rộng quy mô theo chiều ngang) trong Big Data có nghĩa là gì?

Câu 17: Hệ thống cơ sở dữ liệu đồ thị (Graph Database) như Neo4j phù hợp nhất cho loại dữ liệu nào?

Câu 18: Trong mô hình MapReduce, giai đoạn 'Shuffle and Sort' nằm giữa hai pha nào?

Câu 19: Mục tiêu cuối cùng của đặc tính 'Value' trong Big Data là gì?

Câu 20: Cơ chế 'Replication' trong HDFS có tác dụng chính là gì?

Câu 21: Khái niệm 'Schema-on-read' thường được liên kết với công nghệ nào sau đây?

Câu 22: Trong phân tích Big Data, 'Phân tích chẩn đoán' (Diagnostic Analytics) tập trung trả lời câu hỏi nào?

Câu 23: Hệ thống 'In-memory database' mang lại ưu điểm vượt trội nào cho xử lý dữ liệu lớn?

Câu 24: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để kết hợp hai phương thức xử lý nào?

Câu 25: Trong bối cảnh điện toán đám mây, 'Serverless Big Data' (ví dụ như Google BigQuery) có ưu điểm gì?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top