Quay lại danh mục Trắc nghiệm Dữ liệu lớn (BigData)

Trang chủ
Trắc nghiệm
Trắc nghiệm Dữ liệu lớn (BigData)
Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Lưu ý: Nội dung trong bài Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc điểm 'Veracity' đề cập đến khía cạnh nào?

A. Tốc độ xử lý và phản hồi dữ liệu theo thời gian thực.
B. Sự đa dạng về định dạng dữ liệu từ nhiều nguồn khác nhau.
C. Độ tin cậy và tính chính xác của dữ liệu.
D. Khối lượng dữ liệu khổng lồ vượt quá khả năng lưu trữ thông thường.

💡 Lời giải chi tiết:

Theo phân tích phổ biến trong khoa học dữ liệu, 'Veracity' tập trung vào việc xác định chất lượng, độ nhiễu và mức độ tin cậy của dữ liệu đầu vào. Kết luận Lý giải Độ tin cậy và tính chính xác của dữ liệu.

Câu 2: Thành phần nào trong kiến trúc HDFS chịu trách nhiệm quản lý Metadata và điều phối truy cập của khách hàng?

A. DataNode.
B. NameNode.
C. Secondary NameNode.
D. JobTracker.

💡 Lời giải chi tiết:

Trong hệ thống tệp phân tán Hadoop (HDFS), NameNode đóng vai trò là máy chủ trung tâm quản lý cấu trúc cây thư mục và vị trí các khối dữ liệu. Kết luận Lý giải NameNode.

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong nhiều tác vụ xử lý dữ liệu?

A. Spark sử dụng cơ chế xử lý dữ liệu trực tiếp trên bộ nhớ RAM thay vì ghi xuống đĩa cứng liên tục.
B. Spark loại bỏ hoàn toàn giai đoạn Shuffle trong quá trình xử lý.
C. Spark chỉ hỗ trợ xử lý dữ liệu có cấu trúc từ các cơ sở dữ liệu quan hệ.
D. Spark sử dụng ngôn ngữ lập trình Python có tốc độ thực thi nhanh hơn Java.

💡 Lời giải chi tiết:

Theo đánh giá kỹ thuật, khả năng tính toán trong bộ nhớ (in-memory computing) giúp Spark giảm thiểu đáng kể độ trễ do các thao tác I/O trên đĩa cứng gây ra. Kết luận Lý giải Spark sử dụng cơ chế xử lý dữ liệu trực tiếp trên bộ nhớ RAM thay vì ghi xuống đĩa cứng liên tục.

Câu 4: Trong hệ sinh thái Hadoop, công cụ nào được sử dụng để truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

A. Apache Flume.
B. Apache Hive.
C. Apache Mahout.
D. Apache Zookeeper.

💡 Lời giải chi tiết:

Apache Hive cung cấp cơ sở hạ tầng kho dữ liệu cho phép người dùng truy vấn dữ liệu lưu trên HDFS thông qua ngôn ngữ HiveQL có cú pháp tương đồng SQL. Kết luận Lý giải Apache Hive.

Câu 5: Đặc tính nào của RDD (Resilient Distributed Dataset) trong Spark cho phép hệ thống tự phục hồi khi một nút gặp sự cố?

A. Tính khả biến (Mutability).
B. Tính phân mảnh dữ liệu (Data Sharding).
C. Cơ chế theo dõi lịch sử biến đổi (Lineage).
D. Khả năng nén dữ liệu tự động.

💡 Lời giải chi tiết:

RDD lưu trữ các thông tin về nguồn gốc và các bước biến đổi dữ liệu (Lineage), giúp nó có thể tính toán lại các phần dữ liệu bị mất trên các nút khác. Kết luận Lý giải Cơ chế theo dõi lịch sử biến đổi (Lineage).

Câu 6: Hệ quản trị cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

A. Key-Value store.
B. Graph database.
C. Column-family store.
D. Document-oriented database.

💡 Lời giải chi tiết:

MongoDB lưu trữ dữ liệu dưới dạng các tài liệu linh hoạt giống JSON (BSON), giúp việc truy vấn và mở rộng dữ liệu phi cấu trúc trở nên dễ dàng hơn. Kết luận Lý giải Document-oriented database.

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

A. Consistency (Tính nhất quán), Availability (Tính sẵn sàng), Partition Tolerance (Tính chịu lỗi phân mảnh).
B. Complexity (Độ phức tạp), Accuracy (Độ chính xác), Performance (Hiệu suất).
C. Cost (Chi phí), Agility (Sự linh hoạt), Privacy (Quyền riêng tư).
D. Concurrency (Tính đồng thời), Authority (Quyền hạn), Portability (Tính di động).

💡 Lời giải chi tiết:

Theo lý thuyết của Eric Brewer, các hệ thống dữ liệu phân tán buộc phải đánh đổi và chỉ có thể tối ưu hóa tối đa hai trong ba yếu tố của định lý CAP. Kết luận Lý giải Consistency (Tính nhất quán), Availability (Tính sẵn sàng), Partition Tolerance (Tính chịu lỗi phân mảnh).

Câu 8: Định dạng tệp tin nào thường được ưu tiên trong Big Data để tối ưu hóa việc truy vấn theo cột và nén dữ liệu?

A. CSV.
B. Parquet.
C. XML.
D. TXT.

💡 Lời giải chi tiết:

Parquet là định dạng lưu trữ dạng cột (columnar storage) giúp tăng tốc độ đọc dữ liệu bằng cách chỉ tải các cột cần thiết cho truy vấn và tăng hiệu quả nén. Kết luận Lý giải Parquet.

Câu 9: Thành phần YARN (Yet Another Resource Negotiator) trong Hadoop đóng vai trò chủ chốt là gì?

A. Hệ thống tệp phân tán để lưu trữ dữ liệu.
B. Công cụ chuyển đổi dữ liệu từ SQL sang NoSQL.
C. Lớp quản lý tài nguyên và lập lịch cho các ứng dụng chạy trên cụm Hadoop.
D. Giao diện web để theo dõi hoạt động của người dùng.

💡 Lời giải chi tiết:

YARN tách biệt chức năng quản lý tài nguyên khỏi xử lý dữ liệu, cho phép nhiều công cụ xử lý khác nhau như Spark hay Flink cùng chạy trên một cụm Hadoop. Kết luận Lý giải Lớp quản lý tài nguyên và lập lịch cho các ứng dụng chạy trên cụm Hadoop.

Câu 10: Dữ liệu thu thập từ các cảm biến IoT hoặc luồng dữ liệu mạng xã hội thường được phân loại vào nhóm nào?

A. Dữ liệu có cấu trúc hoàn hảo (Structured data).
B. Dữ liệu phi cấu trúc hoặc bán cấu trúc (Unstructured/Semi-structured data).
C. Dữ liệu chỉ bao gồm các con số thống kê.
D. Dữ liệu tĩnh không thay đổi theo thời gian.

💡 Lời giải chi tiết:

Theo thực tế phân tích, dữ liệu từ IoT và mạng xã hội thường không có lược đồ cố định và bao gồm nhiều định dạng như văn bản, hình ảnh, JSON. Kết luận Lý giải Dữ liệu phi cấu trúc hoặc bán cấu trúc (Unstructured/Semi-structured data).

Câu 11: Trong kỹ thuật MapReduce, giai đoạn 'Shuffle' có nhiệm vụ chính là gì?

A. Xóa bỏ các dữ liệu trùng lặp trong tệp tin đầu vào.
B. Phân phối lại dữ liệu từ các máy trạm Map sao cho các cặp 'Key-Value' cùng khóa sẽ đến cùng một máy trạm Reduce.
C. Ghi kết quả cuối cùng của quá trình xử lý vào HDFS.
D. Thực hiện các phép toán thống kê như cộng, trung bình trên dữ liệu.

💡 Lời giải chi tiết:

Giai đoạn Shuffle là bước trung gian quan trọng để tập hợp và sắp xếp dữ liệu theo khóa trước khi chuyển sang giai đoạn rút gọn (Reduce). Kết luận Lý giải Phân phối lại dữ liệu từ các máy trạm Map sao cho các cặp 'Key-Value' cùng khóa sẽ đến cùng một máy trạm Reduce.

Câu 12: Đâu là khái niệm chính xác nhất về 'Data Lake'?

A. Một kho lưu trữ dữ liệu đã được xử lý và làm sạch để dùng cho báo cáo tài chính.
B. Một hệ thống chỉ lưu trữ các tệp tin hình ảnh và video dung lượng lớn.
C. Một kho lưu trữ tập trung cho phép lưu trữ mọi loại dữ liệu ở định dạng nguyên bản (Raw) cho đến khi cần sử dụng.
D. Một mạng lưới các máy chủ chỉ dùng để sao lưu dữ liệu dự phòng.

💡 Lời giải chi tiết:

Khác với Data Warehouse, Data Lake chấp nhận dữ liệu ở mọi trạng thái và định dạng, giúp linh hoạt hơn trong việc phân tích khám phá sau này. Kết luận Lý giải Một kho lưu trữ tập trung cho phép lưu trữ mọi loại dữ liệu ở định dạng nguyên bản (Raw) cho đến khi cần sử dụng.

Câu 13: Hệ thống Apache Kafka thường được sử dụng cho mục đích nào trong các dự án Big Data?

A. Lưu trữ dữ liệu vĩnh viễn thay thế cho HDFS.
B. Xây dựng các đường ống dẫn dữ liệu (Data pipelines) và xử lý luồng dữ liệu thời gian thực.
C. Chỉ dùng để nén dữ liệu trước khi gửi qua mạng.
D. Tạo giao diện người dùng cho các hệ thống BI.

💡 Lời giải chi tiết:

Kafka hoạt động như một hệ thống nhắn tin phân tán có khả năng mở rộng cực cao, chuyên dùng để vận chuyển và xử lý luồng dữ liệu tốc độ lớn. Kết luận Lý giải Xây dựng các đường ống dẫn dữ liệu (Data pipelines) và xử lý luồng dữ liệu thời gian thực.

Câu 14: Giá trị 'Replication Factor' mặc định trong hệ thống HDFS của Hadoop là bao nhiêu?

💡 Lời giải chi tiết:

Theo cấu hình tiêu chuẩn của Apache Hadoop, mỗi khối dữ liệu sẽ được sao chép ra 3 bản trên các DataNode khác nhau để đảm bảo an toàn dữ liệu. Kết luận Lý giải 3.

Câu 15: Apache Sqoop là công cụ được thiết kế để thực hiện nhiệm vụ gì?

A. Xử lý đồ thị dữ liệu với hàng tỷ nút.
B. Truyền dữ liệu hiệu quả giữa Hadoop và các cơ sở dữ liệu quan hệ (RDBMS).
C. Quản lý phiên bản mã nguồn cho các dự án Big Data.
D. Mã hóa dữ liệu nhạy cảm trên HDFS.

💡 Lời giải chi tiết:

Sqoop (viết tắt của SQL-to-Hadoop) cho phép nhập dữ liệu từ các bảng SQL vào HDFS/Hive và ngược lại một cách tự động và song song. Kết luận Lý giải Truyền dữ liệu hiệu quả giữa Hadoop và các cơ sở dữ liệu quan hệ (RDBMS).

Câu 16: Khái niệm 'Velocity' trong Big Data nhấn mạnh vào yếu tố nào?

A. Độ chính xác của các thuật toán dự báo.
B. Tốc độ mà dữ liệu được tạo ra và cần được xử lý kịp thời.
C. Kích thước của cơ sở dữ liệu sau khi nén.
D. Số lượng các thuộc tính trong một bảng dữ liệu.

💡 Lời giải chi tiết:

Velocity phản ánh sự gia tăng nhanh chóng về tần suất xuất hiện của dữ liệu, đòi hỏi các hệ thống phải có khả năng xử lý dòng chảy liên tục. Kết luận Lý giải Tốc độ mà dữ liệu được tạo ra và cần được xử lý kịp thời.

Câu 17: Trong Apache Spark, hành động (Action) khác với biến đổi (Transformation) ở điểm nào?

A. Action luôn được thực hiện ngay lập tức, trong khi Transformation sử dụng cơ chế 'Lazy evaluation'.
B. Transformation làm thay đổi dữ liệu gốc, còn Action thì không.
C. Action chỉ chạy trên máy chủ Master, còn Transformation chạy trên Worker.
D. Không có sự khác biệt về mặt logic giữa hai khái niệm này.

💡 Lời giải chi tiết:

Các Transformation chỉ xây dựng kế hoạch thực thi (DAG) và chỉ khi một Action được gọi thì Spark mới thực sự bắt đầu tính toán dữ liệu. Kết luận Lý giải Action luôn được thực hiện ngay lập tức, trong khi Transformation sử dụng cơ chế 'Lazy evaluation'.

Câu 18: Apache HBase là loại cơ sở dữ liệu gì trong hệ sinh thái Big Data?

A. Cơ sở dữ liệu quan hệ truyền thống chạy trên đám mây.
B. Cơ sở dữ liệu NoSQL kiểu 'Column-family' chạy trên nền tảng HDFS.
C. Hệ thống quản lý tệp tin cục bộ cho Windows.
D. Công cụ chỉ dùng để lập chỉ mục (Indexing) văn bản.

💡 Lời giải chi tiết:

HBase cung cấp khả năng truy cập ngẫu nhiên theo thời gian thực đối với dữ liệu cực lớn bằng cách tận dụng khả năng lưu trữ phân tán của HDFS. Kết luận Lý giải Cơ sở dữ liệu NoSQL kiểu 'Column-family' chạy trên nền tảng HDFS.

Câu 19: Mục tiêu chính của 'Data Sharding' là gì?

A. Tạo ra các bản sao lưu để khôi phục khi mất điện.
B. Chia nhỏ một tập dữ liệu lớn thành các phần nhỏ hơn (shards) để phân phối trên nhiều máy chủ nhằm tăng khả năng mở rộng ngang.
C. Mã hóa dữ liệu để đảm bảo tính bảo mật cá nhân.
D. Gộp nhiều bảng dữ liệu nhỏ thành một bảng lớn duy nhất.

💡 Lời giải chi tiết:

Sharding giúp giảm tải cho một máy chủ đơn lẻ bằng cách phân tán dữ liệu và các thao tác xử lý ra toàn bộ cụm máy tính. Kết luận Lý giải Chia nhỏ một tập dữ liệu lớn thành các phần nhỏ hơn (shards) để phân phối trên nhiều máy chủ nhằm tăng khả năng mở rộng ngang.

Câu 20: Thành phần nào giúp Apache Spark Streaming có thể xử lý luồng dữ liệu theo thời gian thực?

A. Sử dụng các tiến trình MapReduce truyền thống.
B. Chia luồng dữ liệu thành các đoạn nhỏ gọi là 'Micro-batches' để xử lý liên tục.
C. Dừng toàn bộ hệ thống để nạp dữ liệu mới vào hàng giờ.
D. Chỉ hỗ trợ dữ liệu đầu vào từ các tệp văn bản tĩnh.

💡 Lời giải chi tiết:

Mô hình micro-batch giúp Spark Streaming tận dụng được các thư viện xử lý lô mạnh mẽ của Spark để áp dụng cho dữ liệu luồng với độ trễ thấp. Kết luận Lý giải Chia luồng dữ liệu thành các đoạn nhỏ gọi là 'Micro-batches' để xử lý liên tục.

Câu 21: Trong Big Data, kỹ thuật 'In-memory processing' có nhược điểm tiềm tàng nào quan trọng nhất?

A. Tốc độ xử lý quá chậm so với đĩa cứng.
B. Chi phí đầu tư cho phần cứng (RAM) rất cao khi quy mô dữ liệu cực lớn.
C. Không thể thực hiện các phép toán phức tạp.
D. Dữ liệu sẽ bị xóa vĩnh viễn ngay sau khi máy tính khởi động lại mà không thể phục hồi.

💡 Lời giải chi tiết:

Mặc dù mang lại hiệu năng đột phá, nhưng việc duy trì toàn bộ dữ liệu trên RAM đòi hỏi ngân sách lớn cho hạ tầng máy chủ so với lưu trữ đĩa. Kết luận Lý giải Chi phí đầu tư cho phần cứng (RAM) rất cao khi quy mô dữ liệu cực lớn.

Câu 22: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

A. Chỉ tập trung vào việc bảo mật dữ liệu người dùng.
B. Kết hợp cả xử lý lô (Batch) để đảm bảo độ chính xác và xử lý luồng (Stream) để đảm bảo tốc độ phản hồi nhanh.
C. Thay thế hoàn toàn nhu cầu sử dụng trí tuệ nhân tạo.
D. Tối ưu hóa việc hiển thị dữ liệu trên các thiết bị di động.

💡 Lời giải chi tiết:

Kiến trúc Lambda cung cấp một mô hình cân bằng giữa việc xử lý dữ liệu lịch sử khổng lồ và việc cập nhật thông tin tức thời từ các luồng dữ liệu mới. Kết luận Lý giải Kết hợp cả xử lý lô (Batch) để đảm bảo độ chính xác và xử lý luồng (Stream) để đảm bảo tốc độ phản hồi nhanh.

Câu 23: Thuật ngữ 'Dark Data' trong lĩnh vực Big Data dùng để chỉ loại dữ liệu nào?

A. Dữ liệu đã bị hacker đánh cắp và mã hóa.
B. Dữ liệu được thu thập, xử lý và lưu trữ nhưng chưa được khai thác hoặc phân tích để tạo ra giá trị.
C. Dữ liệu về các hoạt động phi pháp trên mạng ngầm (Deep Web).
D. Dữ liệu rác hoàn toàn không có nội dung.

💡 Lời giải chi tiết:

Dark Data chiếm tỷ trọng lớn trong các doanh nghiệp, là nguồn tài nguyên tiềm năng bị lãng phí do thiếu công cụ hoặc quy trình phân tích phù hợp. Kết luận Lý giải Dữ liệu được thu thập, xử lý và lưu trữ nhưng chưa được khai thác hoặc phân tích để tạo ra giá trị.

Câu 24: Công cụ Apache Flume thường được ứng dụng hiệu quả nhất trong trường hợp nào?

A. Quản lý quyền truy cập cơ sở dữ liệu SQL.
B. Thu thập, tổng hợp và di chuyển một lượng lớn dữ liệu nhật ký (log data) vào HDFS.
C. Thiết kế giao diện cho ứng dụng di động.
D. Xử lý các giao dịch ngân hàng đòi hỏi tính nhất quán tuyệt đối.

💡 Lời giải chi tiết:

Flume được thiết kế như một dịch vụ phân tán, tin cậy để thu thập hiệu quả dữ liệu nhật ký từ nhiều nguồn máy chủ khác nhau về trung tâm lưu trữ. Kết luận Lý giải Thu thập, tổng hợp và di chuyển một lượng lớn dữ liệu nhật ký (log data) vào HDFS.

Câu 25: Mô hình 'BASE' trong hệ thống NoSQL là viết tắt của các đặc tính nào?

A. Basic Availability, Soft state, Eventual consistency.
B. Binary Access, Secure Environment.
C. Backup Always, Standard Encoding.
D. Batch Analysis, Structured Entry.

💡 Lời giải chi tiết:

Trái ngược với ACID trong SQL, mô hình BASE chấp nhận tính nhất quán tạm thời để đổi lấy tính sẵn sàng và khả năng mở rộng cao hơn cho Big Data. Kết luận Lý giải Basic Availability, Soft state, Eventual consistency.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 2 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 157 lượt làm

Làm ngay

Bộ 3 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 174 lượt làm

Làm ngay

Bộ 4 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 191 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 208 lượt làm

Làm ngay

Bộ 6 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 225 lượt làm

Làm ngay

Bộ 7 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Bộ trắc nghiệm 242 lượt làm

Làm ngay

Bộ 1 - Trắc nghiệm Dữ liệu lớn (BigData) online có đáp án

Kết quả của bạn:

Câu 1: Trong mô hình 5V của Dữ liệu lớn (Big Data), đặc điểm 'Veracity' đề cập đến khía cạnh nào?

Câu 2: Thành phần nào trong kiến trúc HDFS chịu trách nhiệm quản lý Metadata và điều phối truy cập của khách hàng?

Câu 3: Tại sao Apache Spark thường được đánh giá là nhanh hơn MapReduce trong nhiều tác vụ xử lý dữ liệu?

Câu 4: Trong hệ sinh thái Hadoop, công cụ nào được sử dụng để truy vấn dữ liệu bằng ngôn ngữ tương tự SQL?

Câu 5: Đặc tính nào của RDD (Resilient Distributed Dataset) trong Spark cho phép hệ thống tự phục hồi khi một nút gặp sự cố?

Câu 6: Hệ quản trị cơ sở dữ liệu MongoDB thuộc loại NoSQL nào dưới đây?

Câu 7: Định lý CAP phát biểu rằng một hệ thống phân tán không thể đồng thời đảm bảo cả ba yếu tố nào?

Câu 8: Định dạng tệp tin nào thường được ưu tiên trong Big Data để tối ưu hóa việc truy vấn theo cột và nén dữ liệu?

Câu 9: Thành phần YARN (Yet Another Resource Negotiator) trong Hadoop đóng vai trò chủ chốt là gì?

Câu 10: Dữ liệu thu thập từ các cảm biến IoT hoặc luồng dữ liệu mạng xã hội thường được phân loại vào nhóm nào?

Câu 11: Trong kỹ thuật MapReduce, giai đoạn 'Shuffle' có nhiệm vụ chính là gì?

Câu 12: Đâu là khái niệm chính xác nhất về 'Data Lake'?

Câu 13: Hệ thống Apache Kafka thường được sử dụng cho mục đích nào trong các dự án Big Data?

Câu 14: Giá trị 'Replication Factor' mặc định trong hệ thống HDFS của Hadoop là bao nhiêu?

Câu 15: Apache Sqoop là công cụ được thiết kế để thực hiện nhiệm vụ gì?

Câu 16: Khái niệm 'Velocity' trong Big Data nhấn mạnh vào yếu tố nào?

Câu 17: Trong Apache Spark, hành động (Action) khác với biến đổi (Transformation) ở điểm nào?

Câu 18: Apache HBase là loại cơ sở dữ liệu gì trong hệ sinh thái Big Data?

Câu 19: Mục tiêu chính của 'Data Sharding' là gì?

Câu 20: Thành phần nào giúp Apache Spark Streaming có thể xử lý luồng dữ liệu theo thời gian thực?

Câu 21: Trong Big Data, kỹ thuật 'In-memory processing' có nhược điểm tiềm tàng nào quan trọng nhất?

Câu 22: Kiến trúc Lambda (Lambda Architecture) trong Big Data được thiết kế để giải quyết vấn đề gì?

Câu 23: Thuật ngữ 'Dark Data' trong lĩnh vực Big Data dùng để chỉ loại dữ liệu nào?

Câu 24: Công cụ Apache Flume thường được ứng dụng hiệu quả nhất trong trường hợp nào?

Câu 25: Mô hình 'BASE' trong hệ thống NoSQL là viết tắt của các đặc tính nào?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top