Quay lại danh mục Trắc nghiệm Xử lý ngôn ngữ tự nhiên

Trang chủ
Trắc nghiệm
Trắc nghiệm Xử lý ngôn ngữ tự nhiên
Bộ 2 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 2 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Sự khác biệt chính giữa 'Stemming' và 'Lemmatization' trong tiền xử lý văn bản là gì?

A. Stemming cắt bỏ phần đuôi từ dựa trên quy tắc cứng nhắc, trong khi Lemmatization đưa từ về dạng gốc (lemma) dựa trên từ điển và phân tích hình thái học.
B. Stemming luôn tạo ra các từ có nghĩa trong từ điển, còn Lemmatization chỉ đơn thuần cắt bỏ các tiền tố và hậu tố của từ.
C. Cả hai kỹ thuật đều thực hiện cùng một thuật toán nhưng Lemmatization được sử dụng cho các ngôn ngữ không phải tiếng Anh.
D. Stemming là quá trình phân tích ngữ pháp phức tạp hơn Lemmatization để tìm ra căn tố của từ trong mọi ngữ cảnh văn bản.

💡 Lời giải chi tiết:

Theo phân tích phổ biến trong NLP, Lemmatization sử dụng kiến thức ngôn ngữ học để tìm từ gốc có nghĩa, trong khi Stemming thường chỉ sử dụng các quy tắc heuristic để cắt tỉa ký tự. Kết luận Lý giải Stemming cắt bỏ phần đuôi từ dựa trên quy tắc cứng nhắc, trong khi Lemmatization đưa từ về dạng gốc (lemma) dựa trên từ điển và phân tích hình thái học.

Câu 2: Trong kỹ thuật TF-IDF, thành phần 'Inverse Document Frequency' (IDF) có vai trò chủ yếu là gì?

A. Tăng trọng số cho các từ xuất hiện rất thường xuyên trong tất cả các tài liệu của tập dữ liệu.
B. Giảm trọng số của các từ phổ biến và tăng trọng số cho các từ mang tính đặc trưng, hiếm gặp trong tập dữ liệu.
C. Đếm tổng số lần một từ xuất hiện trong một tài liệu cụ thể để xác định chủ đề chính của tài liệu đó.
D. Loại bỏ hoàn toàn các từ dừng (stop words) khỏi văn bản trước khi thực hiện các bước phân tích vector hóa.

💡 Lời giải chi tiết:

Giá trị IDF giúp mô hình nhận diện các từ có giá trị thông tin cao bằng cách giảm nhẹ tầm quan trọng của các từ xuất hiện đại trà trong mọi văn bản. Kết luận Lý giải Giảm trọng số của các từ phổ biến và tăng trọng số cho các từ mang tính đặc trưng, hiếm gặp trong tập dữ liệu.

Câu 3: Cơ chế 'Self-Attention' (Tự chú ý) trong kiến trúc Transformer giải quyết vấn đề nào của mô hình RNN truyền thống?

A. Hạn chế việc sử dụng quá nhiều bộ nhớ khi huấn luyện các tập dữ liệu văn bản có quy mô lớn.
B. Loại bỏ hoàn toàn nhu cầu về hàm kích hoạt phi tuyến trong các lớp ẩn của mạng thần kinh.
C. Cho phép tính toán song song và nắm bắt mối quan hệ phụ thuộc xa giữa các từ trong câu một cách hiệu quả hơn.
D. Giảm số lượng tham số cần huấn luyện giúp mô hình Transformer chạy nhanh hơn trên các thiết bị di động yếu.

💡 Lời giải chi tiết:

Cơ chế Self-Attention cho phép mô hình quan sát toàn bộ các từ trong chuỗi cùng lúc thay vì xử lý tuần tự, giúp xử lý các phụ thuộc dài hiệu quả. Kết luận Lý giải Cho phép tính toán song song và nắm bắt mối quan hệ phụ thuộc xa giữa các từ trong câu một cách hiệu quả hơn.

Câu 4: Sự khác biệt cơ bản giữa hai mô hình kiến trúc của Word2Vec là 'Skip-gram' và 'CBOW' là gì?

A. CBOW dùng từ mục tiêu để đoán các từ ngữ cảnh, còn Skip-gram dùng các từ ngữ cảnh để đoán từ mục tiêu.
B. Skip-gram thường hiệu quả hơn với các tập dữ liệu nhỏ và các từ hiếm, trong khi CBOW huấn luyện nhanh hơn trên các từ phổ biến.
C. CBOW là mô hình mạng Transformer còn Skip-gram là mô hình mạng Recurrent Neural Network (RNN) cải tiến.
D. Skip-gram chỉ xử lý được các từ đơn, còn CBOW có khả năng xử lý các cụm từ phức tạp và câu dài.

💡 Lời giải chi tiết:

Dựa trên thực nghiệm của Mikolov và cộng sự, Skip-gram hoạt động tốt với từ hiếm do cách thiết lập bài toán dự đoán ngữ cảnh từ một từ đích. Kết luận Lý giải Skip-gram thường hiệu quả hơn với các tập dữ liệu nhỏ và các từ hiếm, trong khi CBOW huấn luyện nhanh hơn trên các từ phổ biến.

Câu 5: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

A. Độ chính xác của việc phân loại cảm xúc văn bản.
B. Chất lượng của các mô hình dịch mã máy so với bản dịch của con người.
C. Khả năng nhận diện thực thể có tên trong một đoạn văn phức tạp.
D. Tốc độ xử lý dữ liệu của các mô hình ngôn ngữ lớn (LLM).

💡 Lời giải chi tiết:

BLEU đo lường sự tương đồng giữa văn bản máy dịch và các văn bản tham chiếu do con người dịch dựa trên độ trùng lặp n-gram. Kết luận Lý giải Chất lượng của các mô hình dịch mã máy so với bản dịch của con người.

Câu 6: Mục tiêu chính của tác vụ 'Named Entity Recognition' (NER) là gì?

A. Xác định cấu trúc cú pháp và mối quan hệ giữa các thành phần chủ ngữ, vị ngữ trong câu.
B. Phân loại các từ trong văn bản thành các danh mục như tên người, tổ chức, địa danh, thời gian.
C. Chuyển đổi các từ thành các vector biểu diễn không gian có số chiều thấp.
D. Tóm tắt một đoạn văn dài thành một câu ngắn gọn mà vẫn giữ nguyên ý chính.

💡 Lời giải chi tiết:

NER tập trung vào việc định vị và phân loại các thực thể thông tin quan trọng trong văn bản vào các nhóm định trước. Kết luận Lý giải Phân loại các từ trong văn bản thành các danh mục như tên người, tổ chức, địa danh, thời gian.

Câu 7: Vấn đề 'Vanishing Gradient' (Biến mất đạo hàm) trong mạng RNN ảnh hưởng như thế nào đến việc xử lý ngôn ngữ?

A. Làm cho mô hình chỉ học được các mối quan hệ ngắn hạn và quên mất thông tin từ các từ ở xa trong câu.
B. Khiến cho trọng số của mạng tăng lên quá lớn dẫn đến việc tràn số trong quá trình tính toán.
C. Làm cho mô hình không thể nhận diện được các từ dừng (stop words) trong quá trình tiền xử lý.
D. Khiến cho hàm mất mát (loss function) không bao giờ đạt được giá trị tối tiểu dù huấn luyện lâu.

💡 Lời giải chi tiết:

Khi đạo hàm tiến về 0 trong quá trình lan truyền ngược qua nhiều bước thời gian, thông tin từ các trạng thái xa phía trước không còn tác động đến việc cập nhật trọng số. Kết luận Lý giải Làm cho mô hình chỉ học được các mối quan hệ ngắn hạn và quên mất thông tin từ các từ ở xa trong câu.

Câu 8: Tại sao mô hình BERT được gọi là mô hình ngôn ngữ 'Bidirectional' (Hai chiều)?

A. Vì nó có khả năng dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác và ngược lại.
B. Vì nó đọc văn bản từ trái sang phải một lần và từ phải sang trái một lần rồi kết hợp kết quả.
C. Vì nó xem xét ngữ cảnh của một từ từ cả phía bên trái và bên phải đồng thời trong tất cả các lớp.
D. Vì nó sử dụng hai bộ mã hóa (encoder) độc lập cho hai loại ngôn ngữ khác nhau.

💡 Lời giải chi tiết:

Khác với các mô hình tuần tự, BERT sử dụng cơ chế Masked Language Model để học ngữ cảnh từ cả hai phía của một từ trong cùng một thời điểm. Kết luận Lý giải Vì nó xem xét ngữ cảnh của một từ từ cả phía bên trái và bên phải đồng thời trong tất cả các lớp.

Câu 9: Kiến trúc của các mô hình dòng GPT (như GPT-3, GPT-4) chủ yếu dựa trên thành phần nào của Transformer?

A. Chỉ sử dụng phần Encoder (Bộ mã hóa).
B. Sử dụng cả Encoder và Decoder nối tiếp nhau.
C. Chỉ sử dụng phần Decoder (Bộ giải mã).
D. Sử dụng một cấu trúc hoàn toàn mới không liên quan đến Transformer.

💡 Lời giải chi tiết:

Các mô hình GPT là các mô hình ngôn ngữ tự hồi quy (autoregressive) được xây dựng dựa trên các lớp Decoder xếp chồng lên nhau của Transformer. Kết luận Lý giải Chỉ sử dụng phần Decoder (Bộ giải mã).

Câu 10: Trong bài toán phân loại cảm xúc (Sentiment Analysis) với tập dữ liệu mất cân bằng nghiêm trọng, chỉ số nào phản ánh hiệu năng tốt hơn Accuracy?

A. Chỉ số L1-norm.
B. F1-Score.
C. Tỷ lệ từ dừng (Stop words ratio).
D. Số lượng tham số của mô hình.

💡 Lời giải chi tiết:

F1-Score là trung bình điều hòa giữa Precision và Recall, giúp đánh giá chính xác khả năng của mô hình trên cả lớp thiểu số thay vì chỉ nhìn vào tổng số câu đúng. Kết luận Lý giải F1-Score.

Câu 11: Chỉ số 'Perplexity' (Độ rối rắm) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

A. Mô hình đang gặp khó khăn trong việc dự đoán từ tiếp theo.
B. Mô hình có khả năng dự đoán từ tiếp theo trong chuỗi một cách chính xác và tự tin hơn.
C. Tập dữ liệu huấn luyện chứa quá nhiều lỗi chính tả và nhiễu văn bản.
D. Mô hình có quá nhiều lớp ẩn gây ra hiện tượng quá khớp (overfitting).

💡 Lời giải chi tiết:

Perplexity là thước đo mức độ bất ngờ của mô hình khi gặp dữ liệu mới; giá trị thấp hơn đồng nghĩa với việc phân phối xác suất của mô hình sát với dữ liệu thực tế. Kết luận Lý giải Mô hình có khả năng dự đoán từ tiếp theo trong chuỗi một cách chính xác và tự tin hơn.

Câu 12: Kỹ thuật 'Byte Pair Encoding' (BPE) giải quyết vấn đề gì trong Tokenization?

A. Giảm thời gian huấn luyện mô hình bằng cách loại bỏ các ký tự đặc biệt.
B. Xử lý các từ chưa từng xuất hiện (Out-of-vocabulary) bằng cách chia từ thành các đơn vị dưới cấp từ (subwords).
C. Tăng cường độ dài của câu để mô hình có nhiều ngữ cảnh hơn.
D. Đảm bảo mọi từ trong văn bản đều được viết hoa ở chữ cái đầu tiên.

💡 Lời giải chi tiết:

BPE giúp mô hình biểu diễn các từ hiếm hoặc từ mới thông qua các mảnh từ (subword units) phổ biến đã được học trong từ điển. Kết luận Lý giải Xử lý các từ chưa từng xuất hiện (Out-of-vocabulary) bằng cách chia từ thành các đơn vị dưới cấp từ (subwords).

Câu 13: Hàm Softmax thường được sử dụng ở lớp cuối cùng của mô hình phân loại văn bản để làm gì?

A. Để nén các giá trị vector đầu ra về khoảng từ -1 đến 1.
B. Để biến đổi các điểm số đầu ra (logits) thành một phân phối xác suất có tổng bằng 1.
C. Để lọc bỏ các đặc trưng không quan trọng trước khi đưa ra dự đoán cuối cùng.
D. Để tính toán khoảng cách Cosine giữa văn bản đầu vào và các nhãn mục tiêu.

💡 Lời giải chi tiết:

Softmax chuyển đổi các giá trị thực từ lớp tuyến tính cuối cùng thành xác suất cho mỗi lớp phân loại, giúp dễ dàng xác định nhãn có khả năng nhất. Kết luận Lý giải Để biến đổi các điểm số đầu ra (logits) thành một phân phối xác suất có tổng bằng 1.

Câu 14: Trong quá trình giải mã (decoding) của mô hình sinh văn bản, 'Beam Search' khác 'Greedy Search' ở điểm nào?

A. Beam Search luôn chọn từ có xác suất cao nhất tại mỗi bước mà không xem xét các lựa chọn khác.
B. Beam Search duy trì một số lượng 'k' ứng cử viên có xác suất cao nhất thay vì chỉ chọn một lựa chọn tốt nhất cục bộ.
C. Greedy Search tốn nhiều tài nguyên tính toán hơn hẳn so với Beam Search.
D. Beam Search chỉ được dùng cho tác vụ phân loại còn Greedy Search dùng cho dịch máy.

💡 Lời giải chi tiết:

Beam Search giúp tìm ra chuỗi văn bản có tổng xác suất cao hơn bằng cách khám phá đồng thời nhiều nhánh tiềm năng thay vì chọn mù quáng từ tốt nhất tại từng bước. Kết luận Lý giải Beam Search duy trì một số lượng 'k' ứng cử viên có xác suất cao nhất thay vì chỉ chọn một lựa chọn tốt nhất cục bộ.

Câu 15: Tại sao các 'Contextual Embeddings' (như của BERT) lại ưu việt hơn 'Static Embeddings' (như Word2Vec)?

A. Vì chúng chiếm ít dung lượng lưu trữ hơn trên đĩa cứng.
B. Vì cùng một từ sẽ có vector biểu diễn khác nhau tùy thuộc vào các từ xung quanh nó trong câu.
C. Vì chúng không yêu cầu quá trình huấn luyện trên các tập dữ liệu lớn.
D. Vì chúng có thể hoạt động mà không cần sử dụng card đồ họa (GPU).

💡 Lời giải chi tiết:

Contextual Embeddings cho phép phân biệt ý nghĩa của các từ đồng âm khác nghĩa bằng cách thay đổi giá trị vector dựa trên ngữ cảnh cụ thể của từ đó trong câu. Kết luận Lý giải Vì cùng một từ sẽ có vector biểu diễn khác nhau tùy thuộc vào các từ xung quanh nó trong câu.

Câu 16: Trong ngữ cảnh huấn luyện LLM, 'Zero-shot learning' có nghĩa là gì?

A. Mô hình thực hiện một tác vụ mà không nhận được bất kỳ ví dụ mẫu cụ thể nào trong câu lệnh (prompt).
B. Mô hình được huấn luyện với 0 tham số để tiết kiệm năng lượng.
C. Mô hình hoàn toàn không sử dụng dữ liệu từ internet trong quá trình học tập.
D. Mô hình bị xóa bỏ toàn bộ bộ nhớ sau mỗi lần người dùng đặt câu hỏi.

💡 Lời giải chi tiết:

Zero-shot learning thể hiện khả năng tổng quát hóa mạnh mẽ của mô hình khi giải quyết vấn đề chỉ dựa trên mô tả tác vụ mà không cần ví dụ minh họa. Kết luận Lý giải Mô hình thực hiện một tác vụ mà không nhận được bất kỳ ví dụ mẫu cụ thể nào trong câu lệnh (prompt).

Câu 17: Nhiệm vụ huấn luyện 'Masked Language Modeling' (MLM) của BERT yêu cầu mô hình làm gì?

A. Dự đoán câu tiếp theo dựa trên câu hiện tại.
B. Dự đoán các từ đã bị che đi (mask) trong một câu dựa trên ngữ cảnh xung quanh.
C. Dịch các từ bị che từ tiếng Anh sang một ngôn ngữ đích khác.
D. Xác định xem một câu có chứa lỗi ngữ pháp hay không.

💡 Lời giải chi tiết:

Trong MLM, một tỷ lệ phần trăm các token đầu vào được thay thế bằng ký hiệu đặc biệt [MASK] và mô hình phải học cách khôi phục chúng. Kết luận Lý giải Dự đoán các từ đã bị che đi (mask) trong một câu dựa trên ngữ cảnh xung quanh.

Câu 18: Chỉ số ROUGE thường được ưu tiên sử dụng để đánh giá tác vụ nào sau đây?

A. Phân tích cú pháp cây.
B. Tóm tắt văn bản (Text Summarization).
C. Nhận diện giọng nói.
D. Phân loại thư rác (Spam detection).

💡 Lời giải chi tiết:

ROUGE đo lường độ phủ của các n-gram trong văn bản tóm tắt do máy tạo so với các bản tóm tắt chuẩn của con người. Kết luận Lý giải Tóm tắt văn bản (Text Summarization).

Câu 19: Hàm mất mát 'Cross-Entropy Loss' phổ biến nhất trong tác vụ nào của NLP?

A. Trích xuất từ khóa.
B. Phân loại văn bản (Text Classification).
C. Đo lường độ tương đồng văn bản.
D. Nén dữ liệu văn bản.

💡 Lời giải chi tiết:

Cross-Entropy đo lường sự khác biệt giữa phân phối xác suất dự đoán của mô hình và nhãn thực tế, rất phù hợp cho các bài toán phân loại đa lớp. Kết luận Lý giải Phân loại văn bản (Text Classification).

Câu 20: Việc sử dụng 'Multi-head Attention' thay vì một đầu Attention duy nhất trong Transformer có tác dụng gì?

A. Làm cho mô hình chạy nhanh hơn trên CPU đơn nhân.
B. Cho phép mô hình đồng thời tập trung vào các khía cạnh thông tin khác nhau tại các vị trí khác nhau trong câu.
C. Giảm thiểu hiện tượng quá khớp (overfitting) bằng cách chia nhỏ dữ liệu đầu vào.
D. Để mô hình có thể xử lý được nhiều ngôn ngữ cùng một lúc trong cùng một lớp.

💡 Lời giải chi tiết:

Mỗi 'head' trong Multi-head Attention học cách chú ý đến các mối quan hệ cú pháp và ngữ nghĩa khác nhau, tạo nên sự biểu diễn phong phú hơn. Kết luận Lý giải Cho phép mô hình đồng thời tập trung vào các khía cạnh thông tin khác nhau tại các vị trí khác nhau trong câu.

Câu 21: Trong trường hợp nào việc loại bỏ 'Stop words' có thể gây hại đến hiệu suất của mô hình NLP?

A. Khi xây dựng hệ thống lọc thư rác đơn giản dựa trên từ khóa.
B. Trong bài toán Phân tích cảm xúc (Sentiment Analysis) khi các từ như 'not' mang ý nghĩa phủ định quan trọng.
C. Khi thực hiện đếm tần suất xuất hiện của các danh từ riêng trong văn bản.
D. Trong tác vụ nén dữ liệu văn bản để tiết kiệm không gian lưu trữ.

💡 Lời giải chi tiết:

Các từ dừng như 'not', 'no', 'never' đóng vai trò quyết định trong việc thay đổi hoàn toàn sắc thái cảm xúc của câu văn. Kết luận Lý giải Trong bài toán Phân tích cảm xúc (Sentiment Analysis) khi các từ như 'not' mang ý nghĩa phủ định quan trọng.

Câu 22: Tác vụ 'Dependency Parsing' trong NLP nhằm mục đích gì?

A. Phân chia câu thành các cụm từ danh từ và cụm từ động từ độc lập.
B. Xác định các mối quan hệ ngữ pháp giữa các từ 'đứng đầu' và các từ 'phụ thuộc' trong câu.
C. Đếm số lượng âm tiết trong mỗi từ của câu văn.
D. Dự đoán xác suất xuất hiện của từ tiếp theo dựa trên lịch sử các từ trước đó.

💡 Lời giải chi tiết:

Dependency Parsing tạo ra một cấu trúc cây thể hiện cách các từ trong câu liên kết với nhau thông qua các quan hệ phụ thuộc như chủ ngữ, tân ngữ. Kết luận Lý giải Xác định các mối quan hệ ngữ pháp giữa các từ 'đứng đầu' và các từ 'phụ thuộc' trong câu.

Câu 23: Tham số 'Temperature' (Nhiệt độ) trong quá trình sinh văn bản của LLM điều chỉnh điều gì?

A. Tốc độ phần cứng khi xử lý các truy vấn của người dùng.
B. Độ ngẫu nhiên và tính sáng tạo của văn bản được tạo ra bằng cách làm phẳng phân phối xác suất của từ.
C. Số lượng từ tối đa mà mô hình được phép sinh ra trong một lần phản hồi.
D. Độ chính xác về mặt ngữ pháp của câu văn được tạo ra.

💡 Lời giải chi tiết:

Nhiệt độ cao làm phân phối xác suất trở nên đồng đều hơn, khuyến khích mô hình chọn các từ ít có khả năng hơn, từ đó tăng tính đa dạng. Kết luận Lý giải Độ ngẫu nhiên và tính sáng tạo của văn bản được tạo ra bằng cách làm phẳng phân phối xác suất của từ.

Câu 24: Mục đích của việc sử dụng 'Dropout' trong huấn luyện các mạng thần kinh sâu cho NLP là gì?

A. Để tăng tốc độ tính toán bằng cách bỏ qua một số lớp mạng.
B. Ngăn chặn hiện tượng quá khớp (overfitting) bằng cách ngẫu nhiên tắt một số nút mạng trong quá trình huấn luyện.
C. Để tự động xóa các dữ liệu văn bản bị lỗi trong tập huấn luyện.
D. Để nén mô hình giúp nó có thể chạy trên trình duyệt web.

💡 Lời giải chi tiết:

Dropout buộc mạng không được quá phụ thuộc vào một nhóm nhỏ các neuron, từ đó cải thiện khả năng tổng quát hóa trên dữ liệu mới. Kết luận Lý giải Ngăn chặn hiện tượng quá khớp (overfitting) bằng cách ngẫu nhiên tắt một số nút mạng trong quá trình huấn luyện.

Câu 25: Sự khác biệt chính giữa 'Fine-tuning' và 'Prompt Engineering' là gì?

A. Fine-tuning thay đổi trọng số của mô hình bằng dữ liệu bổ sung, còn Prompt Engineering chỉ thay đổi cách đặt câu hỏi đầu vào.
B. Prompt Engineering yêu cầu nhiều tài nguyên tính toán hơn hẳn so với Fine-tuning.
C. Fine-tuning chỉ áp dụng được cho mô hình BERT, còn Prompt Engineering chỉ dành cho GPT.
D. Cả hai đều là quá trình huấn luyện lại mô hình từ đầu với tập dữ liệu hoàn toàn mới.

💡 Lời giải chi tiết:

Fine-tuning là một quá trình học có giám sát tác động vào tham số mô hình, trong khi Prompt Engineering tận dụng khả năng sẵn có của mô hình thông qua ngữ cảnh đầu vào. Kết luận Lý giải Fine-tuning thay đổi trọng số của mô hình bằng dữ liệu bổ sung, còn Prompt Engineering chỉ thay đổi cách đặt câu hỏi đầu vào.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 3 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 194 lượt làm

Làm ngay

Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 211 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 228 lượt làm

Làm ngay

Bộ 6 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 245 lượt làm

Làm ngay

Bộ 7 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 262 lượt làm

Làm ngay

Bộ 8 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 279 lượt làm

Làm ngay

Bộ 2 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Kết quả của bạn:

Câu 1: Sự khác biệt chính giữa 'Stemming' và 'Lemmatization' trong tiền xử lý văn bản là gì?

Câu 2: Trong kỹ thuật TF-IDF, thành phần 'Inverse Document Frequency' (IDF) có vai trò chủ yếu là gì?

Câu 3: Cơ chế 'Self-Attention' (Tự chú ý) trong kiến trúc Transformer giải quyết vấn đề nào của mô hình RNN truyền thống?

Câu 4: Sự khác biệt cơ bản giữa hai mô hình kiến trúc của Word2Vec là 'Skip-gram' và 'CBOW' là gì?

Câu 5: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

Câu 6: Mục tiêu chính của tác vụ 'Named Entity Recognition' (NER) là gì?

Câu 7: Vấn đề 'Vanishing Gradient' (Biến mất đạo hàm) trong mạng RNN ảnh hưởng như thế nào đến việc xử lý ngôn ngữ?

Câu 8: Tại sao mô hình BERT được gọi là mô hình ngôn ngữ 'Bidirectional' (Hai chiều)?

Câu 9: Kiến trúc của các mô hình dòng GPT (như GPT-3, GPT-4) chủ yếu dựa trên thành phần nào của Transformer?

Câu 10: Trong bài toán phân loại cảm xúc (Sentiment Analysis) với tập dữ liệu mất cân bằng nghiêm trọng, chỉ số nào phản ánh hiệu năng tốt hơn Accuracy?

Câu 11: Chỉ số 'Perplexity' (Độ rối rắm) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

Câu 12: Kỹ thuật 'Byte Pair Encoding' (BPE) giải quyết vấn đề gì trong Tokenization?

Câu 13: Hàm Softmax thường được sử dụng ở lớp cuối cùng của mô hình phân loại văn bản để làm gì?

Câu 14: Trong quá trình giải mã (decoding) của mô hình sinh văn bản, 'Beam Search' khác 'Greedy Search' ở điểm nào?

Câu 15: Tại sao các 'Contextual Embeddings' (như của BERT) lại ưu việt hơn 'Static Embeddings' (như Word2Vec)?

Câu 16: Trong ngữ cảnh huấn luyện LLM, 'Zero-shot learning' có nghĩa là gì?

Câu 17: Nhiệm vụ huấn luyện 'Masked Language Modeling' (MLM) của BERT yêu cầu mô hình làm gì?

Câu 18: Chỉ số ROUGE thường được ưu tiên sử dụng để đánh giá tác vụ nào sau đây?

Câu 19: Hàm mất mát 'Cross-Entropy Loss' phổ biến nhất trong tác vụ nào của NLP?

Câu 20: Việc sử dụng 'Multi-head Attention' thay vì một đầu Attention duy nhất trong Transformer có tác dụng gì?

Câu 21: Trong trường hợp nào việc loại bỏ 'Stop words' có thể gây hại đến hiệu suất của mô hình NLP?

Câu 22: Tác vụ 'Dependency Parsing' trong NLP nhằm mục đích gì?

Câu 23: Tham số 'Temperature' (Nhiệt độ) trong quá trình sinh văn bản của LLM điều chỉnh điều gì?

Câu 24: Mục đích của việc sử dụng 'Dropout' trong huấn luyện các mạng thần kinh sâu cho NLP là gì?

Câu 25: Sự khác biệt chính giữa 'Fine-tuning' và 'Prompt Engineering' là gì?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top