Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên tiếng Việt, thách thức lớn nhất của 'Tách từ' (Word Segmentation) so với tiếng Anh là gì?

Câu 2: Sự khác biệt cốt lõi giữa 'Stemming' và 'Lemmatization' là gì?

Câu 3: Kỹ thuật 'Stop words removal' thường được thực hiện nhằm mục đích gì trong tiền xử lý văn bản?

Câu 4: Trong công thức tính TF-IDF, thành phần IDF (Inverse Document Frequency) giúp xác định điều gì?

Câu 5: Mô hình N-gram được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên?

Câu 6: Điểm khác biệt chính giữa kiến trúc Skip-gram và CBOW trong Word2Vec là gì?

Câu 7: Mô hình GloVe (Global Vectors for Word Representation) khác với Word2Vec ở điểm nào?

Câu 8: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

Câu 9: Trong Sentiment Analysis, mức độ 'Aspect-based Sentiment Analysis' khác gì so với mức độ 'Sentence-level'?

Câu 10: Thách thức lớn nhất trong bài toán 'Gán nhãn từ loại' (POS Tagging) là gì?

Câu 11: Sự khác biệt giữa Dependency Parsing và Constituency Parsing là gì?

Câu 12: Vấn đề 'Vanishing Gradient' trong mạng RNN truyền thống gây ra hệ quả gì?

Câu 13: Trong cấu trúc của LSTM, cổng nào chịu trách nhiệm quyết định thông tin nào từ trạng thái tế bào (cell state) cũ sẽ bị loại bỏ?

Câu 14: Cơ chế 'Attention' (Chú ý) giải quyết nhược điểm nào của kiến trúc Encoder-Decoder truyền thống trong dịch máy?

Câu 15: Tại sao kiến trúc Transformer lại ưu việt hơn RNN trong việc huấn luyện trên tập dữ liệu lớn?

Câu 16: Mục tiêu chính của nhiệm vụ 'Masked Language Modeling' (MLM) trong huấn luyện BERT là gì?

Câu 17: Sự khác biệt cơ bản giữa cách tiếp cận của GPT và BERT là gì?

Câu 18: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được dùng để đánh giá chất lượng của hệ thống nào?

Câu 19: Trong đánh giá tóm tắt văn bản, chỉ số ROUGE tập trung vào khía cạnh nào?

Câu 20: Chỉ số Perplexity (Độ hỗn loạn) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

Câu 21: Cơ chế 'Beam Search' giải quyết vấn đề gì trong quá trình sinh văn bản (Decoding)?

Câu 22: Thuật toán Byte Pair Encoding (BPE) được sử dụng để làm gì?

Câu 23: Trong mô hình Seq2Seq, 'Vector ngữ cảnh' (Context Vector) đóng vai trò gì?

Câu 24: Quá trình 'Fine-tuning' trong NLP thường được thực hiện như thế nào?

Câu 25: Khả năng 'Zero-shot learning' của các mô hình ngôn ngữ lớn (như GPT-3) nghĩa là gì?