Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Lưu ý: Nội dung trong bài Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên tiếng Việt, thách thức lớn nhất của 'Tách từ' (Word Segmentation) so với tiếng Anh là gì?

Câu 2: Sự khác biệt cốt lõi giữa 'Stemming' và 'Lemmatization' là gì?

Câu 3: Kỹ thuật 'Stop words removal' thường được thực hiện nhằm mục đích gì trong tiền xử lý văn bản?

Câu 4: Trong công thức tính TF-IDF, thành phần IDF (Inverse Document Frequency) giúp xác định điều gì?

Câu 5: Mô hình N-gram được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên?

Câu 6: Điểm khác biệt chính giữa kiến trúc Skip-gram và CBOW trong Word2Vec là gì?

Câu 7: Mô hình GloVe (Global Vectors for Word Representation) khác với Word2Vec ở điểm nào?

Câu 8: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

Câu 9: Trong Sentiment Analysis, mức độ 'Aspect-based Sentiment Analysis' khác gì so với mức độ 'Sentence-level'?

Câu 10: Thách thức lớn nhất trong bài toán 'Gán nhãn từ loại' (POS Tagging) là gì?

Câu 11: Sự khác biệt giữa Dependency Parsing và Constituency Parsing là gì?

Câu 12: Vấn đề 'Vanishing Gradient' trong mạng RNN truyền thống gây ra hệ quả gì?

Câu 13: Trong cấu trúc của LSTM, cổng nào chịu trách nhiệm quyết định thông tin nào từ trạng thái tế bào (cell state) cũ sẽ bị loại bỏ?

Câu 14: Cơ chế 'Attention' (Chú ý) giải quyết nhược điểm nào của kiến trúc Encoder-Decoder truyền thống trong dịch máy?

Câu 15: Tại sao kiến trúc Transformer lại ưu việt hơn RNN trong việc huấn luyện trên tập dữ liệu lớn?

Câu 16: Mục tiêu chính của nhiệm vụ 'Masked Language Modeling' (MLM) trong huấn luyện BERT là gì?

Câu 17: Sự khác biệt cơ bản giữa cách tiếp cận của GPT và BERT là gì?

Câu 18: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được dùng để đánh giá chất lượng của hệ thống nào?

Câu 19: Trong đánh giá tóm tắt văn bản, chỉ số ROUGE tập trung vào khía cạnh nào?

Câu 20: Chỉ số Perplexity (Độ hỗn loạn) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

Câu 21: Cơ chế 'Beam Search' giải quyết vấn đề gì trong quá trình sinh văn bản (Decoding)?

Câu 22: Thuật toán Byte Pair Encoding (BPE) được sử dụng để làm gì?

Câu 23: Trong mô hình Seq2Seq, 'Vector ngữ cảnh' (Context Vector) đóng vai trò gì?

Câu 24: Quá trình 'Fine-tuning' trong NLP thường được thực hiện như thế nào?

Câu 25: Khả năng 'Zero-shot learning' của các mô hình ngôn ngữ lớn (như GPT-3) nghĩa là gì?