Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'Tokenization' cấp độ từ trong tiếng Việt khác với tiếng Anh ở điểm cốt lõi nào?

Câu 2: Sự khác biệt chính giữa 'Stemming' và 'Lemmatization' trong quá trình tiền xử lý dữ liệu văn bản là gì?

Câu 3: Trong công thức TF-IDF, thành phần 'IDF' (Inverse Document Frequency) đóng vai trò chủ chốt nào?

Câu 4: Mô hình 'Skip-gram' trong kiến trúc Word2Vec hoạt động dựa trên nguyên lý cơ bản nào?

Câu 5: Tại sao cơ chế 'Attention' (Chú ý) lại tạo ra bước đột phá cho các mô hình dịch máy so với kiến trúc RNN truyền thống?

Câu 6: Đặc điểm nổi bật nhất của mô hình BERT (Bidirectional Encoder Representations from Transformers) là gì?

Câu 7: Trong bài toán 'Named Entity Recognition' (NER), mục tiêu chính của hệ thống là gì?

Câu 8: Độ đo BLEU (Bilingual Evaluation Understudy) thường được sử dụng phổ biến nhất để đánh giá chất lượng của hệ thống nào?

Câu 9: Khái niệm 'Perplexity' trong các mô hình ngôn ngữ (Language Models) có ý nghĩa như thế nào?

Câu 10: Hạn chế lớn nhất của phương pháp biểu diễn từ bằng 'One-hot encoding' là gì?

Câu 11: Kỹ thuật 'Byte Pair Encoding' (BPE) giải quyết vấn đề gì trong các mô hình ngôn ngữ hiện đại như GPT?

Câu 12: Trong kiến trúc Transformer, tại sao cần sử dụng 'Positional Encoding'?

Câu 13: Mô hình ngôn ngữ 'GPT' (Generative Pre-trained Transformer) chủ yếu sử dụng phần nào của kiến trúc Transformer gốc?

Câu 14: Lợi ích chính của việc sử dụng 'Pre-trained models' (Mô hình đã huấn luyện trước) trong NLP là gì?

Câu 15: Thuật toán 'Word2Vec' tạo ra các vector nhúng (embeddings) có đặc điểm gì nổi bật?

Câu 16: Trong bài toán phân loại sắc thái văn bản (Sentiment Analysis), thách thức nào sau đây là khó giải quyết nhất?

Câu 17: Mô hình 'ELMo' (Embeddings from Language Models) khác với Word2Vec ở điểm quan trọng nào?

Câu 18: Trong 'Dependency Parsing' (Phân tích cú pháp phụ thuộc), nhiệm vụ chính là gì?

Câu 19: Thành phần 'Softmax' ở lớp cuối cùng của một mô hình phân loại văn bản có tác dụng gì?

Câu 20: Kỹ thuật 'Data Augmentation' trong NLP thường được thực hiện bằng cách nào để tăng lượng dữ liệu huấn luyện?

Câu 21: Vấn đề 'Vanishing Gradient' (Biến mất đạo hàm) thường gặp trong mạng RNN truyền thống ảnh hưởng như thế nào đến xử lý văn bản?

Câu 22: Trong quá trình tiền xử lý, 'Stop words removal' (Loại bỏ từ dừng) có mục đích gì?

Câu 23: Hệ thống 'Chatbot' dựa trên mô hình ngôn ngữ lớn (LLM) hiện nay sử dụng cơ chế nào để duy trì ngữ cảnh hội thoại?

Câu 24: Thuật toán 'Cosine Similarity' được dùng để làm gì trong NLP?

Câu 25: Mô hình 'RoBERTa' cải tiến BERT ở điểm nào để đạt hiệu suất cao hơn?