Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), sự khác biệt chính giữa Stemming và Lemmatization là gì?

Câu 2: Mô hình Skip-gram trong thuật toán Word2Vec được thiết kế để thực hiện nhiệm vụ nào sau đây?

Câu 3: Tại sao cơ chế 'Attention' (Chú ý) lại quan trọng trong các mô hình dịch máy nơ-ron (NMT)?

Câu 4: Kiến trúc BERT (Bidirectional Encoder Representations from Transformers) chủ yếu dựa trên thành phần nào của Transformer?

Câu 5: Nhiệm vụ huấn luyện chính của mô hình GPT (Generative Pre-trained Transformer) là gì?

Câu 6: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

Câu 7: Vấn đề chính mà các mạng LSTM (Long Short-Term Memory) giải quyết so với mạng RNN truyền thống là gì?

Câu 8: Kỹ thuật 'Chain of Thought' (CoT) trong các mô hình ngôn ngữ lớn (LLM) có mục đích chính là gì?

Câu 9: Thách thức đặc thù lớn nhất khi thực hiện Tokenization (tách từ) cho tiếng Việt so với tiếng Anh là gì?

Câu 10: Cơ chế 'Multi-head Attention' trong Transformer mang lại lợi ích gì?

Câu 11: Phương pháp 'Low-Rank Adaptation' (LoRA) được sử dụng trong quá trình tinh chỉnh (fine-tuning) LLM nhằm mục đích gì?

Câu 12: Trong hệ thống RAG (Retrieval-Augmented Generation), vai trò của thành phần 'Retrieval' là gì?

Câu 13: Nhiệm vụ Named Entity Recognition (NER) trong NLP thực hiện công việc cụ thể nào?

Câu 14: Tại sao 'Beam Search' thường được ưu tiên hơn 'Greedy Search' trong các bài toán sinh văn bản?

Câu 15: Ưu điểm chính của FastText so với Word2Vec là gì?

Câu 16: Chỉ số 'Perplexity' (Độ rối loạn) trong mô hình ngôn ngữ dùng để đo lường điều gì?

Câu 17: Cấu trúc Encoder-only (như BERT) thường phù hợp nhất cho loại tác vụ nào?

Câu 18: Sự khác biệt giữa 'Zero-shot' và 'Few-shot' prompting là gì?

Câu 19: Tham số 'Temperature' trong quá trình giải mã (decoding) của LLM ảnh hưởng như thế nào đến kết quả đầu ra?

Câu 20: Tác vụ Part-of-Speech (POS) Tagging có mục tiêu chính là gì?

Câu 21: Tại sao việc loại bỏ 'Stop words' (từ dừng) lại thường được thực hiện trong các bài toán phân loại văn bản truyền thống?

Câu 22: Trong không gian vector, độ tương đồng Cosine (Cosine Similarity) giữa hai vector từ đo lường điều gì?

Câu 23: Thành phần 'Positional Encoding' trong Transformer có vai trò gì?

Câu 24: Kỹ thuật 'Teacher Forcing' trong huấn luyện mô hình Sequence-to-Sequence là gì?

Câu 25: Mục đích chính của việc áp dụng RLHF (Reinforcement Learning from Human Feedback) cho các mô hình như ChatGPT là gì?