Bộ 6 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 6 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'Lemmatization' khác với 'Stemming' ở điểm cốt lõi nào?

Câu 2: Mô hình Word2Vec sử dụng kiến trúc Skip-gram nhằm mục đích chính là gì?

Câu 3: Chỉ số TF-IDF (Term Frequency - Inverse Document Frequency) được dùng để đánh giá điều gì trong một tập văn bản?

Câu 4: Tại sao cơ chế 'Attention' (Chú ý) lại giải quyết được nhược điểm của các mô hình RNN truyền thống trong dịch máy?

Câu 5: Trong kiến trúc Transformer, 'Positional Encoding' (Mã hóa vị trí) được thêm vào với mục đích gì?

Câu 6: Đặc điểm nổi bật nhất của mô hình BERT (Bidirectional Encoder Representations from Transformers) là gì?

Câu 7: Trong bài toán 'Named Entity Recognition' (NER), mục tiêu chính là gì?

Câu 8: Độ đo BLEU (Bilingual Evaluation Understudy) thường được sử dụng phổ biến nhất trong ứng dụng NLP nào?

Câu 9: Kỹ thuật 'Stop words removal' (Loại bỏ từ dừng) trong tiền xử lý văn bản nhằm mục đích gì?

Câu 10: Trong mô hình ngôn ngữ N-gram, mô hình 'Trigram' sẽ tính xác suất của một từ dựa trên bao nhiêu từ đứng trước nó?

Câu 11: Nhược điểm lớn nhất của mô hình túi từ 'Bag-of-Words' (BoW) là gì?

Câu 12: Khái niệm 'Perplexity' trong đánh giá mô hình ngôn ngữ đại diện cho điều gì?

Câu 13: Thuật toán 'Beam Search' thường được sử dụng trong bước nào của các mô hình Sequence-to-Sequence?

Câu 14: Phương pháp 'Byte Pair Encoding' (BPE) giải quyết vấn đề gì trong NLP?

Câu 15: Mục tiêu của kỹ thuật 'Dependency Parsing' trong xử lý ngôn ngữ là gì?

Câu 16: Tại sao các mô hình Transformer như GPT lại được gọi là mô hình 'Autoregressive' (Tự hồi quy)?

Câu 17: Trong ngữ cảnh huấn luyện các mô hình ngôn ngữ lớn (LLM), RLHF (Reinforcement Learning from Human Feedback) dùng để làm gì?

Câu 18: Sự khác biệt chính giữa 'One-hot encoding' và 'Word Embedding' là gì?

Câu 19: Trong phân tích cảm xúc (Sentiment Analysis), phương pháp 'Aspect-based Sentiment Analysis' tập trung vào điều gì?

Câu 20: Tham số 'Temperature' (Nhiệt độ) trong quá trình lấy mẫu (sampling) của các mô hình sinh văn bản có tác dụng gì?

Câu 21: Mô hình ngôn ngữ 'FastText' cải tiến điều gì so với Word2Vec?

Câu 22: Thuật ngữ 'GloVe' (Global Vectors for Word Representation) dựa trên nguyên lý chính nào?

Câu 23: Trong bài toán tóm tắt văn bản, phương pháp 'Abstractive Summarization' khác với 'Extractive Summarization' như thế nào?

Câu 24: Hàm 'Softmax' thường được dùng ở tầng cuối cùng của mô hình phân loại văn bản để làm gì?

Câu 25: Trong NLP, hiện tượng 'Vanishing Gradient' (Biến mất đạo hàm) thường gây khó khăn nhất cho kiến trúc nào khi xử lý các câu dài?