Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Thời gian còn lại: --:--

Câu 1: Phép thử Turing (Turing Test) được thiết kế nhằm mục đích chính là gì trong lĩnh vực trí tuệ nhân tạo?

Câu 2: Tại sao quá trình tách từ (Tokenization) trong tiếng Việt thường phức tạp hơn so với tiếng Anh?

Câu 3: Sự khác biệt cốt lõi giữa kỹ thuật 'Stemming' và 'Lemmatization' là gì?

Câu 4: Trong mô hình Word2Vec, kiến trúc 'Skip-gram' hoạt động dựa trên nguyên lý nào?

Câu 5: Vấn đề 'biến mất đạo hàm' (Vanishing Gradient) trong mạng nơ-ron tuần hoàn (RNN) gây ra khó khăn gì?

Câu 6: Trong đơn vị LSTM (Long Short-Term Memory), cổng nào quyết định thông tin nào sẽ bị loại bỏ khỏi trạng thái ô (cell state)?

Câu 7: Ưu điểm lớn nhất của cơ chế 'Self-Attention' trong kiến trúc Transformer so với các mạng tuần hoàn (RNN) là gì?

Câu 8: Tại sao mô hình BERT được coi là có tính 'biểu diễn hai chiều' (Bidirectional) thực sự?

Câu 9: Dòng mô hình GPT (Generative Pre-trained Transformer) chủ yếu được huấn luyện dựa trên mục tiêu nào?

Câu 10: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

Câu 11: Trong bài toán tóm tắt văn bản, chỉ số ROUGE-L khác với ROUGE-N ở điểm cơ bản nào?

Câu 12: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

Câu 13: Tại sao việc loại bỏ các 'Stop words' (từ dừng) có thể gây hại cho hiệu suất của mô hình phân tích cảm xúc?

Câu 14: Kỹ thuật 'Beam Search' cải thiện quá trình giải mã (decoding) trong dịch máy như thế nào so với 'Greedy Search'?

Câu 15: Hàm 'Softmax' thường được sử dụng ở tầng cuối cùng của mô hình phân loại văn bản với mục đích gì?

Câu 16: Trong cơ chế Attention, thành phần 'Query' (Q) được hiểu là gì?

Câu 17: Lợi ích chính của việc sử dụng các mô hình ngôn ngữ đã được huấn luyện trước (Pre-trained models) là gì?

Câu 18: Kỹ thuật 'Zero-shot learning' trong NLP cho phép các mô hình thực hiện điều gì?

Câu 19: Hiện tượng 'Ảo giác' (Hallucination) ở các mô hình ngôn ngữ lớn (LLM) dùng để chỉ điều gì?

Câu 20: Kỹ thuật 'Chain of Thought' (Chuỗi suy nghĩ) giúp cải thiện khả năng nào của mô hình ngôn ngữ?

Câu 21: Tại sao kiến trúc Transformer cần sử dụng thành phần 'Positional Encoding'?

Câu 22: Điểm khác biệt chính giúp FastText xử lý từ tốt hơn Word2Vec là gì?

Câu 23: Nhiệm vụ của bài toán 'Gán nhãn từ loại' (Part-of-Speech Tagging) là gì?

Câu 24: Bài toán 'Giải quyết đồng tham chiếu' (Coreference Resolution) nhằm mục đích gì?

Câu 25: Hàm mất mát 'Cross-entropy' thường được sử dụng để tối ưu hóa điều gì trong huấn luyện mô hình NLP?