Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Lưu ý: Nội dung trong bài Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'Tokenization' cấp độ từ trong tiếng Việt khác với tiếng Anh ở điểm cốt lõi nào?

Câu 2: Sự khác biệt chính giữa 'Stemming' và 'Lemmatization' trong quá trình tiền xử lý dữ liệu văn bản là gì?

Câu 3: Trong công thức TF-IDF, thành phần 'IDF' (Inverse Document Frequency) đóng vai trò chủ chốt nào?

Câu 4: Mô hình 'Skip-gram' trong kiến trúc Word2Vec hoạt động dựa trên nguyên lý cơ bản nào?

Câu 5: Tại sao cơ chế 'Attention' (Chú ý) lại tạo ra bước đột phá cho các mô hình dịch máy so với kiến trúc RNN truyền thống?

Câu 6: Đặc điểm nổi bật nhất của mô hình BERT (Bidirectional Encoder Representations from Transformers) là gì?

Câu 7: Trong bài toán 'Named Entity Recognition' (NER), mục tiêu chính của hệ thống là gì?

Câu 8: Độ đo BLEU (Bilingual Evaluation Understudy) thường được sử dụng phổ biến nhất để đánh giá chất lượng của hệ thống nào?

Câu 9: Khái niệm 'Perplexity' trong các mô hình ngôn ngữ (Language Models) có ý nghĩa như thế nào?

Câu 10: Hạn chế lớn nhất của phương pháp biểu diễn từ bằng 'One-hot encoding' là gì?

Câu 11: Kỹ thuật 'Byte Pair Encoding' (BPE) giải quyết vấn đề gì trong các mô hình ngôn ngữ hiện đại như GPT?

Câu 12: Trong kiến trúc Transformer, tại sao cần sử dụng 'Positional Encoding'?

Câu 13: Mô hình ngôn ngữ 'GPT' (Generative Pre-trained Transformer) chủ yếu sử dụng phần nào của kiến trúc Transformer gốc?

Câu 14: Lợi ích chính của việc sử dụng 'Pre-trained models' (Mô hình đã huấn luyện trước) trong NLP là gì?

Câu 15: Thuật toán 'Word2Vec' tạo ra các vector nhúng (embeddings) có đặc điểm gì nổi bật?

Câu 16: Trong bài toán phân loại sắc thái văn bản (Sentiment Analysis), thách thức nào sau đây là khó giải quyết nhất?

Câu 17: Mô hình 'ELMo' (Embeddings from Language Models) khác với Word2Vec ở điểm quan trọng nào?

Câu 18: Trong 'Dependency Parsing' (Phân tích cú pháp phụ thuộc), nhiệm vụ chính là gì?

Câu 19: Thành phần 'Softmax' ở lớp cuối cùng của một mô hình phân loại văn bản có tác dụng gì?

Câu 20: Kỹ thuật 'Data Augmentation' trong NLP thường được thực hiện bằng cách nào để tăng lượng dữ liệu huấn luyện?

Câu 21: Vấn đề 'Vanishing Gradient' (Biến mất đạo hàm) thường gặp trong mạng RNN truyền thống ảnh hưởng như thế nào đến xử lý văn bản?

Câu 22: Trong quá trình tiền xử lý, 'Stop words removal' (Loại bỏ từ dừng) có mục đích gì?

Câu 23: Hệ thống 'Chatbot' dựa trên mô hình ngôn ngữ lớn (LLM) hiện nay sử dụng cơ chế nào để duy trì ngữ cảnh hội thoại?

Câu 24: Thuật toán 'Cosine Similarity' được dùng để làm gì trong NLP?

Câu 25: Mô hình 'RoBERTa' cải tiến BERT ở điểm nào để đạt hiệu suất cao hơn?