Quay lại danh mục Trắc nghiệm Xử lý ngôn ngữ tự nhiên

Trang chủ
Trắc nghiệm
Trắc nghiệm Xử lý ngôn ngữ tự nhiên
Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Lưu ý: Nội dung trong bài Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), sự khác biệt chính giữa Stemming và Lemmatization là gì?

A. Stemming luôn tạo ra từ có nghĩa trong khi Lemmatization chỉ cắt bỏ phần đuôi của từ.
B. Lemmatization dựa trên từ điển và phân tích hình thái để đưa từ về dạng gốc có nghĩa, còn Stemming thường chỉ cắt bỏ hậu tố theo quy tắc.
C. Cả hai phương pháp đều luôn trả về kết quả giống hệt nhau cho mọi từ tiếng Anh.
D. Stemming yêu cầu bộ ngữ pháp phức tạp hơn nhiều so với Lemmatization.

💡 Lời giải chi tiết:

Theo phân tích phổ biến trong NLP, Lemmatization sử dụng kiến thức ngôn ngữ để đưa từ về từ điển (lemma) thực tế, trong khi Stemming áp dụng các quy tắc thô sơ để cắt đuôi từ. Kết luận Lý giải: Lemmatization dựa trên từ điển và phân tích hình thái để đưa từ về dạng gốc có nghĩa, còn Stemming thường chỉ cắt bỏ hậu tố theo quy tắc.

Câu 2: Mô hình Skip-gram trong thuật toán Word2Vec được thiết kế để thực hiện nhiệm vụ nào sau đây?

A. Dự đoán từ mục tiêu dựa trên các từ ngữ cảnh xung quanh.
B. Sắp xếp các câu theo thứ tự logic trong một đoạn văn.
C. Dự đoán các từ ngữ cảnh xung quanh dựa trên một từ mục tiêu cho trước.
D. Loại bỏ các từ dừng (stop words) ra khỏi văn bản tự động.

💡 Lời giải chi tiết:

Trong kiến trúc Word2Vec, đối lập với CBOW, mô hình Skip-gram sử dụng một từ hiện tại để dự đoán xác suất xuất hiện của các từ trong phạm vi ngữ cảnh xung quanh nó. Kết luận Lý giải: Dự đoán các từ ngữ cảnh xung quanh dựa trên một từ mục tiêu cho trước.

Câu 3: Tại sao cơ chế 'Attention' (Chú ý) lại quan trọng trong các mô hình dịch máy nơ-ron (NMT)?

A. Nó giúp mô hình tập trung vào các phần liên quan của câu nguồn khi tạo ra từng từ ở câu đích.
B. Nó làm giảm đáng kể số lượng tham số cần huấn luyện trong mô hình Transformer.
C. Nó thay thế hoàn toàn nhu cầu sử dụng hàm kích hoạt Softmax ở lớp cuối cùng.
D. Nó giúp mô hình xử lý văn bản nhanh hơn bằng cách bỏ qua các từ ngắn.

💡 Lời giải chi tiết:

Cơ chế Attention cho phép bộ giải mã (decoder) truy cập trực tiếp và trọng số hóa các trạng thái ẩn của bộ mã hóa (encoder), giúp nắm bắt mối quan hệ từ xa hiệu quả hơn. Kết luận Lý giải: Nó giúp mô hình tập trung vào các phần liên quan của câu nguồn khi tạo ra từng từ ở câu đích.

Câu 4: Kiến trúc BERT (Bidirectional Encoder Representations from Transformers) chủ yếu dựa trên thành phần nào của Transformer?

A. Chỉ phần Decoder.
B. Sự kết hợp song song giữa RNN và Decoder.
C. Chỉ phần Encoder.
D. Cả hai phần Encoder và Decoder đầy đủ.

💡 Lời giải chi tiết:

BERT được thiết kế để học biểu diễn ngữ cảnh hai chiều bằng cách sử dụng các lớp chồng ký hiệu của phần Encoder trong kiến trúc Transformer nguyên bản. Kết luận Lý giải: Chỉ phần Encoder.

Câu 5: Nhiệm vụ huấn luyện chính của mô hình GPT (Generative Pre-trained Transformer) là gì?

A. Masked Language Modeling (Dự đoán từ bị che khuất ở giữa).
B. Causal Language Modeling (Dự đoán từ kế tiếp trong chuỗi theo một chiều).
C. Phân loại thực thể có tên (Named Entity Recognition).
D. Phân tích cú pháp dựa trên cấu trúc cây.

💡 Lời giải chi tiết:

Dòng mô hình GPT là các mô hình ngôn ngữ tự hồi quy (autoregressive), được huấn luyện để tối ưu hóa việc dự đoán token tiếp theo dựa trên các token đã xuất hiện trước đó. Kết luận Lý giải: Causal Language Modeling (Dự đoán từ kế tiếp trong chuỗi theo một chiều).

Câu 6: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

A. Phân loại văn bản theo chủ đề.
B. Trích xuất từ khóa quan trọng.
C. Dịch máy và các tác vụ sinh văn bản.
D. Xác định độ tin cậy của nguồn tin tức.

💡 Lời giải chi tiết:

BLEU là một thuật toán đánh giá chất lượng văn bản được dịch máy bằng cách so sánh sự trùng lặp n-gram giữa bản dịch của mô hình và bản dịch tham chiếu của con người. Kết luận Lý giải: Dịch máy và các tác vụ sinh văn bản.

Câu 7: Vấn đề chính mà các mạng LSTM (Long Short-Term Memory) giải quyết so với mạng RNN truyền thống là gì?

A. Tốc độ huấn luyện nhanh hơn trên các GPU đời cũ.
B. Vấn đề biến mất đạo hàm (vanishing gradient) khi xử lý chuỗi dài.
C. Khả năng loại bỏ hoàn toàn nhu cầu về dữ liệu gắn nhãn.
D. Giảm dung lượng bộ nhớ cần thiết để lưu trữ các vector từ.

💡 Lời giải chi tiết:

Thông qua cơ chế cổng (gates), LSTM điều phối dòng thông tin để duy trì các phụ thuộc xa, khắc phục tình trạng đạo hàm tiến về 0 trong RNN cơ bản. Kết luận Lý giải: Vấn đề biến mất đạo hàm (vanishing gradient) khi xử lý chuỗi dài.

Câu 8: Kỹ thuật 'Chain of Thought' (CoT) trong các mô hình ngôn ngữ lớn (LLM) có mục đích chính là gì?

A. Tăng tốc độ phản hồi của mô hình bằng cách bỏ qua các bước trung gian.
B. Cải thiện khả năng suy luận bằng cách yêu cầu mô hình giải thích từng bước giải quyết vấn đề.
C. Giảm thiểu kích thước của mô hình để chạy trên thiết bị di động.
D. Chuyển đổi văn bản từ ngôn ngữ này sang ngôn ngữ khác mà không cần từ điển.

💡 Lời giải chi tiết:

Chain of Thought kích thích khả năng suy luận logic của LLM bằng cách hướng dẫn mô hình tạo ra một chuỗi các bước lập luận trung gian trước khi đưa ra câu trả lời cuối cùng. Kết luận Lý giải: Cải thiện khả năng suy luận bằng cách yêu cầu mô hình giải thích từng bước giải quyết vấn đề.

Câu 9: Thách thức đặc thù lớn nhất khi thực hiện Tokenization (tách từ) cho tiếng Việt so với tiếng Anh là gì?

A. Tiếng Việt có quá nhiều bảng chữ cái khác nhau.
B. Khoảng trắng trong tiếng Việt không nhất thiết là dấu hiệu phân tách giữa các từ.
C. Tiếng Việt không sử dụng các ký tự Latinh nên khó mã hóa.
D. Tiếng Việt không có các quy tắc về dấu câu như dấu chấm, dấu phẩy.

💡 Lời giải chi tiết:

Trong tiếng Việt, một từ có thể bao gồm nhiều tiếng (âm tiết) cách nhau bởi khoảng trắng, khiến việc xác định ranh giới từ phức tạp hơn so với tiếng Anh. Kết luận Lý giải: Khoảng trắng trong tiếng Việt không nhất thiết là dấu hiệu phân tách giữa các từ.

Câu 10: Cơ chế 'Multi-head Attention' trong Transformer mang lại lợi ích gì?

A. Giúp mô hình lưu trữ được nhiều từ vựng hơn trong bộ nhớ.
B. Cho phép mô hình đồng thời tập trung vào thông tin từ các không gian biểu diễn khác nhau.
C. Đảm bảo rằng mô hình luôn chọn từ ngắn nhất để xử lý trước.
D. Loại bỏ hoàn toàn hiện tượng 'ảo giác' (hallucination) của mô hình.

💡 Lời giải chi tiết:

Bằng cách sử dụng nhiều 'đầu' chú ý song song, mô hình có khả năng học được các mối quan hệ ngữ nghĩa và cú pháp đa dạng tại các vị trí khác nhau trong chuỗi. Kết luận Lý giải: Cho phép mô hình đồng thời tập trung vào thông tin từ các không gian biểu diễn khác nhau.

Câu 11: Phương pháp 'Low-Rank Adaptation' (LoRA) được sử dụng trong quá trình tinh chỉnh (fine-tuning) LLM nhằm mục đích gì?

A. Tăng số lượng tham số của mô hình gốc lên gấp đôi để chính xác hơn.
B. Giảm đáng kể số lượng tham số cần cập nhật, giúp tiết kiệm tài nguyên tính toán.
C. Thay thế lớp Attention bằng các lớp tích chập (Convolutional layers).
D. Xóa bỏ toàn bộ tri thức cũ của mô hình để học lại từ đầu.

💡 Lời giải chi tiết:

LoRA đóng băng các trọng số của mô hình đã huấn luyện trước và chỉ cập nhật các ma trận rank thấp được thêm vào, giúp quá trình tinh chỉnh cực kỳ hiệu quả về bộ nhớ. Kết luận Lý giải: Giảm đáng kể số lượng tham số cần cập nhật, giúp tiết kiệm tài nguyên tính toán.

Câu 12: Trong hệ thống RAG (Retrieval-Augmented Generation), vai trò của thành phần 'Retrieval' là gì?

A. Tự động sửa lỗi chính tả trong câu hỏi của người dùng.
B. Tìm kiếm các tài liệu hoặc đoạn văn bản liên quan từ nguồn dữ liệu bên ngoài để cung cấp ngữ cảnh cho mô hình sinh.
C. Nén mô hình ngôn ngữ lại để giảm độ trễ khi phản hồi.
D. Chuyển đổi văn bản thành tệp âm thanh để người dùng nghe.

💡 Lời giải chi tiết:

RAG kết hợp sức mạnh của việc truy xuất thông tin chính xác từ kho dữ liệu với khả năng tạo văn bản tự nhiên của LLM để giảm thiểu sai sót về kiến thức. Kết luận Lý giải: Tìm kiếm các tài liệu hoặc đoạn văn bản liên quan từ nguồn dữ liệu bên ngoài để cung cấp ngữ cảnh cho mô hình sinh.

Câu 13: Nhiệm vụ Named Entity Recognition (NER) trong NLP thực hiện công việc cụ thể nào?

A. Đếm tổng số từ trong một tài liệu văn bản.
B. Xác định và phân loại các thực thể như tên người, tổ chức, địa danh trong văn bản.
C. Dịch toàn bộ văn bản sang một ngôn ngữ đích.
D. Phân tích xem một câu văn mang sắc thái tích cực hay tiêu cực.

💡 Lời giải chi tiết:

NER là một nhánh của trích xuất thông tin nhằm định vị và phân loại các thành phần danh từ riêng thành các nhóm ý nghĩa xác định. Kết luận Lý giải: Xác định và phân loại các thực thể như tên người, tổ chức, địa danh trong văn bản.

Câu 14: Tại sao 'Beam Search' thường được ưu tiên hơn 'Greedy Search' trong các bài toán sinh văn bản?

A. Vì nó luôn chọn từ có xác suất cao nhất tại mỗi bước để tiết kiệm thời gian.
B. Vì nó xem xét nhiều giả thuyết (chuỗi từ) cùng lúc, giúp tìm ra kết quả tối ưu toàn cục tốt hơn.
C. Vì nó không yêu cầu sử dụng GPU để tính toán xác suất.
D. Vì nó tự động loại bỏ các từ lặp lại mà không cần thêm quy tắc nào.

💡 Lời giải chi tiết:

Beam Search duy trì một số lượng (beam width) các chuỗi tiềm năng nhất tại mỗi bước, giúp tránh việc rơi vào tối ưu cục bộ kém chất lượng như Greedy Search. Kết luận Lý giải: Vì nó xem xét nhiều giả thuyết (chuỗi từ) cùng lúc, giúp tìm ra kết quả tối ưu toàn cục tốt hơn.

Câu 15: Ưu điểm chính của FastText so với Word2Vec là gì?

A. Sử dụng ít bộ nhớ RAM hơn khi chạy mô hình.
B. Có khả năng tạo biểu diễn vector cho các từ không nằm trong từ điển (OOV) nhờ sử dụng thông tin subword (n-gram ký tự).
C. Hỗ trợ xử lý hình ảnh tốt hơn so với xử lý văn bản.
D. Có thể dự đoán được tương lai của giá cổ phiếu chính xác hơn.

💡 Lời giải chi tiết:

Bằng cách học vector cho các n-gram ký tự, FastText có thể tổng hợp vector cho một từ mới dựa trên các thành phần ký tự cấu tạo nên nó. Kết luận Lý giải: Có khả năng tạo biểu diễn vector cho các từ không nằm trong từ điển (OOV) nhờ sử dụng thông tin subword (n-gram ký tự).

Câu 16: Chỉ số 'Perplexity' (Độ rối loạn) trong mô hình ngôn ngữ dùng để đo lường điều gì?

A. Tốc độ xử lý số lượng từ trên mỗi giây của mô hình.
B. Mô hình dự đoán tập dữ liệu kiểm tra tốt như thế nào (giá trị thấp hơn thường tốt hơn).
C. Số lượng lỗi chính tả mà mô hình tạo ra trong mỗi câu.
D. Mức độ 'thông minh' của mô hình dựa trên các bài kiểm tra IQ.

💡 Lời giải chi tiết:

Perplexity là nghịch đảo xác suất của tập dữ liệu kiểm tra được chuẩn hóa theo số lượng từ, phản ánh khả năng của mô hình trong việc mô phỏng phân phối ngôn ngữ thực tế. Kết luận Lý giải: Mô hình dự đoán tập dữ liệu kiểm tra tốt như thế nào (giá trị thấp hơn thường tốt hơn).

Câu 17: Cấu trúc Encoder-only (như BERT) thường phù hợp nhất cho loại tác vụ nào?

A. Sinh văn bản tự do như viết truyện hoặc làm thơ.
B. Hiểu văn bản (NLU) như phân loại, gán nhãn thực thể và trả lời câu hỏi dựa trên ngữ cảnh.
C. Hệ thống chatbot đàm thoại trực tuyến.
D. Nén dữ liệu hình ảnh sang định dạng văn bản.

💡 Lời giải chi tiết:

Do có khả năng quan sát toàn bộ ngữ cảnh hai chiều của chuỗi đầu vào, các mô hình Encoder-only cực kỳ hiệu quả trong việc trích xuất đặc trưng và hiểu ý nghĩa văn bản. Kết luận Lý giải: Hiểu văn bản (NLU) như phân loại, gán nhãn thực thể và trả lời câu hỏi dựa trên ngữ cảnh.

Câu 18: Sự khác biệt giữa 'Zero-shot' và 'Few-shot' prompting là gì?

A. Zero-shot không cung cấp ví dụ nào, trong khi Few-shot cung cấp một vài ví dụ minh họa trong câu lệnh.
B. Zero-shot yêu cầu huấn luyện lại mô hình, còn Few-shot thì không.
C. Zero-shot chỉ dùng cho tiếng Anh, còn Few-shot dùng cho tất cả ngôn ngữ.
D. Few-shot nhanh hơn Zero-shot về mặt thời gian phản hồi của mô hình.

💡 Lời giải chi tiết:

Trong bối cảnh LLM, việc cung cấp các ví dụ (demonstrations) giúp mô hình nắm bắt định dạng và yêu cầu của tác vụ nhanh chóng hơn so với việc chỉ mô tả bằng lời. Kết luận Lý giải: Zero-shot không cung cấp ví dụ nào, trong khi Few-shot cung cấp một vài ví dụ minh họa trong câu lệnh.

Câu 19: Tham số 'Temperature' trong quá trình giải mã (decoding) của LLM ảnh hưởng như thế nào đến kết quả đầu ra?

A. Nhiệt độ càng cao thì mô hình chạy càng nóng và tốn điện năng hơn.
B. Nhiệt độ cao làm cho phân phối xác suất phẳng hơn, dẫn đến kết quả đa dạng và sáng tạo hơn nhưng dễ sai sót.
C. Nhiệt độ thấp làm cho mô hình trở nên ngẫu nhiên và khó dự đoán hơn.
D. Nhiệt độ không ảnh hưởng gì đến nội dung văn bản được sinh ra.

💡 Lời giải chi tiết:

Temperature điều chỉnh hàm Softmax; giá trị cao làm tăng xác suất của các từ ít phổ biến, trong khi giá trị thấp khiến mô hình tập trung vào các từ có xác suất cao nhất. Kết luận Lý giải: Nhiệt độ cao làm cho phân phối xác suất phẳng hơn, dẫn đến kết quả đa dạng và sáng tạo hơn nhưng dễ sai sót.

Câu 20: Tác vụ Part-of-Speech (POS) Tagging có mục tiêu chính là gì?

A. Dịch các từ vựng sang ngôn ngữ ký hiệu.
B. Gán nhãn loại từ (danh từ, động từ, tính từ...) cho từng từ trong câu văn.
C. Xác định xem một email có phải là thư rác hay không.
D. Tóm tắt một đoạn văn dài thành một câu ngắn duy nhất.

💡 Lời giải chi tiết:

Gán nhãn từ loại là một bước tiền xử lý quan trọng giúp các mô hình hiểu được vai trò ngữ pháp của từ trong cấu trúc câu. Kết luận Lý giải: Gán nhãn loại từ (danh từ, động từ, tính từ...) cho từng từ trong câu văn.

Câu 21: Tại sao việc loại bỏ 'Stop words' (từ dừng) lại thường được thực hiện trong các bài toán phân loại văn bản truyền thống?

A. Vì các từ này mang quá nhiều ý nghĩa quan trọng làm mô hình bị nhiễu.
B. Vì các từ này (như 'and', 'the', 'là', 'của') xuất hiện rất thường xuyên nhưng mang ít giá trị phân biệt nội dung giữa các lớp.
C. Để làm cho văn bản trông đẹp mắt và chuyên nghiệp hơn.
D. Vì các thuật toán máy học không thể xử lý được các từ có độ dài dưới 3 ký tự.

💡 Lời giải chi tiết:

Trong các mô hình túi từ (Bag-of-Words), việc loại bỏ từ dừng giúp tập trung trọng số vào các từ mang nội dung đặc trưng, qua đó cải thiện hiệu suất phân loại. Kết luận Lý giải: Vì các từ này (như 'and', 'the', 'là', 'của') xuất hiện rất thường xuyên nhưng mang ít giá trị phân biệt nội dung giữa các lớp.

Câu 22: Trong không gian vector, độ tương đồng Cosine (Cosine Similarity) giữa hai vector từ đo lường điều gì?

A. Khoảng cách vật lý tuyệt đối giữa hai điểm trong không gian.
B. Góc giữa hai vector, phản ánh sự tương đồng về hướng và ngữ nghĩa thay vì độ dài.
C. Tổng số lượng ký tự giống nhau giữa hai từ mà vector đại diện.
D. Tốc độ mà mô hình học được hai từ đó trong quá trình huấn luyện.

💡 Lời giải chi tiết:

Độ tương đồng Cosine được tính bằng tích vô hướng của hai vector chia cho tích độ dài của chúng, giúp xác định mức độ gần gũi về ngữ nghĩa một cách độc lập với tần suất từ. Kết luận Lý giải: Góc giữa hai vector, phản ánh sự tương đồng về hướng và ngữ nghĩa thay vì độ dài.

Câu 23: Thành phần 'Positional Encoding' trong Transformer có vai trò gì?

A. Dùng để mã hóa vị trí địa lý của máy chủ đang chạy mô hình.
B. Cung cấp thông tin về thứ tự và vị trí của các token trong chuỗi cho mô hình.
C. Tăng độ phân giải của các hình ảnh đầu vào khi xử lý đa phương thức.
D. Xác định xem từ đó nằm ở trang bao nhiêu trong cuốn sách.

💡 Lời giải chi tiết:

Vì kiến trúc Transformer xử lý toàn bộ chuỗi song song và không có tính tuần tự tự nhiên như RNN, nó cần mã hóa vị trí để hiểu cấu trúc thứ tự của câu. Kết luận Lý giải: Cung cấp thông tin về thứ tự và vị trí của các token trong chuỗi cho mô hình.

Câu 24: Kỹ thuật 'Teacher Forcing' trong huấn luyện mô hình Sequence-to-Sequence là gì?

A. Giáo viên trực tiếp sửa lỗi cho mô hình mỗi khi nó dự đoán sai.
B. Sử dụng kết quả dự đoán của bước trước đó làm đầu vào cho bước hiện tại trong mọi trường hợp.
C. Sử dụng từ đúng mục tiêu (ground truth) từ dữ liệu huấn luyện làm đầu vào cho bước tiếp theo thay vì dùng dự đoán của mô hình.
D. Buộc mô hình phải học thuộc lòng toàn bộ bộ dữ liệu mà không được suy luận.

💡 Lời giải chi tiết:

Teacher Forcing giúp mô hình hội tụ nhanh hơn bằng cách cung cấp đầu vào chuẩn xác trong quá trình huấn luyện, thay vì để sai số tích tụ từ các dự đoán ban đầu chưa tốt. Kết luận Lý giải: Sử dụng từ đúng mục tiêu (ground truth) từ dữ liệu huấn luyện làm đầu vào cho bước tiếp theo thay vì dùng dự đoán của mô hình.

Câu 25: Mục đích chính của việc áp dụng RLHF (Reinforcement Learning from Human Feedback) cho các mô hình như ChatGPT là gì?

A. Tăng kích thước bộ nhớ đệm của mô hình lên mức tối đa.
B. Căn chỉnh (align) đầu ra của mô hình sao cho hữu ích, an toàn và phù hợp với ý muốn của con người.
C. Để mô hình có thể tự viết mã nguồn cho các trò chơi điện tử phức tạp.
D. Giảm lượng điện năng tiêu thụ khi mô hình thực hiện suy luận.

💡 Lời giải chi tiết:

RLHF sử dụng đánh giá của con người để huấn luyện một mô hình phần thưởng, từ đó tối ưu hóa LLM thông qua học tăng cường nhằm tạo ra các phản hồi chất lượng hơn. Kết luận Lý giải: Căn chỉnh (align) đầu ra của mô hình sao cho hữu ích, an toàn và phù hợp với ý muốn của con người.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 6 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 245 lượt làm

Làm ngay

Bộ 7 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 262 lượt làm

Làm ngay

Bộ 8 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 279 lượt làm

Làm ngay

Bộ 9 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 296 lượt làm

Làm ngay

Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 113 lượt làm

Làm ngay

Bộ 11 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 130 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Kết quả của bạn:

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), sự khác biệt chính giữa Stemming và Lemmatization là gì?

Câu 2: Mô hình Skip-gram trong thuật toán Word2Vec được thiết kế để thực hiện nhiệm vụ nào sau đây?

Câu 3: Tại sao cơ chế 'Attention' (Chú ý) lại quan trọng trong các mô hình dịch máy nơ-ron (NMT)?

Câu 4: Kiến trúc BERT (Bidirectional Encoder Representations from Transformers) chủ yếu dựa trên thành phần nào của Transformer?

Câu 5: Nhiệm vụ huấn luyện chính của mô hình GPT (Generative Pre-trained Transformer) là gì?

Câu 6: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

Câu 7: Vấn đề chính mà các mạng LSTM (Long Short-Term Memory) giải quyết so với mạng RNN truyền thống là gì?

Câu 8: Kỹ thuật 'Chain of Thought' (CoT) trong các mô hình ngôn ngữ lớn (LLM) có mục đích chính là gì?

Câu 9: Thách thức đặc thù lớn nhất khi thực hiện Tokenization (tách từ) cho tiếng Việt so với tiếng Anh là gì?

Câu 10: Cơ chế 'Multi-head Attention' trong Transformer mang lại lợi ích gì?

Câu 11: Phương pháp 'Low-Rank Adaptation' (LoRA) được sử dụng trong quá trình tinh chỉnh (fine-tuning) LLM nhằm mục đích gì?

Câu 12: Trong hệ thống RAG (Retrieval-Augmented Generation), vai trò của thành phần 'Retrieval' là gì?

Câu 13: Nhiệm vụ Named Entity Recognition (NER) trong NLP thực hiện công việc cụ thể nào?

Câu 14: Tại sao 'Beam Search' thường được ưu tiên hơn 'Greedy Search' trong các bài toán sinh văn bản?

Câu 15: Ưu điểm chính của FastText so với Word2Vec là gì?

Câu 16: Chỉ số 'Perplexity' (Độ rối loạn) trong mô hình ngôn ngữ dùng để đo lường điều gì?

Câu 17: Cấu trúc Encoder-only (như BERT) thường phù hợp nhất cho loại tác vụ nào?

Câu 18: Sự khác biệt giữa 'Zero-shot' và 'Few-shot' prompting là gì?

Câu 19: Tham số 'Temperature' trong quá trình giải mã (decoding) của LLM ảnh hưởng như thế nào đến kết quả đầu ra?

Câu 20: Tác vụ Part-of-Speech (POS) Tagging có mục tiêu chính là gì?

Câu 21: Tại sao việc loại bỏ 'Stop words' (từ dừng) lại thường được thực hiện trong các bài toán phân loại văn bản truyền thống?

Câu 22: Trong không gian vector, độ tương đồng Cosine (Cosine Similarity) giữa hai vector từ đo lường điều gì?

Câu 23: Thành phần 'Positional Encoding' trong Transformer có vai trò gì?

Câu 24: Kỹ thuật 'Teacher Forcing' trong huấn luyện mô hình Sequence-to-Sequence là gì?

Câu 25: Mục đích chính của việc áp dụng RLHF (Reinforcement Learning from Human Feedback) cho các mô hình như ChatGPT là gì?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top