Quay lại danh mục Trắc nghiệm Xử lý ngôn ngữ tự nhiên

Trang chủ
Trắc nghiệm
Trắc nghiệm Xử lý ngôn ngữ tự nhiên
Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Lưu ý: Nội dung trong bài Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Trong xử lý ngôn ngữ tự nhiên tiếng Việt, thách thức lớn nhất của 'Tách từ' (Word Segmentation) so với tiếng Anh là gì?

A. Tiếng Việt có hệ thống bảng chữ cái phức tạp hơn nhiều so với tiếng Anh.
B. Sự nhập nhằng về ranh giới từ vì khoảng trắng không chỉ dùng để phân tách các từ đơn.
C. Tiếng Việt không có các quy tắc ngữ pháp rõ ràng về cách cấu tạo từ phức.
D. Tiếng Việt yêu cầu phải loại bỏ dấu thanh trước khi thực hiện tách từ.

💡 Lời giải chi tiết:

Theo phân tích phổ biến, tiếng Việt sử dụng khoảng trắng để phân tách cả âm tiết trong một từ phức, dẫn đến sự nhập nhằng khi xác định đâu là ranh giới từ thực sự. Kết luận Lý giải: Sự nhập nhằng về ranh giới từ vì khoảng trắng không chỉ dùng để phân tách các từ đơn.

Câu 2: Sự khác biệt cốt lõi giữa 'Stemming' và 'Lemmatization' là gì?

A. Stemming luôn mang lại kết quả là một từ có nghĩa trong từ điển.
B. Lemmatization chỉ đơn thuần là cắt bỏ các hậu tố và tiền tố của từ.
C. Stemming nhanh hơn nhưng Lemmatization chính xác hơn nhờ sử dụng phân tích từ vựng và từ điển.
D. Cả hai kỹ thuật này đều cho ra kết quả giống hệt nhau trong mọi trường hợp.

💡 Lời giải chi tiết:

Theo lý thuyết xử lý ngôn ngữ, Lemmatization đưa từ về dạng gốc (lemma) dựa trên ngữ cảnh và từ điển, trong khi Stemming chỉ cắt tỉa từ theo quy tắc thô sơ. Kết luận Lý giải: Stemming nhanh hơn nhưng Lemmatization chính xác hơn nhờ sử dụng phân tích từ vựng và từ điển.

Câu 3: Kỹ thuật 'Stop words removal' thường được thực hiện nhằm mục đích gì trong tiền xử lý văn bản?

A. Tăng cường các từ hiếm gặp để làm nổi bật chủ đề của văn bản.
B. Loại bỏ các từ xuất hiện quá thường xuyên nhưng mang ít giá trị ngữ nghĩa để giảm nhiễu dữ liệu.
C. Tự động sửa lỗi chính tả cho các từ thông dụng trong văn bản.
D. Chuyển đổi toàn bộ văn bản về dạng chữ thường để đồng nhất dữ liệu đầu vào.

💡 Lời giải chi tiết:

Các từ dừng như 'và', 'của', 'là' xuất hiện nhiều nhưng không giúp phân biệt nội dung các văn bản, nên việc loại bỏ chúng giúp mô hình tập trung vào các từ quan trọng. Kết luận Lý giải: Loại bỏ các từ xuất hiện quá thường xuyên nhưng mang ít giá trị ngữ nghĩa để giảm nhiễu dữ liệu.

Câu 4: Trong công thức tính TF-IDF, thành phần IDF (Inverse Document Frequency) giúp xác định điều gì?

A. Tần suất xuất hiện của một từ trong một tài liệu cụ thể.
B. Tổng số lượng từ có trong toàn bộ tập dữ liệu huấn luyện.
C. Độ quan trọng của một từ dựa trên mức độ hiếm của nó trong toàn bộ tập tài liệu.
D. Xác suất một từ xuất hiện ngay sau một từ khác trong câu.

💡 Lời giải chi tiết:

IDF đo lường mức độ phổ biến của một từ trên toàn bộ tập tài liệu, từ đó gán trọng số cao hơn cho các từ mang tính đặc trưng và hiếm gặp. Kết luận Lý giải: Độ quan trọng của một từ dựa trên mức độ hiếm của nó trong toàn bộ tập tài liệu.

Câu 5: Mô hình N-gram được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên?

A. Ước lượng xác suất của từ tiếp theo dựa trên chuỗi (n-1) từ đứng trước nó.
B. Phân loại văn bản thành n chủ đề khác nhau một cách tự động.
C. Tìm kiếm n thực thể có tên quan trọng nhất trong một đoạn văn.
D. Xác định khoảng cách chỉnh sửa giữa hai chuỗi ký tự bất kỳ.

💡 Lời giải chi tiết:

Mô hình N-gram là một mô hình xác suất dùng để dự đoán từ tiếp theo trong một chuỗi dựa trên ngữ cảnh của các từ liền kề trước đó. Kết luận Lý giải: Ước lượng xác suất của từ tiếp theo dựa trên chuỗi (n-1) từ đứng trước nó.

Câu 6: Điểm khác biệt chính giữa kiến trúc Skip-gram và CBOW trong Word2Vec là gì?

A. Skip-gram dự đoán các từ ngữ cảnh từ từ mục tiêu, còn CBOW dự đoán từ mục tiêu từ các từ ngữ cảnh.
B. Skip-gram chỉ hoạt động với văn bản ngắn, còn CBOW chuyên dùng cho văn bản dài.
C. CBOW yêu cầu tài nguyên tính toán lớn hơn nhiều so với Skip-gram khi huấn luyện.
D. Skip-gram không thể tạo ra các vector biểu diễn ngữ nghĩa cho từ.

💡 Lời giải chi tiết:

Theo cơ chế hoạt động của Word2Vec, Skip-gram sử dụng một từ để dự đoán các từ xung quanh, trong khi CBOW (Continuous Bag-of-Words) làm ngược lại. Kết luận Lý giải: Skip-gram dự đoán các từ ngữ cảnh từ từ mục tiêu, còn CBOW dự đoán từ mục tiêu từ các từ ngữ cảnh.

Câu 7: Mô hình GloVe (Global Vectors for Word Representation) khác với Word2Vec ở điểm nào?

A. GloVe dựa trên thống kê tần suất đồng xuất hiện toàn cục của các từ trong toàn bộ tập dữ liệu.
B. GloVe chỉ sử dụng mạng neural tích chập để huấn luyện vector từ.
C. Word2Vec không sử dụng cửa sổ trượt (sliding window) như GloVe.
D. GloVe không thể xử lý được các từ chưa xuất hiện trong tập huấn luyện (Out-of-vocabulary).

💡 Lời giải chi tiết:

GloVe kết hợp ưu điểm của các phương pháp phân tích ma trận toàn cục và các phương pháp học cục bộ dựa trên cửa sổ ngữ cảnh. Kết luận Lý giải: GloVe dựa trên thống kê tần suất đồng xuất hiện toàn cục của các từ trong toàn bộ tập dữ liệu.

Câu 8: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

A. Tóm tắt nội dung chính của một văn bản thành một vài câu ngắn gọn.
B. Xác định và phân loại các cụm từ chỉ tên người, tổ chức, địa danh, thời gian... trong văn bản.
C. Dịch một câu từ ngôn ngữ nguồn sang ngôn ngữ đích một cách chính xác.
D. Phân tích tâm trạng của người viết thông qua các từ ngữ biểu cảm.

💡 Lời giải chi tiết:

NER tập trung vào việc trích xuất các thông tin định danh cụ thể từ văn bản thô và gán nhãn chúng vào các danh mục đã xác định. Kết luận Lý giải: Xác định và phân loại các cụm từ chỉ tên người, tổ chức, địa danh, thời gian... trong văn bản.

Câu 9: Trong Sentiment Analysis, mức độ 'Aspect-based Sentiment Analysis' khác gì so với mức độ 'Sentence-level'?

A. Aspect-based chỉ quan tâm đến việc văn bản đó là tích cực hay tiêu cực một cách tổng quát.
B. Aspect-based phân tích thái độ đối với từng thuộc tính cụ thể của thực thể được nhắc đến.
C. Sentence-level có độ chính xác cao hơn hẳn so với Aspect-based trong mọi tình huống.
D. Cả hai đều chỉ tập trung vào việc tìm kiếm các tính từ xuất hiện trong câu.

💡 Lời giải chi tiết:

Phân tích cảm xúc dựa trên khía cạnh (Aspect-based) đi sâu vào chi tiết các thành phần của sản phẩm/dịch vụ thay vì chỉ đánh giá chung chung cả câu. Kết luận Lý giải: Aspect-based phân tích thái độ đối với từng thuộc tính cụ thể của thực thể được nhắc đến.

Câu 10: Thách thức lớn nhất trong bài toán 'Gán nhãn từ loại' (POS Tagging) là gì?

A. Sự đa nghĩa của từ, khi một từ có thể đóng vai trò nhiều từ loại khác nhau tùy ngữ cảnh.
B. Việc máy tính không thể ghi nhớ được danh sách các danh từ trong một ngôn ngữ.
C. Tốc độ xử lý của các thuật toán gán nhãn hiện nay còn quá chậm.
D. Các ký hiệu nhãn từ loại (như NN, VB) không được thống nhất trên toàn thế giới.

💡 Lời giải chi tiết:

Nhiều từ trong ngôn ngữ tự nhiên có thể là danh từ hoặc động từ tùy vào vị trí và chức năng ngữ pháp trong câu, gây khó khăn cho việc phân loại tự động. Kết luận Lý giải: Sự đa nghĩa của từ, khi một từ có thể đóng vai trò nhiều từ loại khác nhau tùy ngữ cảnh.

Câu 11: Sự khác biệt giữa Dependency Parsing và Constituency Parsing là gì?

A. Dependency Parsing tập trung vào cấu trúc phân cấp cụm từ, còn Constituency Parsing tập trung vào quan hệ giữa các từ.
B. Dependency Parsing xác định quan hệ phụ thuộc trực tiếp giữa các từ, còn Constituency Parsing phân tách câu thành các cụm thành phần.
C. Constituency Parsing chỉ dùng cho các ngôn ngữ có cấu trúc ngữ pháp tự do như tiếng Nga.
D. Dependency Parsing không thể biểu diễn được quan hệ chủ ngữ và vị ngữ trong câu.

💡 Lời giải chi tiết:

Theo lý thuyết cú pháp, phân tích phụ thuộc tìm mối liên kết giữa các cặp từ, trong khi phân tích thành phần dựa trên quy tắc ngữ pháp để chia câu thành các nhóm cụm từ. Kết luận Lý giải: Dependency Parsing xác định quan hệ phụ thuộc trực tiếp giữa các từ, còn Constituency Parsing phân tách câu thành các cụm thành phần.

Câu 12: Vấn đề 'Vanishing Gradient' trong mạng RNN truyền thống gây ra hệ quả gì?

A. Làm cho mô hình học quá nhanh dẫn đến hiện tượng Overfitting ngay lập tức.
B. Khiến mô hình khó nắm bắt được các phụ thuộc xa (long-range dependencies) trong chuỗi dữ liệu.
C. Làm cho các trọng số của mạng tăng lên vô hạn trong quá trình huấn luyện.
D. Khiến mạng không thể xử lý được các câu có độ dài ngắn hơn 5 từ.

💡 Lời giải chi tiết:

Khi gradient bị triệt tiêu dần qua các bước thời gian, các lớp đầu tiên của RNN không nhận được tín hiệu cập nhật hiệu quả, làm mất đi khả năng nhớ thông tin từ xa. Kết luận Lý giải: Khiến mô hình khó nắm bắt được các phụ thuộc xa (long-range dependencies) trong chuỗi dữ liệu.

Câu 13: Trong cấu trúc của LSTM, cổng nào chịu trách nhiệm quyết định thông tin nào từ trạng thái tế bào (cell state) cũ sẽ bị loại bỏ?

A. Input Gate (Cổng vào).
B. Output Gate (Cổng ra).
C. Forget Gate (Cổng quên).
D. Update Gate (Cổng cập nhật).

💡 Lời giải chi tiết:

Cổng quên (Forget Gate) trong LSTM sử dụng hàm sigmoid để quyết định tỷ lệ thông tin từ trạng thái tế bào trước đó cần giữ lại hoặc xóa bỏ. Kết luận Lý giải: Forget Gate (Cổng quên).

Câu 14: Cơ chế 'Attention' (Chú ý) giải quyết nhược điểm nào của kiến trúc Encoder-Decoder truyền thống trong dịch máy?

A. Giúp giảm thiểu số lượng tham số cần huấn luyện trong mạng neural.
B. Khắc phục hiện tượng nghẽn cổ chai (bottleneck) khi phải nén toàn bộ câu đầu vào thành một vector cố định.
C. Loại bỏ hoàn toàn nhu cầu sử dụng hàm kích hoạt phi tuyến tính.
D. Giúp mô hình có thể hoạt động mà không cần dữ liệu huấn luyện có nhãn.

💡 Lời giải chi tiết:

Cơ chế Attention cho phép Decoder truy cập trực tiếp vào các trạng thái ẩn khác nhau của Encoder thay vì chỉ dựa vào một vector ngữ cảnh duy nhất. Kết luận Lý giải: Khắc phục hiện tượng nghẽn cổ chai (bottleneck) khi phải nén toàn bộ câu đầu vào thành một vector cố định.

Câu 15: Tại sao kiến trúc Transformer lại ưu việt hơn RNN trong việc huấn luyện trên tập dữ liệu lớn?

A. Vì Transformer không sử dụng cơ chế Attention nên tính toán đơn giản hơn.
B. Vì Transformer cho phép tính toán song song toàn bộ các từ trong chuỗi thay vì xử lý tuần tự.
C. Vì Transformer chỉ có thể xử lý được các câu văn ngắn nên tốc độ nhanh hơn.
D. Vì Transformer sử dụng ít lớp ẩn hơn so với các mạng LSTM thông thường.

💡 Lời giải chi tiết:

Nhờ loại bỏ tính tuần tự của RNN và sử dụng Self-attention, Transformer có thể tận dụng tối đa sức mạnh tính toán song song của GPU. Kết luận Lý giải: Vì Transformer cho phép tính toán song song toàn bộ các từ trong chuỗi thay vì xử lý tuần tự.

Câu 16: Mục tiêu chính của nhiệm vụ 'Masked Language Modeling' (MLM) trong huấn luyện BERT là gì?

A. Để che giấu các thông tin nhạy cảm có trong tập dữ liệu huấn luyện.
B. Để mô hình học cách dự đoán các từ bị che dựa trên ngữ cảnh hai chiều xung quanh chúng.
C. Để giảm bớt kích thước của bộ từ vựng (vocabulary) trong mô hình.
D. Để mô hình tự động tạo ra các câu văn mới có ý nghĩa tương đương.

💡 Lời giải chi tiết:

Bằng cách che đi một số từ ngẫu nhiên, MLM ép buộc BERT phải hiểu mối quan hệ ngữ nghĩa giữa các từ từ cả hai phía để điền đúng từ còn thiếu. Kết luận Lý giải: Để mô hình học cách dự đoán các từ bị che dựa trên ngữ cảnh hai chiều xung quanh chúng.

Câu 17: Sự khác biệt cơ bản giữa cách tiếp cận của GPT và BERT là gì?

A. GPT là mô hình tự hồi quy (autoregressive), trong khi BERT là mô hình tự mã hóa (autoencoding) hai chiều.
B. BERT chuyên dùng cho việc sinh văn bản, còn GPT chuyên dùng cho việc phân loại.
C. GPT chỉ sử dụng kiến trúc Encoder của Transformer, còn BERT sử dụng Decoder.
D. BERT yêu cầu ít dữ liệu huấn luyện hơn nhiều so với các phiên bản của GPT.

💡 Lời giải chi tiết:

Theo thiết kế, GPT dự đoán từ tiếp theo theo chiều từ trái sang phải, trong khi BERT học biểu diễn từ bằng cách nhìn vào toàn bộ ngữ cảnh xung quanh. Kết luận Lý giải: GPT là mô hình tự hồi quy (autoregressive), trong khi BERT là mô hình tự mã hóa (autoencoding) hai chiều.

Câu 18: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được dùng để đánh giá chất lượng của hệ thống nào?

A. Hệ thống nhận dạng giọng nói tự động.
B. Hệ thống dịch máy tự động.
C. Hệ thống kiểm tra lỗi chính tả và ngữ pháp.
D. Hệ thống trích xuất thông tin từ hình ảnh.

💡 Lời giải chi tiết:

BLEU đo lường mức độ tương đồng giữa bản dịch của máy và các bản dịch tham chiếu do con người thực hiện dựa trên sự trùng lặp của các n-gram. Kết luận Lý giải: Hệ thống dịch máy tự động.

Câu 19: Trong đánh giá tóm tắt văn bản, chỉ số ROUGE tập trung vào khía cạnh nào?

A. Độ chính xác (Precision) của các từ xuất hiện trong bản tóm tắt máy.
B. Độ bao phủ (Recall) của các thông tin quan trọng từ bản tóm tắt tham chiếu.
C. Tốc độ tạo ra bản tóm tắt của mô hình.
D. Độ dài trung bình của các câu trong bản tóm tắt.

💡 Lời giải chi tiết:

Khác với BLEU ưu tiên độ chính xác, ROUGE thường ưu tiên khả năng bao quát được các nội dung quan trọng có trong bản mẫu. Kết luận Lý giải: Độ bao phủ (Recall) của các thông tin quan trọng từ bản tóm tắt tham chiếu.

Câu 20: Chỉ số Perplexity (Độ hỗn loạn) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

A. Mô hình đang gặp khó khăn cực lớn trong việc dự đoán từ tiếp theo.
B. Mô hình có khả năng dự đoán chính xác cao và ít bị bất ngờ bởi dữ liệu thực tế.
C. Tập dữ liệu huấn luyện chứa quá nhiều thông tin gây nhiễu và sai lệch.
D. Mô hình cần phải được huấn luyện lại từ đầu với số lượng epoch nhiều hơn.

💡 Lời giải chi tiết:

Perplexity là thước đo mức độ không chắc chắn của mô hình; chỉ số này càng thấp đồng nghĩa với việc mô hình dự đoán xác suất cho dữ liệu thực tế càng cao. Kết luận Lý giải: Mô hình có khả năng dự đoán chính xác cao và ít bị bất ngờ bởi dữ liệu thực tế.

Câu 21: Cơ chế 'Beam Search' giải quyết vấn đề gì trong quá trình sinh văn bản (Decoding)?

A. Giúp tìm kiếm chuỗi từ có xác suất tổng thể cao nhất thay vì chỉ chọn từ tốt nhất ở mỗi bước đơn lẻ.
B. Làm giảm thời gian tính toán bằng cách chỉ chọn ngẫu nhiên một từ duy nhất.
C. Tự động loại bỏ các từ lặp lại trong câu văn được sinh ra.
D. Đảm bảo rằng mọi từ trong bộ từ vựng đều có cơ hội xuất hiện như nhau.

💡 Lời giải chi tiết:

Thay vì chiến lược tham lam (Greedy Search) dễ dẫn đến kết quả tối ưu cục bộ, Beam Search duy trì một danh sách các ứng viên tiềm năng nhất để tìm ra chuỗi tối ưu hơn. Kết luận Lý giải: Giúp tìm kiếm chuỗi từ có xác suất tổng thể cao nhất thay vì chỉ chọn từ tốt nhất ở mỗi bước đơn lẻ.

Câu 22: Thuật toán Byte Pair Encoding (BPE) được sử dụng để làm gì?

A. Mã hóa văn bản thành các đoạn mã nhị phân để tiết kiệm bộ nhớ lưu trữ.
B. Tách từ thành các đơn vị dưới cấp từ (subwords) để xử lý các từ hiếm và từ chưa biết (OOV).
C. Tự động phát hiện ngôn ngữ của một tài liệu văn bản bất kỳ.
D. Xác định các cặp từ thường xuyên xuất hiện cùng nhau để tạo ra các từ ghép.

💡 Lời giải chi tiết:

BPE giúp mô hình có thể biểu diễn các từ lạ bằng cách phân rã chúng thành các đơn vị nhỏ hơn đã thấy trong quá trình huấn luyện. Kết luận Lý giải: Tách từ thành các đơn vị dưới cấp từ (subwords) để xử lý các từ hiếm và từ chưa biết (OOV).

Câu 23: Trong mô hình Seq2Seq, 'Vector ngữ cảnh' (Context Vector) đóng vai trò gì?

A. Là đầu ra cuối cùng của quá trình dịch thuật sau khi đã qua bộ giải mã.
B. Là cầu nối chứa thông tin tóm tắt của toàn bộ chuỗi đầu vào để bộ giải mã sử dụng.
C. Là một danh sách các từ dừng cần phải loại bỏ trước khi bắt đầu dịch.
D. Là vector dùng để đo lường độ lỗi giữa dự đoán và thực tế.

💡 Lời giải chi tiết:

Vector ngữ cảnh tổng hợp toàn bộ tri thức mà Encoder thu nhận được từ câu nguồn để truyền đạt sang cho Decoder khởi tạo quá trình sinh câu đích. Kết luận Lý giải: Là cầu nối chứa thông tin tóm tắt của toàn bộ chuỗi đầu vào để bộ giải mã sử dụng.

Câu 24: Quá trình 'Fine-tuning' trong NLP thường được thực hiện như thế nào?

A. Huấn luyện lại toàn bộ mô hình từ đầu với các trọng số khởi tạo ngẫu nhiên.
B. Tiếp tục huấn luyện một mô hình đã học trước (pre-trained) trên một tập dữ liệu nhỏ cụ thể cho một nhiệm vụ nhất định.
C. Sử dụng các quy tắc thủ công để điều chỉnh các tham số của mô hình mà không cần dữ liệu.
D. Xóa bỏ các lớp cuối cùng của mô hình để giảm độ phức tạp khi dự đoán.

💡 Lời giải chi tiết:

Fine-tuning tận dụng tri thức ngôn ngữ tổng quát từ quá trình Pre-training và điều chỉnh nó để thích nghi với các đặc điểm riêng của nhiệm vụ đích. Kết luận Lý giải: Tiếp tục huấn luyện một mô hình đã học trước (pre-trained) trên một tập dữ liệu nhỏ cụ thể cho một nhiệm vụ nhất định.

Câu 25: Khả năng 'Zero-shot learning' của các mô hình ngôn ngữ lớn (như GPT-3) nghĩa là gì?

A. Mô hình có thể thực hiện một nhiệm vụ mới mà không cần thêm bất kỳ ví dụ huấn luyện cụ thể nào.
B. Mô hình không thể học được bất kỳ thông tin nào từ dữ liệu đầu vào.
C. Mô hình yêu cầu chính xác 0 lỗi trong tập dữ liệu huấn luyện để có thể hoạt động.
D. Mô hình chỉ có thể xử lý được các văn bản không chứa bất kỳ số liệu nào.

💡 Lời giải chi tiết:

Zero-shot learning cho phép mô hình giải quyết vấn đề dựa trên các chỉ dẫn bằng ngôn ngữ tự nhiên và kiến thức sẵn có mà không cần cập nhật trọng số. Kết luận Lý giải: Mô hình có thể thực hiện một nhiệm vụ mới mà không cần thêm bất kỳ ví dụ huấn luyện cụ thể nào.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 15 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 198 lượt làm

Làm ngay

Bộ 1 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 160 lượt làm

Làm ngay

Bộ 2 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 177 lượt làm

Làm ngay

Bộ 3 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 194 lượt làm

Làm ngay

Bộ 4 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 211 lượt làm

Làm ngay

Bộ 5 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 228 lượt làm

Làm ngay

Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Kết quả của bạn:

Câu 1: Trong xử lý ngôn ngữ tự nhiên tiếng Việt, thách thức lớn nhất của 'Tách từ' (Word Segmentation) so với tiếng Anh là gì?

Câu 2: Sự khác biệt cốt lõi giữa 'Stemming' và 'Lemmatization' là gì?

Câu 3: Kỹ thuật 'Stop words removal' thường được thực hiện nhằm mục đích gì trong tiền xử lý văn bản?

Câu 4: Trong công thức tính TF-IDF, thành phần IDF (Inverse Document Frequency) giúp xác định điều gì?

Câu 5: Mô hình N-gram được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên?

Câu 6: Điểm khác biệt chính giữa kiến trúc Skip-gram và CBOW trong Word2Vec là gì?

Câu 7: Mô hình GloVe (Global Vectors for Word Representation) khác với Word2Vec ở điểm nào?

Câu 8: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

Câu 9: Trong Sentiment Analysis, mức độ 'Aspect-based Sentiment Analysis' khác gì so với mức độ 'Sentence-level'?

Câu 10: Thách thức lớn nhất trong bài toán 'Gán nhãn từ loại' (POS Tagging) là gì?

Câu 11: Sự khác biệt giữa Dependency Parsing và Constituency Parsing là gì?

Câu 12: Vấn đề 'Vanishing Gradient' trong mạng RNN truyền thống gây ra hệ quả gì?

Câu 13: Trong cấu trúc của LSTM, cổng nào chịu trách nhiệm quyết định thông tin nào từ trạng thái tế bào (cell state) cũ sẽ bị loại bỏ?

Câu 14: Cơ chế 'Attention' (Chú ý) giải quyết nhược điểm nào của kiến trúc Encoder-Decoder truyền thống trong dịch máy?

Câu 15: Tại sao kiến trúc Transformer lại ưu việt hơn RNN trong việc huấn luyện trên tập dữ liệu lớn?

Câu 16: Mục tiêu chính của nhiệm vụ 'Masked Language Modeling' (MLM) trong huấn luyện BERT là gì?

Câu 17: Sự khác biệt cơ bản giữa cách tiếp cận của GPT và BERT là gì?

Câu 18: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được dùng để đánh giá chất lượng của hệ thống nào?

Câu 19: Trong đánh giá tóm tắt văn bản, chỉ số ROUGE tập trung vào khía cạnh nào?

Câu 20: Chỉ số Perplexity (Độ hỗn loạn) thấp trong một mô hình ngôn ngữ có ý nghĩa gì?

Câu 21: Cơ chế 'Beam Search' giải quyết vấn đề gì trong quá trình sinh văn bản (Decoding)?

Câu 22: Thuật toán Byte Pair Encoding (BPE) được sử dụng để làm gì?

Câu 23: Trong mô hình Seq2Seq, 'Vector ngữ cảnh' (Context Vector) đóng vai trò gì?

Câu 24: Quá trình 'Fine-tuning' trong NLP thường được thực hiện như thế nào?

Câu 25: Khả năng 'Zero-shot learning' của các mô hình ngôn ngữ lớn (như GPT-3) nghĩa là gì?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top