Quay lại danh mục Trắc nghiệm Xử lý ngôn ngữ tự nhiên

Trang chủ
Trắc nghiệm
Trắc nghiệm Xử lý ngôn ngữ tự nhiên
Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Lưu ý: Nội dung trong bài Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án chỉ dành cho mục đích tham khảo và học tập. Ban quản trị không chịu trách nhiệm về tính pháp lý hoặc kết quả thực tế khi áp dụng các thông tin này. Chúng tôi KHÔNG yêu cầu bất kỳ quyền truy cập nào vào hệ thống của bạn, KHÔNG theo dõi thao tác và KHÔNG thu thập dữ liệu cá nhân của bạn trong suốt quá trình làm bài.

Thời gian còn lại: --:--

Kết quả của bạn:

Bạn đã đúng:

Bạn đã sai:

Tổng số câu:

Câu 1: Phép thử Turing (Turing Test) được thiết kế nhằm mục đích chính là gì trong lĩnh vực trí tuệ nhân tạo?

A. Kiểm tra khả năng tính toán các hàm số phức tạp của máy tính.
B. Đánh giá khả năng máy tính thể hiện hành vi thông minh không thể phân biệt được với con người.
C. Xác định tốc độ xử lý dữ liệu văn bản của các thuật toán NLP.
D. Đo lường dung lượng bộ nhớ cần thiết để lưu trữ một ngôn ngữ.

💡 Lời giải chi tiết:

Theo phân tích phổ biến, phép thử Turing xác định xem máy tính có khả năng thể hiện hành vi thông minh tương đương hoặc không thể phân biệt được với con người thông qua giao tiếp hay không. Kết luận Lý giải: Đánh giá khả năng máy tính thể hiện hành vi thông minh không thể phân biệt được với con người.

Câu 2: Tại sao quá trình tách từ (Tokenization) trong tiếng Việt thường phức tạp hơn so với tiếng Anh?

A. Vì tiếng Việt sử dụng bảng chữ cái Latinh nhưng có thêm các dấu thanh phức tạp.
B. Vì tiếng Việt không sử dụng khoảng trắng để phân tách giữa các câu.
C. Vì khoảng trắng trong tiếng Việt được dùng để phân cách cả các âm tiết trong một từ phức và giữa các từ.
D. Vì tiếng Việt có quá nhiều từ mượn từ tiếng Pháp và tiếng Hán.

💡 Lời giải chi tiết:

Theo đặc điểm ngôn ngữ học, tiếng Việt là ngôn ngữ đơn lập nên khoảng trắng không chỉ dùng để phân tách từ mà còn phân tách các âm tiết trong một từ ghép hoặc từ láy. Kết luận Lý giải: Vì khoảng trắng trong tiếng Việt được dùng để phân cách cả các âm tiết trong một từ phức và giữa các từ.

Câu 3: Sự khác biệt cốt lõi giữa kỹ thuật 'Stemming' và 'Lemmatization' là gì?

A. Stemming luôn tạo ra các từ có nghĩa, trong khi Lemmatization chỉ cắt bỏ phần hậu tố.
B. Lemmatization đưa từ về dạng gốc có nghĩa dựa trên từ điển, còn Stemming cắt tỉa từ dựa trên các quy tắc heuristics.
C. Stemming yêu cầu phân tích ngữ pháp chuyên sâu hơn so với Lemmatization.
D. Lemmatization chỉ áp dụng được cho tiếng Anh, còn Stemming áp dụng được cho mọi ngôn ngữ.

💡 Lời giải chi tiết:

Theo phân tích kỹ thuật, Lemmatization sử dụng phân tích từ vựng và hình thái để đưa từ về dạng gốc hợp lệ (lemma), trong khi Stemming chỉ cắt bỏ đuôi từ một cách thô sơ. Kết luận Lý giải: Lemmatization đưa từ về dạng gốc có nghĩa dựa trên từ điển, còn Stemming cắt tỉa từ dựa trên các quy tắc heuristics.

Câu 4: Trong mô hình Word2Vec, kiến trúc 'Skip-gram' hoạt động dựa trên nguyên lý nào?

A. Dùng các từ ngữ cảnh xung quanh để dự đoán một từ đích ở giữa.
B. Dùng một từ đích để dự đoán các từ ngữ cảnh xuất hiện xung quanh nó.
C. Tính toán tần suất xuất hiện đồng thời của các cặp từ trong toàn bộ văn bản.
D. Sắp xếp các từ theo thứ tự bảng chữ cái để tạo vector biểu diễn.

💡 Lời giải chi tiết:

Theo cấu trúc mô hình, Skip-gram được thiết kế để nhận đầu vào là một từ hiện tại và cố gắng dự đoán các từ nằm trong một cửa sổ ngữ cảnh nhất định xung quanh nó. Kết luận Lý giải: Dùng một từ đích để dự đoán các từ ngữ cảnh xuất hiện xung quanh nó.

Câu 5: Vấn đề 'biến mất đạo hàm' (Vanishing Gradient) trong mạng nơ-ron tuần hoàn (RNN) gây ra khó khăn gì?

A. Khiến mô hình tiêu tốn quá nhiều bộ nhớ GPU khi huấn luyện.
B. Làm cho mô hình không thể xử lý được các câu văn có độ dài ngắn.
C. Mô hình khó có khả năng học và lưu giữ các thông tin phụ thuộc xa trong chuỗi văn bản.
D. Làm tăng tốc độ hội tụ của mô hình lên quá nhanh gây ra hiện tượng quá khớp.

💡 Lời giải chi tiết:

Theo lý thuyết học sâu, khi đạo hàm tiến dần về 0 trong quá trình lan truyền ngược qua nhiều bước thời gian, RNN sẽ mất khả năng cập nhật trọng số cho các tín hiệu từ xa. Kết luận Lý giải: Mô hình khó có khả năng học và lưu giữ các thông tin phụ thuộc xa trong chuỗi văn bản.

Câu 6: Trong đơn vị LSTM (Long Short-Term Memory), cổng nào quyết định thông tin nào sẽ bị loại bỏ khỏi trạng thái ô (cell state)?

A. Cổng đầu vào (Input Gate).
B. Cổng đầu ra (Output Gate).
C. Cổng quên (Forget Gate).
D. Cổng cập nhật (Update Gate).

💡 Lời giải chi tiết:

Theo cấu trúc của LSTM, Forget Gate sử dụng hàm sigmoid để quyết định tỷ lệ thông tin từ trạng thái ô trước đó cần được giữ lại hay xóa bỏ. Kết luận Lý giải: Cổng quên (Forget Gate).

Câu 7: Ưu điểm lớn nhất của cơ chế 'Self-Attention' trong kiến trúc Transformer so với các mạng tuần hoàn (RNN) là gì?

A. Cho phép tính toán song song toàn bộ chuỗi đầu vào thay vì xử lý tuần tự.
B. Giảm số lượng tham số huấn luyện xuống mức tối thiểu.
C. Loại bỏ hoàn toàn nhu cầu về dữ liệu gán nhãn khi huấn luyện.
D. Chỉ tập trung vào những từ xuất hiện ở đầu câu văn.

💡 Lời giải chi tiết:

Theo phân tích kỹ thuật, Self-Attention cho phép mô hình nhìn thấy toàn bộ các từ trong chuỗi cùng lúc, giúp song song hóa việc tính toán và nắm bắt phụ thuộc dài hạn tốt hơn RNN. Kết luận Lý giải: Cho phép tính toán song song toàn bộ chuỗi đầu vào thay vì xử lý tuần tự.

Câu 8: Tại sao mô hình BERT được coi là có tính 'biểu diễn hai chiều' (Bidirectional) thực sự?

A. Vì nó có thể đọc văn bản từ trái sang phải và từ phải sang trái một cách độc lập rồi ghép lại.
B. Vì nó xem xét ngữ cảnh bên trái và bên phải của một từ đồng thời trong tất cả các tầng của mạng.
C. Vì nó có khả năng dịch văn bản qua lại giữa hai ngôn ngữ khác nhau.
D. Vì nó sử dụng hai bộ mã hóa (Encoder) riêng biệt để xử lý một câu văn.

💡 Lời giải chi tiết:

Theo kiến trúc Transformer của BERT, cơ chế Masked Language Model cho phép mô hình học ngữ cảnh từ cả hai phía của một từ cùng một lúc thay vì chỉ theo một hướng như các mô hình truyền thống. Kết luận Lý giải: Vì nó xem xét ngữ cảnh bên trái và bên phải của một từ đồng thời trong tất cả các tầng của mạng.

Câu 9: Dòng mô hình GPT (Generative Pre-trained Transformer) chủ yếu được huấn luyện dựa trên mục tiêu nào?

A. Dự đoán các từ bị che khuất trong một câu văn (Masked Language Modeling).
B. Dự đoán xem hai câu văn có nối tiếp nhau trong thực tế hay không.
C. Dự đoán từ tiếp theo trong một chuỗi văn bản (Causal Language Modeling).
D. Phân loại cảm xúc của toàn bộ đoạn văn bản đầu vào.

💡 Lời giải chi tiết:

Theo thiết kế của OpenAI, GPT là mô hình tự hồi quy (autoregressive) được huấn luyện để tối ưu hóa xác suất dự đoán từ kế tiếp dựa trên các từ đã xuất hiện trước đó. Kết luận Lý giải: Dự đoán từ tiếp theo trong một chuỗi văn bản (Causal Language Modeling).

Câu 10: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

A. Tự động tóm tắt văn bản.
B. Dịch máy (Machine Translation).
C. Nhận dạng thực thể có tên.
D. Phân tích cú pháp câu.

💡 Lời giải chi tiết:

Theo tiêu chuẩn ngành, chỉ số BLEU đo lường mức độ trùng khớp của các n-gram giữa bản dịch máy và bản dịch tham chiếu do con người thực hiện. Kết luận Lý giải: Dịch máy (Machine Translation).

Câu 11: Trong bài toán tóm tắt văn bản, chỉ số ROUGE-L khác với ROUGE-N ở điểm cơ bản nào?

A. ROUGE-L tính toán dựa trên chuỗi con chung dài nhất (Longest Common Subsequence).
B. ROUGE-L chỉ tính toán dựa trên số lượng danh từ xuất hiện trong văn bản.
C. ROUGE-L tập trung vào việc đếm số lượng các từ đơn lẻ trùng nhau.
D. ROUGE-L không quan tâm đến thứ tự xuất hiện của các từ.

💡 Lời giải chi tiết:

Theo định nghĩa về các độ đo ROUGE, ROUGE-L dựa trên số liệu thống kê về chuỗi con chung dài nhất để nắm bắt cấu trúc câu tốt hơn so với việc chỉ đếm n-gram cố định. Kết luận Lý giải: ROUGE-L tính toán dựa trên chuỗi con chung dài nhất (Longest Common Subsequence).

Câu 12: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

A. Dịch các tên riêng từ ngôn ngữ này sang ngôn ngữ khác.
B. Xác định và phân loại các từ trong văn bản vào các nhóm như tên người, tổ chức, địa điểm.
C. Tìm kiếm các định nghĩa của từ vựng trong từ điển bách khoa toàn thư.
D. Sửa lỗi chính tả cho các tên riêng xuất hiện trong đoạn văn.

💡 Lời giải chi tiết:

Theo định nghĩa phổ biến, NER là một nhánh của trích xuất thông tin nhằm định vị và phân loại các thực thể quan trọng thành những danh mục đã xác định trước. Kết luận Lý giải: Xác định và phân loại các từ trong văn bản vào các nhóm như tên người, tổ chức, địa điểm.

Câu 13: Tại sao việc loại bỏ các 'Stop words' (từ dừng) có thể gây hại cho hiệu suất của mô hình phân tích cảm xúc?

A. Vì các từ dừng giúp câu văn trở nên dài hơn và mô hình dễ học hơn.
B. Vì các từ dừng như 'không', 'chẳng' mang thông tin phủ định cực kỳ quan trọng đối với cảm xúc.
C. Vì việc loại bỏ từ dừng làm thay đổi hoàn toàn bảng mã hóa ký tự của văn bản.
D. Vì các từ dừng thường là những từ mang nhiều ý nghĩa biểu cảm nhất trong câu.

💡 Lời giải chi tiết:

Theo phân tích ứng dụng, một số từ thường bị coi là từ dừng lại đóng vai trò quyết định trong việc đảo ngược hoặc nhấn mạnh sắc thái cảm xúc của câu. Kết luận Lý giải: Vì các từ dừng như 'không', 'chẳng' mang thông tin phủ định cực kỳ quan trọng đối với cảm xúc.

Câu 14: Kỹ thuật 'Beam Search' cải thiện quá trình giải mã (decoding) trong dịch máy như thế nào so với 'Greedy Search'?

A. Nó chỉ chọn từ có xác suất cao nhất tại mỗi bước thời gian để tiết kiệm bộ nhớ.
B. Nó xem xét nhiều ứng viên tiềm năng cùng lúc tại mỗi bước để tìm ra chuỗi có tổng xác suất cao nhất.
C. Nó loại bỏ hoàn toàn các từ hiếm gặp khỏi quá trình dịch thuật.
D. Nó tự động dịch ngược từ phải sang trái để kiểm tra tính logic.

💡 Lời giải chi tiết:

Theo thuật toán tìm kiếm, Beam Search duy trì một số lượng 'k' ứng viên tốt nhất thay vì chỉ lấy một, giúp tránh được việc rơi vào các kết cục tối ưu địa phương kém chất lượng. Kết luận Lý giải: Nó xem xét nhiều ứng viên tiềm năng cùng lúc tại mỗi bước để tìm ra chuỗi có tổng xác suất cao nhất.

Câu 15: Hàm 'Softmax' thường được sử dụng ở tầng cuối cùng của mô hình phân loại văn bản với mục đích gì?

A. Để nén các giá trị vector đầu vào về khoảng từ -1 đến 1.
B. Để triệt tiêu các giá trị âm và chuyển đổi đầu ra thành một phân phối xác suất hợp lệ.
C. Để tăng cường độ lệch giữa các trọng số trong mạng nơ-ron.
D. Để tính toán khoảng cách giữa các từ trong không gian vector.

💡 Lời giải chi tiết:

Theo toán học học sâu, Softmax biến đổi các điểm số đầu ra (logits) thành các giá trị nằm trong khoảng (0, 1) có tổng bằng 1, đại diện cho xác suất của các lớp. Kết luận Lý giải: Để triệt tiêu các giá trị âm và chuyển đổi đầu ra thành một phân phối xác suất hợp lệ.

Câu 16: Trong cơ chế Attention, thành phần 'Query' (Q) được hiểu là gì?

A. Là tập hợp các giá trị chứa thông tin nội dung của chuỗi đầu vào.
B. Là vector đại diện cho từ hiện tại đang được xem xét để tìm kiếm mối quan hệ với các từ khác.
C. Là nhãn của các từ ngữ cảnh dùng để tính toán trọng số.
D. Là kết quả cuối cùng sau khi đã tổng hợp thông tin từ toàn bộ câu.

💡 Lời giải chi tiết:

Theo cơ chế Attention, Query được mô phỏng như một truy vấn tìm kiếm sự tương đồng với các Keys để xác định mức độ tập trung vào các Values tương ứng. Kết luận Lý giải: Là vector đại diện cho từ hiện tại đang được xem xét để tìm kiếm mối quan hệ với các từ khác.

Câu 17: Lợi ích chính của việc sử dụng các mô hình ngôn ngữ đã được huấn luyện trước (Pre-trained models) là gì?

A. Loại bỏ hoàn toàn bước thu thập dữ liệu cho các tác vụ cụ thể.
B. Cho phép đạt hiệu suất cao trên các tác vụ mục tiêu dù chỉ có lượng dữ liệu gán nhãn nhỏ.
C. Đảm bảo mô hình không bao giờ đưa ra các thông tin sai lệch.
D. Giảm thời gian phản hồi của mô hình khi triển khai thực tế xuống mức 0.

💡 Lời giải chi tiết:

Theo nguyên lý Transfer Learning, mô hình đã học được các kiến thức ngôn ngữ tổng quát từ tập dữ liệu khổng lồ, giúp việc tinh chỉnh (fine-tuning) trở nên hiệu quả và nhanh chóng. Kết luận Lý giải: Cho phép đạt hiệu suất cao trên các tác vụ mục tiêu dù chỉ có lượng dữ liệu gán nhãn nhỏ.

Câu 18: Kỹ thuật 'Zero-shot learning' trong NLP cho phép các mô hình thực hiện điều gì?

A. Học cách xử lý văn bản mà không cần bất kỳ trọng số nơ-ron nào.
B. Thực hiện một tác vụ mà không cần dữ liệu huấn luyện cụ thể cho tác vụ đó thông qua các chỉ dẫn.
C. Dịch văn bản sang một ngôn ngữ mà mô hình chưa từng được thấy trong quá trình tiền huấn luyện.
D. Tự động xóa bỏ các câu văn không có ý nghĩa trong tập dữ liệu.

💡 Lời giải chi tiết:

Theo khả năng của các LLM hiện đại, Zero-shot dựa vào kiến thức đã học và khả năng hiểu chỉ dẫn (prompt) để giải quyết các yêu cầu mới mà không cần ví dụ minh họa. Kết luận Lý giải: Thực hiện một tác vụ mà không cần dữ liệu huấn luyện cụ thể cho tác vụ đó thông qua các chỉ dẫn.

Câu 19: Hiện tượng 'Ảo giác' (Hallucination) ở các mô hình ngôn ngữ lớn (LLM) dùng để chỉ điều gì?

A. Mô hình bị ngừng hoạt động khi gặp phải các câu văn quá phức tạp.
B. Mô hình tạo ra các thông tin sai sự thật hoặc không có căn cứ nhưng trình bày rất thuyết phục.
C. Mô hình chỉ lặp đi lặp lại một cụm từ duy nhất trong kết quả đầu ra.
D. Mô hình yêu cầu người dùng phải cung cấp thêm dữ liệu để tiếp tục xử lý.

💡 Lời giải chi tiết:

Theo phân tích về độ tin cậy của AI, ảo giác xảy ra khi mô hình sinh ra nội dung có vẻ logic về mặt ngôn ngữ nhưng lại sai lệch hoàn toàn về mặt thực tế hoặc kiến thức. Kết luận Lý giải: Mô hình tạo ra các thông tin sai sự thật hoặc không có căn cứ nhưng trình bày rất thuyết phục.

Câu 20: Kỹ thuật 'Chain of Thought' (Chuỗi suy nghĩ) giúp cải thiện khả năng nào của mô hình ngôn ngữ?

A. Tăng tốc độ sinh văn bản lên gấp nhiều lần.
B. Cải thiện khả năng lập luận và giải quyết các bài toán phức tạp theo từng bước.
C. Giảm dung lượng lưu trữ của mô hình trên ổ cứng.
D. Giúp mô hình ghi nhớ được toàn bộ nội dung của các cuốn sách dài.

💡 Lời giải chi tiết:

Theo nghiên cứu về Prompt Engineering, việc yêu cầu mô hình trình bày các bước trung gian giúp nó phân tách vấn đề và đạt được kết quả chính xác hơn trong các tác vụ đòi hỏi logic. Kết luận Lý giải: Cải thiện khả năng lập luận và giải quyết các bài toán phức tạp theo từng bước.

Câu 21: Tại sao kiến trúc Transformer cần sử dụng thành phần 'Positional Encoding'?

A. Để mã hóa ý nghĩa ngữ nghĩa của các từ vào trong vector.
B. Để cung cấp thông tin về thứ tự và vị trí của các từ trong câu vì cơ chế Attention không có tính tuần tự.
C. Để nén kích thước của chuỗi đầu vào giúp mô hình xử lý nhanh hơn.
D. Để xác định xem từ đó là danh từ, động từ hay tính từ.

💡 Lời giải chi tiết:

Theo thiết kế của Transformer, vì các từ được xử lý song song đồng thời nên thông tin về vị trí tương đối và tuyệt đối phải được cộng thêm vào vector nhúng để mô hình hiểu cấu trúc câu. Kết luận Lý giải: Để cung cấp thông tin về thứ tự và vị trí của các từ trong câu vì cơ chế Attention không có tính tuần tự.

Câu 22: Điểm khác biệt chính giúp FastText xử lý từ tốt hơn Word2Vec là gì?

A. FastText sử dụng các mạng nơ-ron sâu hơn nhiều so với Word2Vec.
B. FastText biểu diễn từ dưới dạng túi các n-gram ký tự (subwords), giúp xử lý được cả những từ hiếm.
C. FastText không cần sử dụng hàm mất mát trong quá trình huấn luyện.
D. FastText chỉ tập trung vào việc xử lý các con số thay vì văn bản.

💡 Lời giải chi tiết:

Theo lý thuyết về nhúng từ, việc chia nhỏ từ thành các n-gram ký tự cho phép FastText nắm bắt cấu trúc hình thái và tạo vector cho cả các từ không nằm trong từ điển huấn luyện. Kết luận Lý giải: FastText biểu diễn từ dưới dạng túi các n-gram ký tự (subwords), giúp xử lý được cả những từ hiếm.

Câu 23: Nhiệm vụ của bài toán 'Gán nhãn từ loại' (Part-of-Speech Tagging) là gì?

A. Xác định ngôn ngữ của đoạn văn bản đầu vào là tiếng Anh hay tiếng Việt.
B. Phân loại vai trò ngữ pháp của mỗi từ trong câu như danh từ, động từ, tính từ.
C. Đếm tổng số lượng từ có trong một văn bản cho trước.
D. Chuyển đổi các từ viết hoa thành viết thường một cách tự động.

💡 Lời giải chi tiết:

Theo ngôn ngữ học máy tính, POS Tagging gán cho mỗi token một nhãn tương ứng với chức năng ngữ pháp của nó dựa trên cả định nghĩa và ngữ cảnh xung quanh. Kết luận Lý giải: Phân loại vai trò ngữ pháp của mỗi từ trong câu như danh từ, động từ, tính từ.

Câu 24: Bài toán 'Giải quyết đồng tham chiếu' (Coreference Resolution) nhằm mục đích gì?

A. Sửa đổi cấu trúc câu để câu văn trở nên mạch lạc hơn.
B. Xác định tất cả các từ hoặc cụm từ trong văn bản cùng ám chỉ đến một thực thể duy nhất.
C. Tìm kiếm tất cả các từ đồng nghĩa của một từ cho trước trong đoạn văn.
D. Dịch các đại từ từ ngôn ngữ nguồn sang ngôn ngữ đích.

💡 Lời giải chi tiết:

Theo phân tích văn bản, bài toán này giúp máy tính hiểu được các đại từ như 'anh ấy', 'nó' đang thay thế cho danh từ cụ thể nào đã xuất hiện trước đó. Kết luận Lý giải: Xác định tất cả các từ hoặc cụm từ trong văn bản cùng ám chỉ đến một thực thể duy nhất.

Câu 25: Hàm mất mát 'Cross-entropy' thường được sử dụng để tối ưu hóa điều gì trong huấn luyện mô hình NLP?

A. Khoảng cách vật lý giữa các máy chủ lưu trữ dữ liệu.
B. Sự khác biệt giữa phân phối xác suất dự đoán của mô hình và phân phối nhãn thực tế.
C. Tổng số lượng từ vựng mà mô hình có thể ghi nhớ.
D. Thời gian cần thiết để xử lý một yêu cầu từ người dùng.

💡 Lời giải chi tiết:

Theo lý thuyết tối ưu hóa, Cross-entropy đo lường độ lệch giữa xác suất mà mô hình gán cho lớp đúng và giá trị thực tế, nhằm cực tiểu hóa sai số này. Kết luận Lý giải: Sự khác biệt giữa phân phối xác suất dự đoán của mô hình và phân phối nhãn thực tế.

Danh sách trắc nghiệm Làm bài tiếp theo

Danh sách các bộ trắc nghiệm:

Các bài trắc nghiệm liên quan

Bộ 11 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 130 lượt làm

Làm ngay

Bộ 12 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 147 lượt làm

Làm ngay

Bộ 13 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 164 lượt làm

Làm ngay

Bộ 14 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 181 lượt làm

Làm ngay

Bộ 15 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 198 lượt làm

Làm ngay

Bộ 1 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Bộ trắc nghiệm 160 lượt làm

Làm ngay

Bộ 10 - Trắc nghiệm Xử lý ngôn ngữ tự nhiên online có đáp án

Kết quả của bạn:

Câu 1: Phép thử Turing (Turing Test) được thiết kế nhằm mục đích chính là gì trong lĩnh vực trí tuệ nhân tạo?

Câu 2: Tại sao quá trình tách từ (Tokenization) trong tiếng Việt thường phức tạp hơn so với tiếng Anh?

Câu 3: Sự khác biệt cốt lõi giữa kỹ thuật 'Stemming' và 'Lemmatization' là gì?

Câu 4: Trong mô hình Word2Vec, kiến trúc 'Skip-gram' hoạt động dựa trên nguyên lý nào?

Câu 5: Vấn đề 'biến mất đạo hàm' (Vanishing Gradient) trong mạng nơ-ron tuần hoàn (RNN) gây ra khó khăn gì?

Câu 6: Trong đơn vị LSTM (Long Short-Term Memory), cổng nào quyết định thông tin nào sẽ bị loại bỏ khỏi trạng thái ô (cell state)?

Câu 7: Ưu điểm lớn nhất của cơ chế 'Self-Attention' trong kiến trúc Transformer so với các mạng tuần hoàn (RNN) là gì?

Câu 8: Tại sao mô hình BERT được coi là có tính 'biểu diễn hai chiều' (Bidirectional) thực sự?

Câu 9: Dòng mô hình GPT (Generative Pre-trained Transformer) chủ yếu được huấn luyện dựa trên mục tiêu nào?

Câu 10: Chỉ số BLEU (Bilingual Evaluation Understudy) thường được sử dụng để đánh giá tác vụ nào trong NLP?

Câu 11: Trong bài toán tóm tắt văn bản, chỉ số ROUGE-L khác với ROUGE-N ở điểm cơ bản nào?

Câu 12: Nhiệm vụ chính của bài toán 'Nhận dạng thực thể có tên' (Named Entity Recognition - NER) là gì?

Câu 13: Tại sao việc loại bỏ các 'Stop words' (từ dừng) có thể gây hại cho hiệu suất của mô hình phân tích cảm xúc?

Câu 14: Kỹ thuật 'Beam Search' cải thiện quá trình giải mã (decoding) trong dịch máy như thế nào so với 'Greedy Search'?

Câu 15: Hàm 'Softmax' thường được sử dụng ở tầng cuối cùng của mô hình phân loại văn bản với mục đích gì?

Câu 16: Trong cơ chế Attention, thành phần 'Query' (Q) được hiểu là gì?

Câu 17: Lợi ích chính của việc sử dụng các mô hình ngôn ngữ đã được huấn luyện trước (Pre-trained models) là gì?

Câu 18: Kỹ thuật 'Zero-shot learning' trong NLP cho phép các mô hình thực hiện điều gì?

Câu 19: Hiện tượng 'Ảo giác' (Hallucination) ở các mô hình ngôn ngữ lớn (LLM) dùng để chỉ điều gì?

Câu 20: Kỹ thuật 'Chain of Thought' (Chuỗi suy nghĩ) giúp cải thiện khả năng nào của mô hình ngôn ngữ?

Câu 21: Tại sao kiến trúc Transformer cần sử dụng thành phần 'Positional Encoding'?

Câu 22: Điểm khác biệt chính giúp FastText xử lý từ tốt hơn Word2Vec là gì?

Câu 23: Nhiệm vụ của bài toán 'Gán nhãn từ loại' (Part-of-Speech Tagging) là gì?

Câu 24: Bài toán 'Giải quyết đồng tham chiếu' (Coreference Resolution) nhằm mục đích gì?

Câu 25: Hàm mất mát 'Cross-entropy' thường được sử dụng để tối ưu hóa điều gì trong huấn luyện mô hình NLP?

Danh sách các bộ trắc nghiệm:

Voviethoang.top

Voviethoangseo.com

Seogenz.top