Bộ 2 - Trắc nghiệm Thống kê ứng dụng online có đáp án
Thời gian còn lại: --:--
Kết quả của bạn:
Bạn đã đúng:
Bạn đã sai:
Tổng số câu:
Câu 1:
Trong thống kê mô tả, đại lượng nào sau đây được dùng để đo lường mức độ tập trung của dữ liệu và ít bị ảnh hưởng bởi các giá trị ngoại lai (outliers) nhất?
💡 Lời giải chi tiết:
Số trung vị là giá trị chia tập dữ liệu thành hai phần bằng nhau nên không bị kéo theo các giá trị cực đoan như số trung bình cộng. Kết luận Lý giải Số trung vị (Median)
Câu 2:
Khi phân tích một tập dữ liệu có phân phối lệch phải (Positive Skewness), mối quan hệ nào sau đây thường xuyên xảy ra giữa các số đặc trưng?
💡 Lời giải chi tiết:
Trong phân phối lệch phải, đuôi của phân phối kéo dài về phía bên phải làm cho giá trị trung bình bị kéo cao hơn so với trung vị và yếu vị. Kết luận Lý giải Trung bình > Trung vị > Yếu vị
Câu 3:
Định lý giới hạn trung tâm (Central Limit Theorem) đóng vai trò quan trọng nhất trong việc khẳng định điều gì về phân phối của trung bình mẫu?
💡 Lời giải chi tiết:
Định lý này cho phép áp dụng các kiểm định tham số dựa trên phân phối chuẩn cho các mẫu lớn ngay cả khi tổng thể gốc không chuẩn. Kết luận Lý giải Phân phối của trung bình mẫu sẽ tiến về phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể hình dạng phân phối của tổng thể
Câu 4:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I là việc bác bỏ một giả thuyết đúng, với xác suất xảy ra ký hiệu là alpha (mức ý nghĩa). Kết luận Lý giải Bác bỏ giả thuyết không (H0) khi nó thực sự đúng
Câu 5:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn biến cho biết điều gì?
💡 Lời giải chi tiết:
R-squared đo lường mức độ phù hợp của mô hình bằng cách xác định phần trăm sự biến động của biến Y được giải thích bởi biến X. Kết luận Lý giải Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình
Câu 6:
Giá trị P (P-value) trong một kiểm định thống kê được hiểu là gì?
💡 Lời giải chi tiết:
P-value giúp người nghiên cứu quyết định bác bỏ hay không bác bỏ H0 dựa trên so sánh với mức ý nghĩa alpha. Kết luận Lý giải Xác suất thu được kết quả quan sát cực đoan như hoặc hơn kết quả hiện tại nếu giả thuyết không (H0) là đúng
Câu 7:
Để so sánh giá trị trung bình của ba nhóm độc lập trở lên, phương pháp thống kê nào sau đây là phù hợp nhất?
💡 Lời giải chi tiết:
Phân tích biến số (ANOVA) được thiết kế đặc biệt để kiểm tra sự khác biệt giữa trung bình của nhiều hơn hai nhóm cùng lúc. Kết luận Lý giải Phân tích biến số một chiều (One-way ANOVA)
Câu 8:
Phương pháp chọn mẫu nào đảm bảo mọi cá thể trong tổng thể đều có cơ hội được chọn vào mẫu là như nhau?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là phương pháp chọn mẫu xác suất cơ bản nhất đảm bảo tính khách quan cho mọi đơn vị. Kết luận Lý giải Chọn mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
Câu 9:
Hệ số tương quan Pearson (r) nằm trong khoảng giá trị nào?
💡 Lời giải chi tiết:
Hệ số r đo lường sức mạnh và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng trong khoảng từ -1 đến 1. Kết luận Lý giải Từ -1 đến 1
Câu 10:
Chỉ số Z (Z-score) của một giá trị cụ thể trong tập dữ liệu cho biết điều gì?
💡 Lời giải chi tiết:
Z-score chuẩn hóa dữ liệu bằng cách tính toán khoảng cách từ điểm dữ liệu đến trung bình theo đơn vị độ lệch chuẩn. Kết luận Lý giải Số lượng độ lệch chuẩn mà giá trị đó nằm cách xa số trung bình
Câu 11:
Khoảng biến thiên nội phần tư (Interquartile Range - IQR) được tính bằng cách nào?
💡 Lời giải chi tiết:
IQR đo lường sự phân tán của 50% dữ liệu nằm ở giữa tập dữ liệu, giúp hạn chế ảnh hưởng của giá trị ngoại lai. Kết luận Lý giải Lấy tứ phân vị thứ ba (Q3) trừ tứ phân vị thứ nhất (Q1)
Câu 12:
Tại sao khi tính phương sai mẫu (Sample Variance), người ta thường chia tổng bình phương các độ lệch cho (n-1) thay vì n?
💡 Lời giải chi tiết:
Việc chia cho n-1 (hiệu chỉnh Bessel) giúp bù đắp xu hướng đánh giá thấp phương sai tổng thể khi chỉ dựa trên dữ liệu mẫu. Kết luận Lý giải Để thu được một ước lượng không chệch (unbiased estimator) của phương sai tổng thể
Câu 13:
Mức ý nghĩa (Alpha) thường được chọn là 0.05 trong nghiên cứu khoa học có nghĩa là gì?
💡 Lời giải chi tiết:
Alpha là ngưỡng xác suất tối đa mà người nghiên cứu chấp nhận cho việc phạm sai lầm loại I. Kết luận Lý giải Người nghiên cứu chấp nhận rủi ro 5% bác bỏ sai giả thuyết không khi nó thực sự đúng
Câu 14:
Khi nào thì kiểm định t (T-test) được ưu tiên sử dụng thay vì kiểm định Z?
💡 Lời giải chi tiết:
Kiểm định t sử dụng độ lệch chuẩn mẫu để ước lượng nên phù hợp khi thông số tổng thể không xác định. Kết luận Lý giải Khi chưa biết độ lệch chuẩn của tổng thể và kích thước mẫu thường là nhỏ
Câu 15:
Hệ số biến thiên (Coefficient of Variation - CV) được sử dụng nhằm mục đích chính là gì?
💡 Lời giải chi tiết:
CV là tỷ lệ giữa độ lệch chuẩn và trung bình, cho phép so sánh sự biến thiên tương đối giữa các tập dữ liệu không cùng thang đo. Kết luận Lý giải So sánh mức độ phân tán của hai tập dữ liệu có đơn vị đo khác nhau hoặc trung bình khác nhau
Câu 16:
Kiểm định Chi-bình phương về tính độc lập (Chi-square test of independence) được dùng để kiểm tra mối quan hệ giữa các loại biến nào?
💡 Lời giải chi tiết:
Kiểm định này so sánh tần số quan sát được với tần số kỳ vọng trong một bảng chéo giữa hai biến phân loại. Kết luận Lý giải Hai biến định tính (biến phân loại)
Câu 17:
Trong phương trình hồi quy tuyến tính đơn Y = a + bX, hệ số b (hệ số góc) đại diện cho điều gì?
💡 Lời giải chi tiết:
Hệ số góc b đo lường tác động biên của biến độc lập lên biến phụ thuộc trong mô hình hồi quy. Kết luận Lý giải Mức độ thay đổi trung bình của Y khi X thay đổi một đơn vị
Câu 18:
Bậc tự do (Degrees of Freedom) cho một kiểm định t mẫu đơn (One-sample t-test) với cỡ mẫu n được tính như thế nào?
💡 Lời giải chi tiết:
Bậc tự do phản ánh số lượng giá trị có thể thay đổi tự do trong tính toán thống kê, đối với t-test mẫu đơn là n-1. Kết luận Lý giải n - 1
Câu 19:
Ba đại lượng đo lường xu hướng trung tâm phổ biến nhất là gì?
💡 Lời giải chi tiết:
Đây là ba chỉ số cơ bản dùng để mô tả vị trí trung tâm hoặc giá trị đại diện của một phân phối dữ liệu. Kết luận Lý giải Trung bình, Trung vị, Yếu vị (Mode)
Câu 20:
Khi kích thước mẫu (sample size) tăng lên, sai số chuẩn của trung bình (Standard Error of the Mean) sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Sai số chuẩn được tính bằng độ lệch chuẩn chia cho căn bậc hai của n, nên khi n tăng thì sai số chuẩn giảm, làm tăng độ chính xác của ước lượng. Kết luận Lý giải Giảm đi
Câu 21:
Phân phối nhị thức (Binomial Distribution) phù hợp để mô tả hiện tượng nào sau đây?
💡 Lời giải chi tiết:
Phân phối nhị thức dùng cho các thí nghiệm lặp lại độc lập với hai kết quả có thể xảy ra (thành công/thất bại). Kết luận Lý giải Số lần xuất hiện mặt ngửa trong 10 lần tung đồng xu độc lập
Câu 22:
Đặc điểm nào sau đây mô tả một phân phối lệch trái (Negative Skewness)?
💡 Lời giải chi tiết:
Trong phân phối lệch trái, các giá trị thấp kéo giá trị trung bình xuống thấp hơn trung vị. Kết luận Lý giải Đuôi của phân phối kéo dài về phía bên trái (phía các giá trị nhỏ)
Câu 23:
Biểu đồ phân tán (Scatter plot) là công cụ hữu hiệu nhất để quan sát điều gì?
💡 Lời giải chi tiết:
Biểu đồ phân tán biểu diễn các cặp giá trị (X, Y) giúp nhận diện hình dạng và xu hướng liên kết giữa hai biến. Kết luận Lý giải Mối quan hệ giữa hai biến định lượng
Câu 24:
Khoảng biến thiên (Range) có nhược điểm lớn nhất là gì?
💡 Lời giải chi tiết:
Range chỉ sử dụng giá trị lớn nhất và nhỏ nhất nên không phản ánh được sự biến thiên của phần lớn dữ liệu bên trong. Kết luận Lý giải Chỉ dựa vào hai giá trị cực đoan và rất nhạy cảm với các giá trị ngoại lai
Câu 25:
Sai số chuẩn (Standard Error) khác với độ lệch chuẩn (Standard Deviation) ở điểm cốt lõi nào?
💡 Lời giải chi tiết:
Độ lệch chuẩn mô tả sự biến thiên trong mẫu, trong khi sai số chuẩn mô tả sự biến thiên của các trung bình mẫu quanh trung bình tổng thể. Kết luận Lý giải Độ lệch chuẩn đo lường sự phân tán của dữ liệu cá thể, còn sai số chuẩn đo lường độ chính xác của một ước lượng thống kê (như trung bình mẫu)