Bộ 4 - Trắc nghiệm Thống kê ứng dụng online có đáp án
Thời gian còn lại: --:--
Kết quả của bạn:
Bạn đã đúng:
Bạn đã sai:
Tổng số câu:
Câu 1:
Trong một phân phối lệch phải (dương), mối quan hệ phổ biến nhất giữa các số đo xu hướng trung tâm là gì?
💡 Lời giải chi tiết:
Trong phân phối lệch phải, các giá trị cực lớn kéo số trung bình về phía đuôi bên phải nhiều hơn so với số trung vị, Kết luận Lý giải Số trung bình lớn hơn số trung vị.
Câu 2:
Nếu mỗi giá trị trong tập dữ liệu đều được cộng thêm một hằng số k khác 0, độ lệch chuẩn của tập dữ liệu mới sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Việc cộng thêm một hằng số chỉ làm dịch chuyển vị trí của phân phối mà không làm thay đổi khoảng cách tương đối giữa các điểm dữ liệu hay độ phân tán, Kết luận Lý giải Không thay đổi.
Câu 3:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I, ký hiệu là alpha, là xác suất bác bỏ một giả thuyết không (H0) thực sự đúng trong thực tế, Kết luận Lý giải Bác bỏ giả thuyết H0 khi H0 đúng.
Câu 4:
Nếu giá trị p (p-value) thu được từ kiểm định là 0,02 và mức ý nghĩa alpha được chọn là 0,05, quyết định thống kê phù hợp là gì?
💡 Lời giải chi tiết:
Khi giá trị p nhỏ hơn mức ý nghĩa alpha, kết quả được coi là có ý nghĩa thống kê và ta có đủ bằng chứng để bác bỏ giả thuyết không, Kết luận Lý giải Bác bỏ giả thuyết H0.
Câu 5:
Hệ số tương quan Pearson (r) nhận giá trị trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan Pearson đo lường mức độ và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng trong phạm vi từ âm 1 đến dương 1, Kết luận Lý giải Từ -1 đến 1.
Câu 6:
Trong mô hình hồi quy tuyến tính đơn, hệ số xác định R-squared (R2) bằng 0,64 có ý nghĩa gì?
💡 Lời giải chi tiết:
R-squared cho biết tỷ lệ phần trăm sự biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập có trong mô hình hồi quy, Kết luận Lý giải 64% sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
Câu 7:
Khi giữ nguyên các yếu tố khác, việc tăng độ tin cậy từ 95% lên 99% sẽ làm cho khoảng tin cậy thay đổi như thế nào?
💡 Lời giải chi tiết:
Để có độ tin cậy cao hơn trong việc bao phủ tham số quần thể, giá trị tới hạn z hoặc t sẽ tăng lên dẫn đến biên sai số lớn hơn và khoảng tin cậy rộng hơn, Kết luận Lý giải Khoảng tin cậy rộng ra.
Câu 8:
Phương pháp chọn mẫu nào chia quần thể thành các nhóm có đặc điểm tương đồng rồi chọn mẫu ngẫu nhiên từ mỗi nhóm đó?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng đảm bảo các nhóm nhỏ (tầng) trong quần thể đều được đại diện tương ứng trong mẫu nghiên cứu, Kết luận Lý giải Chọn mẫu phân tầng (Stratified sampling).
Câu 9:
Kiểm định giả thuyết hai phía (two-tailed test) được sử dụng khi nào?
💡 Lời giải chi tiết:
Kiểm định hai phía được áp dụng khi nghiên cứu quan tâm đến bất kỳ sự khác biệt nào so với giá trị giả thuyết, dù lớn hơn hay nhỏ hơn, Kết luận Lý giải Khi muốn kiểm tra xem tham số có khác một giá trị cụ thể hay không.
Câu 10:
Phân phối t-Student thường được sử dụng thay cho phân phối chuẩn Z khi nào?
💡 Lời giải chi tiết:
Phân phối t có đuôi dày hơn phân phối chuẩn để bù đắp cho sự không chắc chắn khi ước lượng độ lệch chuẩn quần thể từ mẫu nhỏ, Kết luận Lý giải Kích thước mẫu nhỏ (n < 30) và chưa biết độ lệch chuẩn quần thể.
Câu 11:
Chỉ số nào sau đây ít bị ảnh hưởng nhất bởi các giá trị ngoại lệ (outliers) trong tập dữ liệu?
💡 Lời giải chi tiết:
IQR chỉ tập trung vào 50% dữ liệu ở giữa nên không bị tác động bởi các giá trị cực trị nằm ở hai đầu của phân phối, Kết luận Lý giải Khoảng trải giữa (Interquartile Range - IQR).
Câu 12:
Biến số 'Số lượng con trong một gia đình' thuộc loại biến nào?
💡 Lời giải chi tiết:
Số lượng con là kết quả của quá trình đếm và chỉ nhận các giá trị nguyên hữu hạn, do đó nó là biến rời rạc, Kết luận Lý giải Biến định lượng rời rạc.
Câu 13:
Trong một phân phối chuẩn hoàn hảo, điều nào sau đây là đúng?
💡 Lời giải chi tiết:
Phân phối chuẩn là phân phối đối xứng hoàn hảo qua tâm, nơi mà ba giá trị đại diện xu hướng trung tâm hội tụ tại một điểm, Kết luận Lý giải Số trung bình, số trung vị và số yếu vị bằng nhau.
Câu 14:
Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng khi kích thước mẫu n tăng lên đủ lớn thì:
💡 Lời giải chi tiết:
Định lý này khẳng định rằng hình dạng phân phối của các số trung bình mẫu sẽ tiến tới phân phối chuẩn bất kể hình dạng của phân phối quần thể gốc khi mẫu đủ lớn, Kết luận Lý giải Phân phối mẫu của số trung bình sẽ xấp xỉ phân phối chuẩn.
Câu 15:
Kiểm định Chi-bình phương (Chi-square) về tính độc lập được sử dụng để làm gì?
💡 Lời giải chi tiết:
Kiểm định Chi-bình phương tính độc lập so sánh tần số quan sát được với tần số kỳ vọng để xem hai biến phân loại có liên quan đến nhau không, Kết luận Lý giải Kiểm tra xem có mối liên hệ giữa hai biến định tính hay không.
Câu 16:
Trong phân tích phương sai (ANOVA) một nhân tố, giả thuyết không (H0) thường phát biểu là:
💡 Lời giải chi tiết:
Mục tiêu ban đầu của ANOVA là kiểm tra xem liệu tất cả các nhóm được so sánh có cùng một giá trị trung bình tổng thể hay không, Kết luận Lý giải Tất cả các trung bình nhóm đều bằng nhau.
Câu 17:
Hệ số biến thiên (Coefficient of Variation - CV) được sử dụng nhằm mục đích gì?
💡 Lời giải chi tiết:
CV là tỷ lệ giữa độ lệch chuẩn và số trung bình, giúp so sánh mức độ biến động tương đối giữa các nhóm dữ liệu không cùng quy mô hoặc đơn vị, Kết luận Lý giải So sánh độ phân tán của các tập dữ liệu có đơn vị đo khác nhau.
Câu 18:
Trong biểu đồ hộp (Box plot), các giá trị nằm ngoài các 'râu' (whiskers) thường được coi là gì?
💡 Lời giải chi tiết:
Theo quy tắc biểu đồ hộp, các điểm dữ liệu nằm xa hơn 1,5 lần IQR tính từ các cạnh của hộp được đánh dấu là các giá trị bất thường, Kết luận Lý giải Giá trị ngoại lệ (Outliers).
Câu 19:
Giả thuyết không (Null Hypothesis - H0) trong nghiên cứu thống kê thường mang ý nghĩa gì?
💡 Lời giải chi tiết:
H0 là giả thuyết mặc định được đặt ra để bác bỏ, thường giả định rằng các tác động hoặc sự khác biệt quan sát được chỉ là do ngẫu nhiên, Kết luận Lý giải Phát biểu rằng không có sự khác biệt hoặc không có hiệu ứng.
Câu 20:
Khi kích thước mẫu tăng lên, sai số chuẩn của số trung bình (Standard Error of the Mean) sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Sai số chuẩn tỉ lệ nghịch với căn bậc hai của kích thước mẫu, nên mẫu càng lớn thì sai số của ước lượng trung bình càng nhỏ, Kết luận Lý giải Giảm đi.
Câu 21:
Nếu hệ số tương quan giữa X và Y là âm, thì hệ số góc (slope) của đường hồi quy tuyến tính giữa chúng sẽ như thế nào?
💡 Lời giải chi tiết:
Hệ số tương quan và hệ số góc trong hồi quy tuyến tính đơn luôn có cùng dấu vì chúng cùng phản ánh chiều hướng của mối quan hệ, Kết luận Lý giải Âm.
Câu 22:
Sai lệch do chọn mẫu (Sampling Bias) xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lệch chọn mẫu xuất hiện khi phương pháp lấy mẫu không đảm bảo tính đại diện khách quan cho toàn bộ quần thể nghiên cứu, Kết luận Lý giải Một số thành phần của quần thể có xác suất được chọn thấp hơn những thành phần khác.
Câu 23:
Số đo xu hướng trung tâm nào phù hợp nhất để mô tả dữ liệu định danh (nominal), ví dụ như 'Màu sắc yêu thích'?
💡 Lời giải chi tiết:
Với dữ liệu định danh không có thứ tự hay giá trị số, ta chỉ có thể xác định giá trị xuất hiện phổ biến nhất trong tập dữ liệu, Kết luận Lý giải Số yếu vị (Mode).
Câu 24:
Hiệp phương sai (Covariance) giữa hai biến mang giá trị dương cho biết điều gì?
💡 Lời giải chi tiết:
Hiệp phương sai dương phản ánh xu hướng các biến biến đổi cùng chiều với nhau so với giá trị trung bình của chúng, Kết luận Lý giải Hai biến có xu hướng cùng tăng hoặc cùng giảm.
Câu 25:
Mức ý nghĩa alpha trong kiểm định giả thuyết đại diện cho điều gì?
💡 Lời giải chi tiết:
Alpha là ngưỡng rủi ro mà nhà nghiên cứu chấp nhận khi bác bỏ giả thuyết không trong khi nó thực sự đúng, Kết luận Lý giải Xác suất tối đa chấp nhận được của việc phạm sai lầm loại I.