Câu 1:
Trong thống kê học, loại thang đo nào là cấp độ đo lường cao nhất và có điểm gốc '0' tuyệt đối?
💡 Lời giải chi tiết:
Theo phân loại của Stevens, thang đo tỷ lệ là cấp độ đo lường cao nhất vì nó cho phép thực hiện tất cả các phép tính số học nhờ có điểm gốc '0' thực sự, vì vậy Kết luận Lý giải Thang đo tỷ lệ.
Câu 2:
Khi phân phối của dữ liệu bị lệch phải (lệch dương), mối quan hệ nào sau đây thường đúng giữa các số trung bình?
💡 Lời giải chi tiết:
Trong một phân phối lệch phải, các giá trị cực lớn kéo số trung bình về phía bên phải làm cho nó lớn hơn trung vị, vì vậy Kết luận Lý giải Trung bình lớn hơn Trung vị.
Câu 3:
Đại lượng nào sau đây đo lường mức độ biến thiên của dữ liệu và có cùng đơn vị tính với dữ liệu gốc?
💡 Lời giải chi tiết:
Độ lệch chuẩn là căn bậc hai của phương sai nên nó phản ánh mức độ phân tán của dữ liệu và giữ nguyên đơn vị đo lường của biến số, vì vậy Kết luận Lý giải Độ lệch chuẩn.
Câu 4:
Phương pháp chọn mẫu nào đảm bảo mọi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu là như nhau?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là phương pháp chọn mẫu xác suất cơ bản nhất đảm bảo tính khách quan bằng cách cho mỗi đơn vị tổng thể cơ hội ngang nhau, vì vậy Kết luận Lý giải Chọn mẫu ngẫu nhiên đơn giản.
Câu 5:
Trong kiểm định giả thuyết thống kê, sai lầm loại I được định nghĩa là gì?
💡 Lời giải chi tiết:
Sai lầm loại I (alpha) xảy ra khi kết luận bác bỏ giả thuyết không (H0) dù trong thực tế giả thuyết đó là đúng, vì vậy Kết luận Lý giải Bác bỏ giả thuyết H0 khi H0 đúng.
Câu 6:
Giá trị p (p-value) trong kiểm định giả thuyết cho biết điều gì?
💡 Lời giải chi tiết:
Giá trị p là thước đo bằng chứng chống lại giả thuyết H0, phản ánh xác suất thu được dữ liệu mẫu nếu giả thuyết H0 thực sự đúng, vì vậy Kết luận Lý giải Xác suất quan sát được kết quả như thực tế hoặc cực đoan hơn nếu H0 đúng.
Câu 7:
Theo quy tắc kinh nghiệm (Empirical Rule) cho phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi 2 độ lệch chuẩn tính từ số trung bình?
💡 Lời giải chi tiết:
Quy tắc 68-95-99.7 quy định rằng trong phân phối chuẩn, khoảng 95% quan sát sẽ rơi vào khoảng cộng trừ 2 độ lệch chuẩn quanh giá trị trung bình, vì vậy Kết luận Lý giải 95%.
Câu 8:
Định lý giới hạn trung tâm (Central Limit Theorem) khẳng định điều gì về phân phối của trung bình mẫu khi kích thước mẫu n đủ lớn?
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm là nền tảng của thống kê suy diễn, chỉ ra rằng trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi mẫu lớn, vì vậy Kết luận Lý giải Nó sẽ trở thành phân phối chuẩn bất kể phân phối của tổng thể.
Câu 9:
Nếu độ tin cậy của một khoảng tin cậy tăng lên (ví dụ từ 90% lên 95%) trong khi các yếu tố khác không đổi, thì độ rộng của khoảng tin cậy sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Khi tăng độ tin cậy, giá trị tới hạn (Z hoặc T) tăng lên dẫn đến sai số biên tăng, làm cho khoảng tin cậy trở nên rộng hơn, vì vậy Kết luận Lý giải Rộng ra.
Câu 10:
Phân phối T-Student thường được sử dụng thay cho phân phối chuẩn Z khi thực hiện kiểm định trung bình trong trường hợp nào?
💡 Lời giải chi tiết:
Phân phối T được thiết kế để hiệu chỉnh sai số khi ước lượng phương sai tổng thể từ mẫu nhỏ, thường là dưới 30 quan sát, vì vậy Kết luận Lý giải Kích thước mẫu nhỏ và chưa biết phương sai tổng thể.
Câu 11:
Hệ số tương quan tuyến tính Pearson (r) nhận giá trị trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số r đo lường sức mạnh và chiều hướng của mối quan hệ tuyến tính giữa hai biến, với giá trị dao động từ cực đoan âm đến cực đoan dương, vì vậy Kết luận Lý giải Từ -1 đến 1.
Câu 12:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn có ý nghĩa gì?
💡 Lời giải chi tiết:
R-squared phản ánh tỷ lệ phần trăm sự biến động của biến kết quả (Y) có thể được giải thích bằng biến dự báo (X) trong mô hình, vì vậy Kết luận Lý giải Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình.
Câu 13:
Trong phân tích phương sai (ANOVA), giả thuyết không (H0) thường phát biểu điều gì?
💡 Lời giải chi tiết:
ANOVA được dùng để kiểm tra xem liệu có sự khác biệt có ý nghĩa thống kê giữa các nhóm hay không bằng cách giả định ban đầu rằng chúng bằng nhau, vì vậy Kết luận Lý giải Tất cả các số trung bình của các nhóm đều bằng nhau.
Câu 14:
Thành phần nào trong dãy số thời gian phản ánh những biến động có tính chất lặp lại định kỳ trong vòng một năm?
💡 Lời giải chi tiết:
Biến động thời vụ mô tả các mô hình dữ liệu lặp lại theo chu kỳ thời gian cố định như tháng, quý hoặc mùa trong năm, vì vậy Kết luận Lý giải Biến động thời vụ (Seasonal variation).
Câu 15:
Chỉ số giá Laspeyres sử dụng quyền số (lượng hàng hóa) ở thời kỳ nào?
💡 Lời giải chi tiết:
Chỉ số Laspeyres là chỉ số giá tổng hợp sử dụng cơ cấu lượng hàng hóa tiêu thụ tại thời điểm gốc làm trọng số so sánh, vì vậy Kết luận Lý giải Thời kỳ gốc.
Câu 16:
Giá trị nào trong các số đo xu hướng trung tâm ít bị ảnh hưởng nhất bởi các giá trị ngoại lai (outliers)?
💡 Lời giải chi tiết:
Trung vị là giá trị đứng giữa tập dữ liệu đã sắp xếp nên nó không bị kéo lệch bởi các giá trị cực biên như số trung bình, vì vậy Kết luận Lý giải Trung vị.
Câu 17:
Một tham số (parameter) là một đại lượng đặc trưng đo lường từ đối tượng nào sau đây?
💡 Lời giải chi tiết:
Trong thống kê, tham số dùng để chỉ các đặc trưng của toàn bộ tổng thể, trong khi số thống kê dùng để chỉ đặc trưng của mẫu, vì vậy Kết luận Lý giải Tổng thể.
Câu 18:
Biến số 'Số lượng sinh viên trong một lớp học' thuộc loại dữ liệu nào?
💡 Lời giải chi tiết:
Số lượng sinh viên là kết quả của phép đếm và chỉ có thể nhận các giá trị nguyên, do đó nó là biến rời rạc, vì vậy Kết luận Lý giải Dữ liệu định lượng rời rạc.
Câu 19:
Sai số chuẩn (Standard Error) của số trung bình mẫu cho biết điều gì?
💡 Lời giải chi tiết:
Sai số chuẩn phản ánh sự phân tán của các giá trị trung bình mẫu khi rút ra từ cùng một tổng thể, đo lường độ chính xác của ước lượng, vì vậy Kết luận Lý giải Mức độ biến thiên của các trung bình mẫu quanh trung bình tổng thể.
Câu 20:
Trong một phân phối có hệ số độ lệch (Skewness) bằng -2.5, hình dáng của đường cong phân phối sẽ như thế nào?
💡 Lời giải chi tiết:
Hệ số Skewness âm chỉ ra rằng phân phối có đuôi kéo dài về phía bên trái, nơi tập trung các giá trị nhỏ, vì vậy Kết luận Lý giải Lệch trái (đuôi dài bên trái).
Câu 21:
Để so sánh mức độ biến thiên của hai tập dữ liệu có đơn vị tính khác nhau, ta nên dùng đại lượng nào?
💡 Lời giải chi tiết:
Hệ số biến thiên là tỷ lệ giữa độ lệch chuẩn và số trung bình, cho phép so sánh độ phân tán tương đối mà không phụ thuộc đơn vị đo, vì vậy Kết luận Lý giải Hệ số biến thiên (CV).
Câu 22:
Điều kiện quan trọng nhất để áp dụng phân phối nhị thức (Binomial Distribution) là gì?
💡 Lời giải chi tiết:
Phân phối nhị thức dựa trên các phép thử Bernoulli độc lập, trong đó mỗi lần thử chỉ có hai trạng thái đối nghịch như thành công hoặc thất bại, vì vậy Kết luận Lý giải Chỉ có hai kết quả có thể xảy ra trong mỗi phép thử độc lập.
Câu 23:
Trong kiểm định Chi-bình phương về tính độc lập, mục tiêu chính là gì?
💡 Lời giải chi tiết:
Kiểm định Chi-square độc lập được thiết kế để đánh giá liệu tần suất quan sát được của các danh mục có khác biệt đáng kể so với kỳ vọng nếu các biến không liên quan, vì vậy Kết luận Lý giải Xác định xem có mối liên hệ giữa hai biến định tính hay không.
Câu 24:
Bậc tự do (Degrees of Freedom) cho kiểm định T một mẫu với kích thước mẫu n được tính như thế nào?
💡 Lời giải chi tiết:
Trong thống kê, bậc tự do cho trung bình mẫu là số lượng quan sát có thể tự do thay đổi sau khi đã tính toán một tham số (ở đây là số trung bình), vì vậy Kết luận Lý giải n - 1.
Câu 25:
Trong mô hình hồi quy, phần dư (Residual) được định nghĩa là gì?
💡 Lời giải chi tiết:
Phần dư phản ánh sai số của mô hình tại mỗi điểm quan sát, tính bằng cách lấy giá trị quan sát trừ đi giá trị nằm trên đường hồi quy, vì vậy Kết luận Lý giải Sự khác biệt giữa giá trị thực tế và giá trị dự báo bởi mô hình.