Câu 1:
Trong các thang đo sau đây, thang đo nào có đặc điểm của thang đo khoảng nhưng có thêm điểm '0' tuyệt đối?
💡 Lời giải chi tiết:
Theo lý thuyết thống kê, thang đo tỷ lệ là thang đo cao nhất, bao gồm đầy đủ các đặc tính của thang đo khoảng và có điểm '0' thực sự cho phép thực hiện các phép tính tỷ lệ. Kết luận Lý giải: Thang đo tỷ lệ (Ratio scale)
Câu 2:
Đại lượng nào sau đây đo lường mức độ biến thiên của dữ liệu và có cùng đơn vị tính với dữ liệu gốc?
💡 Lời giải chi tiết:
Độ lệch chuẩn là căn bậc hai của phương sai, giúp đưa giá trị đo lường sự phân tán về cùng đơn vị tính với dữ liệu ban đầu để dễ dàng diễn giải. Kết luận Lý giải: Độ lệch chuẩn (Standard Deviation)
Câu 3:
Khi phân phối của tập dữ liệu bị lệch phải (Skewed to the right), mối quan hệ nào sau đây thường đúng?
💡 Lời giải chi tiết:
Trong một phân phối lệch phải, các giá trị cực lớn kéo giá trị trung bình lên cao nhất, tiếp theo là trung vị và thấp nhất là yếu vị (đỉnh của biểu đồ). Kết luận Lý giải: Trung bình > Trung vị > Yếu vị
Câu 4:
Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I Error) xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I, hay còn gọi là mức ý nghĩa alpha, là xác suất đưa ra quyết định bác bỏ một giả thuyết không (H0) trong khi nó thực tế là đúng. Kết luận Lý giải: Bác bỏ giả thuyết H0 khi H0 đúng
Câu 5:
Giá trị P (P-value) trong kiểm định giả thuyết được hiểu một cách chính xác nhất là gì?
💡 Lời giải chi tiết:
Giá trị P đo lường bằng chứng chống lại H0 bằng cách tính xác suất nhận được kết quả mẫu nếu giả thuyết H0 thực sự tồn tại. Kết luận Lý giải: Xác suất quan sát được dữ liệu như thực tế hoặc cực đoan hơn nếu giả thuyết H0 là đúng
Câu 6:
Phương pháp chọn mẫu nào chia tổng thể thành các nhóm đồng nhất và sau đó chọn ngẫu nhiên các đơn vị từ mỗi nhóm đó?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng đảm bảo các nhóm nhỏ (tầng) trong tổng thể đều được đại diện bằng cách lấy mẫu ngẫu nhiên từ từng tầng đã được phân loại. Kết luận Lý giải: Chọn mẫu phân tầng (Stratified sampling)
Câu 7:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn dùng để đo lường điều gì?
💡 Lời giải chi tiết:
Hệ số xác định R bình phương biểu thị phần trăm sự biến thiên của biến Y có thể được giải thích bởi sự biến thiên của biến X thông qua mô hình hồi quy. Kết luận Lý giải: Tỷ lệ biến động của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình
Câu 8:
Theo Quy tắc thực nghiệm (Empirical Rule) cho phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi 2 độ lệch chuẩn tính từ giá trị trung bình?
💡 Lời giải chi tiết:
Trong phân phối chuẩn, quy tắc 68-95-99.7 xác định rằng khoảng 95% quan sát sẽ rơi vào phạm vi cộng hoặc trừ 2 lần độ lệch chuẩn quanh giá trị trung bình. Kết luận Lý giải: 95%
Câu 9:
Nếu hệ số tương quan tuyến tính (r) giữa hai biến X và Y bằng -1, điều này có nghĩa là gì?
💡 Lời giải chi tiết:
Giá trị r = -1 chỉ ra rằng tất cả các điểm dữ liệu nằm chính xác trên một đường thẳng có độ dốc âm, thể hiện sự tương quan nghịch hoàn hảo. Kết luận Lý giải: Có mối liên hệ tuyến tính nghịch biến hoàn hảo giữa X và Y
Câu 10:
Định lý giới hạn trung tâm (Central Limit Theorem) có vai trò quan trọng nhất trong việc gì?
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm là nền tảng của thống kê suy diễn, khẳng định rằng phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn bất kể hình dạng của tổng thể gốc nếu mẫu đủ lớn. Kết luận Lý giải: Cho phép giả định phân phối của số trung bình mẫu tiến về phân phối chuẩn khi kích thước mẫu đủ lớn
Câu 11:
Khi so sánh sự phân tán của hai tập dữ liệu có đơn vị tính khác nhau hoặc giá trị trung bình khác nhau đáng kể, ta nên dùng đại lượng nào?
💡 Lời giải chi tiết:
Hệ số biến thiên (CV) là một chỉ số tương đối (tính bằng tỷ lệ giữa độ lệch chuẩn và trung bình), cho phép so sánh độ phân tán giữa các tập dữ liệu không cùng đơn vị. Kết luận Lý giải: Hệ số biến thiên (Coefficient of Variation)
Câu 12:
Trong phân tích dãy số thời gian, thành phần phản ánh những biến động có tính chất lặp lại định kỳ trong vòng một năm được gọi là gì?
💡 Lời giải chi tiết:
Biến động thời vụ mô tả các mô hình dữ liệu lặp lại theo chu kỳ ngắn hạn như tháng hoặc quý trong phạm vi một năm do các yếu tố khí hậu hoặc tập quán. Kết luận Lý giải: Biến động thời vụ (Seasonal variation)
Câu 13:
Để so sánh giá trị trung bình của nhiều hơn hai tổng thể độc lập, phương pháp thống kê nào thường được sử dụng?
💡 Lời giải chi tiết:
Phân tích phương sai (ANOVA) được thiết kế để kiểm tra xem có sự khác biệt có ý nghĩa thống kê nào giữa các giá trị trung bình của ba nhóm trở lên hay không. Kết luận Lý giải: Phân tích phương sai (ANOVA)
Câu 14:
Độ rộng của khoảng tin cậy cho giá trị trung bình của tổng thể sẽ thay đổi như thế nào nếu kích thước mẫu tăng lên (với các yếu tố khác không đổi)?
💡 Lời giải chi tiết:
Khi kích thước mẫu tăng, sai số chuẩn của số trung bình giảm xuống, dẫn đến biên độ sai số nhỏ hơn và khoảng tin cậy trở nên chính xác (hẹp) hơn. Kết luận Lý giải: Khoảng tin cậy sẽ hẹp lại
Câu 15:
Chỉ số Laspeyres là chỉ số giá dùng để đo lường sự thay đổi giá cả với quyền số là gì?
💡 Lời giải chi tiết:
Theo định nghĩa trong thống kê kinh tế, chỉ số giá Laspeyres sử dụng cơ cấu lượng của kỳ gốc làm quyền số cố định để so sánh sự biến động của giá cả. Kết luận Lý giải: Lượng hàng hóa ở kỳ gốc
Câu 16:
Trong một phân phối chuẩn hóa (Standard Normal Distribution), giá trị trung bình và độ lệch chuẩn lần lượt là bao nhiêu?
💡 Lời giải chi tiết:
Phân phối chuẩn hóa (Z-distribution) là trường hợp đặc biệt của phân phối chuẩn với trung bình được quy ước bằng 0 và độ lệch chuẩn bằng 1. Kết luận Lý giải: Trung bình = 0, Độ lệch chuẩn = 1
Câu 17:
Biểu đồ nào là phù hợp nhất để thể hiện mối quan hệ giữa hai biến định lượng?
💡 Lời giải chi tiết:
Biểu đồ tán xạ hiển thị các cặp giá trị (X, Y) dưới dạng các điểm trên mặt phẳng tọa độ, giúp nhận diện hình dáng và mức độ liên hệ giữa hai biến số. Kết luận Lý giải: Biểu đồ tán xạ (Scatter plot)
Câu 18:
Giá trị nào sau đây không bị ảnh hưởng bởi các giá trị đột biến (outliers) trong tập dữ liệu?
💡 Lời giải chi tiết:
Trung vị là giá trị đứng giữa tập dữ liệu đã sắp xếp, nên nó có tính bền vững (robust) và không bị kéo lệch bởi các giá trị cực biên như số trung bình. Kết luận Lý giải: Trung vị (Median)
Câu 19:
Trong kiểm định Chi-bình phương về tính độc lập, giả thuyết không (H0) thường phát biểu là gì?
💡 Lời giải chi tiết:
Kiểm định Chi-bình phương tính độc lập bắt đầu với giả định mặc định rằng không có sự liên hệ giữa hai biến định danh đang xem xét. Kết luận Lý giải: Hai biến độc lập với nhau
Câu 20:
Nếu một biến ngẫu nhiên có xác suất thành công (p) không đổi qua các phép thử độc lập, số lần thành công trong 'n' phép thử tuân theo phân phối nào?
💡 Lời giải chi tiết:
Phân phối nhị thức mô tả số lần thành công trong một số lượng phép thử Bernoulli cố định, trong đó mỗi phép thử chỉ có hai kết quả và xác suất thành công là hằng số. Kết luận Lý giải: Phân phối nhị thức (Binomial)
Câu 21:
Sai số nào xuất hiện do việc ta chỉ điều tra trên một phần của tổng thể thay vì toàn bộ tổng thể?
💡 Lời giải chi tiết:
Sai số chọn mẫu là sự khác biệt tất yếu giữa các đặc trưng của mẫu và đặc trưng của tổng thể do tính chất ngẫu nhiên khi lấy mẫu. Kết luận Lý giải: Sai số chọn mẫu (Sampling error)
Câu 22:
Khoảng cách giữa tứ phân vị thứ nhất (Q1) và tứ phân vị thứ ba (Q3) được gọi là gì?
💡 Lời giải chi tiết:
Khoảng trải giữa (IQR) đo lường độ phân tán của 50% dữ liệu ở giữa, giúp loại bỏ ảnh hưởng của các giá trị cực đoan ở hai đầu. Kết luận Lý giải: Khoảng trải giữa (Interquartile Range - IQR)
Câu 23:
Trong mô hình hồi quy Y = a + bX, đại lượng 'b' đại diện cho điều gì?
💡 Lời giải chi tiết:
Hệ số hồi quy 'b' cho biết độ nhạy của biến phụ thuộc Y đối với sự thay đổi của biến độc lập X trong mô hình tuyến tính. Kết luận Lý giải: Hệ số góc (độ dốc) phản ánh mức thay đổi trung bình của Y khi X tăng 1 đơn vị
Câu 24:
Khi kích thước mẫu nhỏ (n < 30) và chưa biết phương sai tổng thể, ta nên sử dụng phân phối nào để xây dựng khoảng tin cậy cho trung bình?
💡 Lời giải chi tiết:
Phân phối t-Student được sử dụng thay cho phân phối chuẩn khi ước lượng trung bình tổng thể từ mẫu nhỏ và phải dùng độ lệch chuẩn mẫu để thay thế cho độ lệch chuẩn tổng thể. Kết luận Lý giải: Phân phối t (Student)
Câu 25:
Thành phần nào trong dãy số thời gian mô tả những biến động không dự báo được và không có quy luật?
💡 Lời giải chi tiết:
Biến động ngẫu nhiên là những thay đổi trong dữ liệu thời gian phát sinh từ các sự kiện bất thường, không lường trước được và không có tính chu kỳ. Kết luận Lý giải: Thành phần ngẫu nhiên (Irregular)