Câu 1:
Trong thống kê học, thang đo nào cho phép thực hiện tất cả các phép tính số học và có điểm '0' tuyệt đối?
💡 Lời giải chi tiết:
Thang đo tỷ lệ là thang đo cao nhất, có đầy đủ đặc tính của các thang đo khác và sở hữu điểm '0' thực sự cho phép tính toán tỷ lệ giữa các giá trị. Kết luận Lý giải: Thang đo tỷ lệ
Câu 2:
Giá trị nào trong các số đo xu hướng trung tâm bị ảnh hưởng mạnh nhất bởi các giá trị ngoại lệ (outliers)?
💡 Lời giải chi tiết:
Số trung bình số học được tính toán dựa trên tất cả các giá trị trong tập dữ liệu, nên chỉ cần một giá trị cực biên cũng làm thay đổi đáng kể kết quả. Kết luận Lý giải: Số trung bình số học
Câu 3:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết thống kê được định nghĩa là gì?
💡 Lời giải chi tiết:
Sai lầm loại I xảy ra khi chúng ta bác bỏ một giả thuyết không (H0) mặc dù trong thực tế giả thuyết đó là đúng. Kết luận Lý giải: Bác bỏ giả thuyết H0 khi H0 đúng
Câu 4:
Hệ số tương quan Pearson (r) nhận giá trị trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan Pearson đo lường mức độ chặt chẽ của mối liên hệ tuyến tính và luôn nằm trong đoạn từ -1 đến 1. Kết luận Lý giải: Từ -1 đến 1
Câu 5:
Theo Định lý giới hạn trung tâm, khi kích thước mẫu n đủ lớn, phân phối của số trung bình mẫu sẽ xấp xỉ phân phối nào?
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm khẳng định rằng với mẫu đủ lớn, phân phối xác suất của trung bình mẫu sẽ tiến về phân phối chuẩn bất kể phân phối của tổng thể ban đầu. Kết luận Lý giải: Phân phối chuẩn
Câu 6:
Chỉ số nào dùng để so sánh độ biến thiên của hai tập dữ liệu có đơn vị tính khác nhau hoặc có số trung bình khác nhau?
💡 Lời giải chi tiết:
Hệ số biến thiên (CV) là tỷ lệ giữa độ lệch chuẩn và số trung bình, giúp so sánh mức độ phân tán tương đối giữa các tập dữ liệu không cùng quy mô. Kết luận Lý giải: Hệ số biến thiên (CV)
Câu 7:
Trong một phân phối chuẩn, khoảng 'trung bình cộng trừ 1 lần độ lệch chuẩn' chứa xấp xỉ bao nhiêu phần trăm dữ liệu?
💡 Lời giải chi tiết:
Theo quy tắc thực nghiệm 68-95-99.7 của phân phối chuẩn, khoảng một lần độ lệch chuẩn quanh giá trị trung bình chứa khoảng 68% quan sát. Kết luận Lý giải: 68%
Câu 8:
Chỉ số giá Laspeyres sử dụng quyền số là lượng hàng hóa của thời kỳ nào?
💡 Lời giải chi tiết:
Chỉ số Laspeyres đo lường sự thay đổi giá bằng cách giữ nguyên giỏ hàng hóa tại thời kỳ gốc làm quyền số so sánh. Kết luận Lý giải: Thời kỳ gốc
Câu 9:
Phân tích biến phương (ANOVA) được sử dụng chủ yếu để làm gì?
💡 Lời giải chi tiết:
ANOVA là kỹ thuật thống kê dùng để kiểm định sự khác biệt giữa các giá trị trung bình của nhiều nhóm độc lập nhằm xem yếu tố nguyên nhân có tác động không. Kết luận Lý giải: So sánh trung bình của từ ba nhóm trở lên
Câu 10:
Biến số 'Thu nhập hàng tháng của hộ gia đình' thuộc loại biến số nào?
💡 Lời giải chi tiết:
Thu nhập là biến định lượng có thể nhận bất kỳ giá trị thực nào trong một khoảng nhất định, do đó nó được phân loại là biến liên tục. Kết luận Lý giải: Biến định lượng liên tục
Câu 11:
Độ lệch chuẩn là căn bậc hai số học của chỉ số nào sau đây?
💡 Lời giải chi tiết:
Độ lệch chuẩn được định nghĩa là căn bậc hai của phương sai nhằm đưa đơn vị đo lường về cùng bậc với dữ liệu gốc. Kết luận Lý giải: Phương sai
Câu 12:
Khi kiểm định trung bình tổng thể với kích thước mẫu nhỏ (n < 30) và chưa biết phương sai tổng thể, ta sử dụng phân phối nào?
💡 Lời giải chi tiết:
Phân phối t-Student được sử dụng thay cho phân phối chuẩn khi kích thước mẫu nhỏ và độ lệch chuẩn của tổng thể không được xác định. Kết luận Lý giải: Phân phối t-Student
Câu 13:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính cho biết điều gì?
💡 Lời giải chi tiết:
R-squared đo lường phần trăm sự biến động của biến phụ thuộc (Y) có thể được giải thích bởi sự biến động của các biến độc lập (X) trong mô hình. Kết luận Lý giải: Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
Câu 14:
Phương pháp chọn mẫu nào đảm bảo mọi đơn vị trong tổng thể đều có cơ hội được chọn ngang nhau và độc lập?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là kỹ thuật lấy mẫu cơ bản nhất trong thống kê suy diễn, đảm bảo tính khách quan và xác suất chọn đồng đều. Kết luận Lý giải: Chọn mẫu ngẫu nhiên đơn giản
Câu 15:
Nếu hệ số tương quan r = -0.85, mối quan hệ giữa hai biến X và Y được nhận xét như thế nào?
💡 Lời giải chi tiết:
Dấu âm của hệ số r cho thấy mối quan hệ nghịch biến và trị tuyệt đối 0.85 thể hiện mức độ liên kết chặt chẽ (mạnh). Kết luận Lý giải: Tương quan nghịch rất mạnh
Câu 16:
Trong kiểm định giả thuyết, nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa alpha, ta sẽ đưa ra quyết định gì?
💡 Lời giải chi tiết:
P-value thấp cho thấy xác suất xảy ra của dữ liệu mẫu dưới giả thuyết H0 là rất thấp, dẫn đến việc bác bỏ H0 để ủng hộ H1. Kết luận Lý giải: Bác bỏ giả thuyết H0
Câu 17:
Khi độ tin cậy tăng lên (ví dụ từ 95% lên 99%) và các yếu tố khác không đổi, độ rộng của khoảng tin cậy sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Để tăng độ tin cậy trong việc bao phủ tham số tổng thể, ta cần một phạm vi giá trị lớn hơn, dẫn đến khoảng tin cậy dài hơn. Kết luận Lý giải: Mở rộng ra
Câu 18:
Thành phần nào trong chuỗi thời gian thể hiện những biến động lặp lại theo chu kỳ dưới một năm?
💡 Lời giải chi tiết:
Biến động mùa vụ phản ánh những quy luật thay đổi lặp lại trong các khoảng thời gian ngắn như quý hoặc tháng trong vòng một năm. Kết luận Lý giải: Biến động mùa vụ (Seasonal)
Câu 19:
Sai số chọn mẫu xảy ra do nguyên nhân chủ yếu nào?
💡 Lời giải chi tiết:
Sai số chọn mẫu là sự khác biệt tất yếu giữa các đặc trưng của mẫu và đặc trưng của tổng thể do tính chất đại diện thay vì điều tra toàn bộ. Kết luận Lý giải: Do dùng mẫu để suy rộng cho tổng thể
Câu 20:
Giả thuyết đối (H1) thường được đặt ra nhằm mục đích gì trong nghiên cứu khoa học?
💡 Lời giải chi tiết:
Giả thuyết đối thường phản ánh nghi vấn hoặc kỳ vọng của nhà nghiên cứu về một sự thay đổi hay khác biệt cần được kiểm chứng bằng dữ liệu. Kết luận Lý giải: Khẳng định điều mà nhà nghiên cứu kỳ vọng hoặc muốn chứng minh
Câu 21:
Đặc điểm chính của giá trị Yếu vị (Mode) là gì?
💡 Lời giải chi tiết:
Yếu vị là tham số mô tả đặc trưng tập trung của dữ liệu dựa trên mức độ phổ biến hay tần suất xuất hiện cao nhất của một giá trị. Kết luận Lý giải: Là giá trị có tần số xuất hiện nhiều nhất
Câu 22:
Thang đo nào là thấp nhất và chỉ dùng để đặt tên hoặc phân loại các đối tượng?
💡 Lời giải chi tiết:
Thang đo định danh dùng để gán nhãn hoặc phân nhóm các đối tượng mà không có sự so sánh hơn kém hay tính toán số học. Kết luận Lý giải: Thang đo định danh
Câu 23:
Phân phối xác suất nào thường được dùng để mô tả số lần xảy ra của một sự kiện trong một khoảng thời gian hoặc không gian nhất định?
💡 Lời giải chi tiết:
Phân phối Poisson là mô hình xác suất rời rạc phù hợp cho các sự kiện xảy ra độc lập với một tỷ lệ trung bình xác định trong một đơn vị đo lường. Kết luận Lý giải: Phân phối Poisson
Câu 24:
Trong biểu đồ hộp (Box plot), đường kẻ nằm bên trong hình hộp đại diện cho giá trị nào?
💡 Lời giải chi tiết:
Đường kẻ ngang bên trong hộp chia tập dữ liệu thành hai phần bằng nhau về số lượng quan sát, đó chính là tứ phân vị thứ hai hay trung vị. Kết luận Lý giải: Trung vị (Q2)
Câu 25:
Chỉ số độ nhọn (Kurtosis) của một phân phối chuẩn hoàn hảo bằng bao nhiêu?
💡 Lời giải chi tiết:
Theo định nghĩa thống kê truyền thống, độ nhọn của phân phối chuẩn bằng 3 (nếu dùng độ nhọn dư thì giá trị này sẽ được trừ đi 3 để bằng 0). Kết luận Lý giải: 3