Câu 1:
Trong thống kê, loại dữ liệu nào mô tả các đặc tính không thể đo lường bằng số như màu mắt hoặc tình trạng hôn nhân?
💡 Lời giải chi tiết:
Dữ liệu định tính dùng để phân loại hoặc mô tả các thuộc tính của đối tượng mà không mang giá trị số học trực tiếp. Kết luận Lý giải: Dữ liệu định tính (Qualitative)
Câu 2:
Khi một phân phối có hình chuông cân đối hoàn hảo, mối quan hệ giữa số trung bình (Mean), số trung vị (Median) và yếu tố yếu vị (Mode) là gì?
💡 Lời giải chi tiết:
Trong một phân phối chuẩn đối xứng, ba giá trị đo lường xu hướng trung tâm này sẽ hội tụ tại cùng một điểm cao nhất của biểu đồ. Kết luận Lý giải: Mean = Median = Mode
Câu 3:
Chỉ số nào sau đây dùng để đo lường độ biến thiên tương đối giữa các tập dữ liệu có đơn vị tính khác nhau?
💡 Lời giải chi tiết:
Hệ số biến thiên (CV) được tính bằng tỷ lệ giữa độ lệch chuẩn và số trung bình, cho phép so sánh mức độ phân tán mà không bị ảnh hưởng bởi đơn vị đo. Kết luận Lý giải: Hệ số biến thiên (CV)
Câu 4:
Nếu tất cả các giá trị trong một tập dữ liệu đều được cộng thêm cùng một hằng số k, thì độ lệch chuẩn của tập dữ liệu mới sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Việc cộng thêm hằng số chỉ làm dịch chuyển vị trí của phân phối trên trục số mà không làm thay đổi khoảng cách giữa các giá trị. Kết luận Lý giải: Không thay đổi
Câu 5:
Theo quy tắc kinh nghiệm (Empirical Rule), trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi 2 độ lệch chuẩn tính từ số trung bình?
💡 Lời giải chi tiết:
Quy tắc 68-95-99,7 xác định rằng khoảng 95% quan sát sẽ rơi vào khoảng cộng trừ 2 độ lệch chuẩn quanh giá trị trung bình. Kết luận Lý giải: 95%
Câu 6:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I xảy ra khi chúng ta kết luận có sự khác biệt hoặc tác động (bác bỏ H0) trong khi thực tế không có (H0 đúng). Kết luận Lý giải: Bác bỏ giả thuyết H0 khi H0 thực sự đúng
Câu 7:
Hệ số tương quan Pearson (r) có giá trị nằm trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan đo lường mức độ và chiều hướng của mối quan hệ tuyến tính, với giá trị tối thiểu là -1 và tối đa là 1. Kết luận Lý giải: Từ -1 đến 1
Câu 8:
Phương pháp chọn mẫu nào chia tổng thể thành các nhóm đồng nhất (strata) trước khi chọn mẫu ngẫu nhiên từ mỗi nhóm?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng đảm bảo mọi nhóm nhỏ quan trọng trong tổng thể đều được đại diện trong mẫu nghiên cứu. Kết luận Lý giải: Chọn mẫu phân tầng (Stratified sampling)
Câu 9:
Trong hồi quy tuyến tính đơn, hệ số xác định (R-squared) bằng 0,81 có ý nghĩa gì?
💡 Lời giải chi tiết:
R-squared đo lường tỷ lệ phần trăm sự biến động của biến phụ thuộc (Y) mà mô hình hồi quy có thể giải thích được thông qua biến độc lập (X). Kết luận Lý giải: 81% sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
Câu 10:
Đặc điểm nào sau đây KHÔNG thuộc về phân phối nhị thức (Binomial Distribution)?
💡 Lời giải chi tiết:
Một điều kiện bắt buộc của phân phối nhị thức là xác suất thành công (p) phải không đổi trong suốt tất cả các lần thử. Kết luận Lý giải: Xác suất thành công thay đổi qua mỗi lần thử
Câu 11:
Giá trị p (p-value) trong kiểm định giả thuyết được hiểu là gì?
💡 Lời giải chi tiết:
Giá trị p là xác suất thu được các dữ liệu mẫu hiện tại giả định rằng giả thuyết không (H0) là đúng. Kết luận Lý giải: Xác suất quan sát được kết quả cực đoan như vậy hoặc hơn nếu H0 đúng
Câu 12:
Định lý giới hạn trung tâm (Central Limit Theorem) khẳng định điều gì về phân phối của số trung bình mẫu khi kích thước mẫu n đủ lớn?
💡 Lời giải chi tiết:
Định lý này cho biết với n đủ lớn (thường n >= 30), phân phối của các trung bình mẫu sẽ xấp xỉ phân phối chuẩn bất kể hình dạng phân phối của tổng thể. Kết luận Lý giải: Nó sẽ tiệm cận về phân phối chuẩn
Câu 13:
Số trung vị (Median) là giá trị đo lường xu hướng trung tâm tốt hơn số trung bình (Mean) trong trường hợp nào?
💡 Lời giải chi tiết:
Số trung vị ít bị ảnh hưởng bởi các giá trị cực lớn hoặc cực nhỏ so với số trung bình, giúp phản ánh đúng hơn mức độ phổ biến trong dữ liệu lệch. Kết luận Lý giải: Khi dữ liệu có các giá trị ngoại lệ (outliers) cực đoan
Câu 14:
Trong một biểu đồ hộp (Box plot), khoảng cách từ tứ phân vị thứ nhất (Q1) đến tứ phân vị thứ ba (Q3) được gọi là gì?
💡 Lời giải chi tiết:
IQR là thước đo độ phân tán của 50% dữ liệu nằm ở giữa tập dữ liệu, tính bằng hiệu của Q3 và Q1. Kết luận Lý giải: Khoảng biến thiên tứ phân vị (IQR)
Câu 15:
Biến số 'Số lượng ô tô gia đình sở hữu' thuộc loại biến nào?
💡 Lời giải chi tiết:
Số lượng ô tô là giá trị đếm được và chỉ nhận các giá trị nguyên, do đó nó là biến rời rạc. Kết luận Lý giải: Biến định lượng rời rạc
Câu 16:
Khi so sánh trung bình của 3 nhóm độc lập trở lên, kỹ thuật thống kê nào là phù hợp nhất?
💡 Lời giải chi tiết:
ANOVA (Analysis of Variance) được thiết kế đặc biệt để kiểm tra sự khác biệt về trung bình giữa nhiều nhóm cùng một lúc. Kết luận Lý giải: Phân tích biến số (ANOVA)
Câu 17:
Thang đo nào sau đây có điểm gốc 0 tuyệt đối (nghĩa là giá trị 0 đại diện cho sự vắng mặt của đặc tính)?
💡 Lời giải chi tiết:
Thang đo tỷ lệ có đầy đủ đặc tính của các thang đo khác và thêm điểm 0 tuyệt đối, cho phép thực hiện các phép chia so sánh. Kết luận Lý giải: Thang đo tỷ lệ (Ratio)
Câu 18:
Nếu hệ số tương quan giữa hai biến X và Y là r = -0,95, ta có thể kết luận gì?
💡 Lời giải chi tiết:
Giá trị r gần -1 chỉ ra mối liên hệ tuyến tính nghịch biến (biến này tăng thì biến kia giảm) mức độ rất cao. Kết luận Lý giải: X và Y có mối quan hệ nghịch chiều rất chặt chẽ
Câu 19:
Độ lệch chuẩn là căn bậc hai của chỉ số nào sau đây?
💡 Lời giải chi tiết:
Theo định nghĩa toán học, độ lệch chuẩn được tính bằng cách lấy căn bậc hai của phương sai để đưa đơn vị đo về cùng bậc với dữ liệu gốc. Kết luận Lý giải: Phương sai
Câu 20:
Trong thống kê mô tả, yếu vị (Mode) được xác định là gì?
💡 Lời giải chi tiết:
Yếu vị (Mode) là quan sát hoặc giá trị xảy ra thường xuyên nhất trong một dãy số liệu. Kết luận Lý giải: Giá trị xuất hiện với tần suất nhiều nhất
Câu 21:
Khi tăng độ tin cậy của một khoảng tin cậy (ví dụ từ 95% lên 99%) trong khi giữ nguyên kích thước mẫu, độ rộng của khoảng tin cậy sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Để tăng mức độ chắc chắn rằng tham số tổng thể nằm trong khoảng, chúng ta cần một phạm vi giá trị rộng hơn (biên độ sai số lớn hơn). Kết luận Lý giải: Rộng ra
Câu 22:
Một phân phối bị lệch phải (Skewed to the right) có đặc điểm gì về hình dạng?
💡 Lời giải chi tiết:
Phân phối lệch phải có phần đuôi bên phải dài hơn, nơi chứa các giá trị ngoại lệ lớn kéo số trung bình về phía đó. Kết luận Lý giải: Đuôi dài kéo về phía các giá trị lớn bên phải
Câu 23:
Chỉ số nào trong dãy số thời gian phản ánh sự biến động lặp đi lặp lại trong vòng một năm?
💡 Lời giải chi tiết:
Biến động thời vụ là những thay đổi có tính quy luật lặp lại theo chu kỳ thời gian ngắn (tháng, quý) trong một năm. Kết luận Lý giải: Biến động thời vụ (Seasonality)
Câu 24:
Trong kiểm định t cho một mẫu, bậc tự do (degrees of freedom) được tính như thế nào nếu kích thước mẫu là n?
💡 Lời giải chi tiết:
Đối với kiểm định trung bình của một mẫu, bậc tự do bằng tổng số quan sát trừ đi 1. Kết luận Lý giải: n - 1
Câu 25:
Giá trị Z (Z-score) bằng +2,0 có ý nghĩa gì đối với một quan sát cụ thể?
💡 Lời giải chi tiết:
Z-score cho biết một giá trị cụ thể cách số trung bình bao nhiêu đơn vị độ lệch chuẩn. Kết luận Lý giải: Quan sát đó cao hơn mức trung bình 2 lần độ lệch chuẩn