Câu 1:
Trong thống kê, thang đo nào được sử dụng cho các biến phân loại mà giữa các biểu hiện của tiêu thức có sự hơn kém, trật tự?
💡 Lời giải chi tiết:
Thang đo thứ bậc được dùng để sắp xếp các đối tượng theo một trật tự nhất định nhưng không xác định được khoảng cách chính xác giữa các bậc đó. Kết luận Lý giải Thang đo thứ bậc (Ordinal scale)
Câu 2:
Chỉ số đo lường độ tập trung nào sau đây nhạy cảm nhất với các giá trị ngoại lai (outliers) trong tập dữ liệu?
💡 Lời giải chi tiết:
Do số trung bình cộng được tính toán dựa trên tổng giá trị của tất cả các quan sát nên nó dễ dàng bị kéo lệch bởi các giá trị cực lớn hoặc cực nhỏ. Kết luận Lý giải Số trung bình cộng (Mean)
Câu 3:
Độ lệch chuẩn (Standard Deviation) đo lường đặc tính nào của một tập dữ liệu?
💡 Lời giải chi tiết:
Độ lệch chuẩn phản ánh mức độ phân tán của các đơn vị quan sát xung quanh trị số trung bình cộng của tổng thể hoặc mẫu. Kết luận Lý giải Mức độ biến thiên hay sự phân tán của dữ liệu so với số trung bình
Câu 4:
Theo quy tắc thực nghiệm trong phân phối chuẩn, khoảng (mu +/- 2 sigma) sẽ chứa bao nhiêu phần trăm số quan sát?
💡 Lời giải chi tiết:
Theo tính chất của phân phối chuẩn, diện tích dưới đường cong trong khoảng hai lần độ lệch chuẩn quanh số trung bình chiếm xấp xỉ 95.45%. Kết luận Lý giải Khoảng 95.45%
Câu 5:
Sai số do chọn mẫu (Sampling Error) phát sinh chủ yếu từ nguyên nhân nào sau đây?
💡 Lời giải chi tiết:
Sai số chọn mẫu là sai số không thể tránh khỏi khi dùng các đặc trưng của mẫu để suy rộng cho tổng thể do sự biến động ngẫu nhiên của các đơn vị mẫu. Kết luận Lý giải Do tính chất ngẫu nhiên khi chọn một phần của tổng thể làm mẫu đại diện
Câu 6:
Trong kiểm định giả thuyết thống kê, nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), ta đưa ra quyết định gì?
💡 Lời giải chi tiết:
Khi p-value nhỏ hơn alpha, kết quả quan sát được coi là có ý nghĩa thống kê, dẫn đến việc bác bỏ giả thuyết không để ủng hộ giả thuyết đối. Kết luận Lý giải Bác bỏ giả thuyết không (H0)
Câu 7:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết được định nghĩa là gì?
💡 Lời giải chi tiết:
Sai lầm loại I xảy ra khi chúng ta bác bỏ giả thuyết không (thường là giả thuyết về sự bình thường) trong khi giả thuyết đó thực sự đúng. Kết luận Lý giải Bác bỏ giả thuyết không (H0) khi thực tế nó là đúng
Câu 8:
Hệ số tương quan Pearson (r) nhận giá trị bằng -1 cho biết điều gì về mối quan hệ giữa hai biến?
💡 Lời giải chi tiết:
Giá trị r bằng -1 thể hiện mối quan hệ tuyến tính chặt chẽ nhất theo hướng ngược chiều, nghĩa là khi biến này tăng thì biến kia giảm theo tỷ lệ cố định. Kết luận Lý giải Hai biến có mối quan hệ tuyến tính nghịch biến hoàn hảo
Câu 9:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn có ý nghĩa gì?
💡 Lời giải chi tiết:
R bình phương đo lường tỷ lệ phần trăm sự biến thiên của biến Y được giải thích bởi sự biến thiên của biến X trong mô hình hồi quy. Kết luận Lý giải Tỷ lệ biến động của biến phụ thuộc được giải thích bởi biến độc lập
Câu 10:
Khi quy mô mẫu (sample size) tăng lên trong khi các yếu tố khác không đổi, độ rộng của khoảng tin cậy sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Quy mô mẫu nằm ở mẫu số của công thức tính sai số chuẩn, nên khi mẫu tăng thì sai số giảm, dẫn đến khoảng tin cậy hẹp lại và ước lượng chính xác hơn. Kết luận Lý giải Khoảng tin cậy thu hẹp lại
Câu 11:
Trong một phân phối có độ lệch tích cực (lệch phải - skewed to the right), thứ tự sắp xếp các giá trị thường là gì?
💡 Lời giải chi tiết:
Trong phân phối lệch phải, đuôi dài về bên phải kéo số trung bình (Mean) lên cao nhất, trong khi yếu vị (Mode) nằm ở đỉnh phân phối bên trái. Kết luận Lý giải Mean > Median > Mode
Câu 12:
Kiểm định Chi bình phương (Chi-square test) về tính độc lập được sử dụng để làm gì?
💡 Lời giải chi tiết:
Kiểm định Chi bình phương về tính độc lập dùng để xác định xem hai tiêu thức phân loại có liên quan đến nhau hay hoàn toàn độc lập với nhau. Kết luận Lý giải Kiểm tra mối liên hệ giữa hai biến định tính (phân loại)
Câu 13:
Thành phần nào trong dãy số thời gian phản ánh những biến động có tính chất lặp lại trong chu kỳ ngắn (thường là dưới 1 năm)?
💡 Lời giải chi tiết:
Biến động thời vụ là những thay đổi lặp đi lặp lại theo quy luật thời gian trong vòng một năm do tác động của thiên nhiên hoặc tập quán xã hội. Kết luận Lý giải Biến động thời vụ (Seasonal variation)
Câu 14:
Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng khi quy mô mẫu đủ lớn, phân phối của số trung bình mẫu sẽ:
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm khẳng định rằng với mẫu đủ lớn, phân phối chọn mẫu của trung bình mẫu sẽ tiến về phân phối chuẩn bất kể phân phối gốc của tổng thể. Kết luận Lý giải Xấp xỉ phân phối chuẩn
Câu 15:
Chỉ số giá Laspeyres sử dụng quyền số là lượng hàng hóa của thời kỳ nào?
💡 Lời giải chi tiết:
Chỉ số giá Laspeyres cố định quyền số là lượng hàng hóa ở thời kỳ gốc để so sánh sự thay đổi về giá thuần túy qua các thời kỳ. Kết luận Lý giải Thời kỳ gốc (Base period)
Câu 16:
Dãy số nào sau đây được coi là biến số rời rạc (discrete variable)?
💡 Lời giải chi tiết:
Biến số rời rạc là biến số mà tập hợp các giá trị của nó có thể đếm được, thường biểu hiện qua các số nguyên. Kết luận Lý giải Số lượng lỗi sản phẩm trong một lô hàng
Câu 17:
Phân tích biến lượng (ANOVA) một nhân tố được sử dụng để kiểm định giả thuyết nào?
💡 Lời giải chi tiết:
ANOVA cho phép kiểm tra xem sự khác biệt giữa các giá trị trung bình của nhiều nhóm có ý nghĩa thống kê hay không thông qua việc phân tích các thành phần biến thiên. Kết luận Lý giải Sự bằng nhau của các giá trị trung bình giữa ba hoặc nhiều nhóm
Câu 18:
Sai số chuẩn của số trung bình (Standard Error of the Mean) là gì?
💡 Lời giải chi tiết:
Sai số chuẩn đo lường mức độ biến động của các số trung bình mẫu khác nhau được rút ra từ cùng một tổng thể. Kết luận Lý giải Độ lệch chuẩn của phân phối chọn mẫu của số trung bình
Câu 19:
Trong một tập dữ liệu, yếu vị (Mode) được xác định là:
💡 Lời giải chi tiết:
Yếu vị là trị số có mật độ tập trung lớn nhất trong dãy số lượng biến, tương ứng với giá trị có tần số lớn nhất. Kết luận Lý giải Giá trị xuất hiện với tần suất cao nhất
Câu 20:
Trong phương trình hồi quy Y = a + bX, hệ số b (hệ số góc) có ý nghĩa như thế nào?
💡 Lời giải chi tiết:
Hệ số góc b phản ánh tác động biên, cho biết khi biến độc lập thay đổi một đơn vị thì biến phụ thuộc thay đổi trung bình bao nhiêu đơn vị. Kết luận Lý giải Mức thay đổi trung bình của Y khi X tăng thêm 1 đơn vị
Câu 21:
Loại dữ liệu nào ghi chép về 'Tình trạng hôn nhân' (Độc thân, Kết hôn, Ly hôn) của các đối tượng điều tra?
💡 Lời giải chi tiết:
Tình trạng hôn nhân là một thuộc tính dùng để phân loại đối tượng thành các nhóm riêng biệt không mang bản chất số lượng. Kết luận Lý giải Dữ liệu định tính (Qualitative data)
Câu 22:
Phân phối Poisson thường được áp dụng tốt nhất để mô tả hiện tượng nào sau đây?
💡 Lời giải chi tiết:
Phân phối Poisson dùng để tính xác suất cho số lần xảy ra của một sự kiện trong một đơn vị thời gian hoặc không gian xác định. Kết luận Lý giải Số vụ tai nạn giao thông xảy ra tại một ngã tư trong một tháng
Câu 23:
Giá trị Z (Z-score) bằng 1.5 trong phân phối chuẩn hóa có ý nghĩa là gì?
💡 Lời giải chi tiết:
Z-score cho biết khoảng cách từ một giá trị quan sát đến số trung bình được đo lường bằng đơn vị độ lệch chuẩn. Kết luận Lý giải Giá trị đó lớn hơn số trung bình 1.5 lần độ lệch chuẩn
Câu 24:
Nếu phương sai (Variance) của một tập dữ liệu bằng 0, điều đó khẳng định điều gì về các quan sát?
💡 Lời giải chi tiết:
Phương sai bằng 0 khi không có sự biến thiên giữa các giá trị, nghĩa là mọi quan sát đều trùng khớp với trị số trung bình. Kết luận Lý giải Tất cả các giá trị trong tập dữ liệu đều bằng nhau
Câu 25:
Phương pháp chọn mẫu phân tầng (Stratified Sampling) được thực hiện dựa trên nguyên tắc nào?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng giúp đảm bảo các nhóm đặc thù trong tổng thể đều được đại diện trong mẫu bằng cách lấy mẫu ngẫu nhiên từ từng nhóm đồng nhất. Kết luận Lý giải Chia tổng thể thành các tầng đồng nhất rồi chọn ngẫu nhiên từ mỗi tầng