Thống kê mô tả tập trung vào việc tóm tắt và trình bày dữ liệu thông qua các bảng, đồ thị và các chỉ số đặc trưng để mô tả tập dữ liệu hiện có. Kết luận Lý giải Tập hợp các phương pháp tóm tắt và mô tả các đặc điểm của một bộ dữ liệu.
Câu 2:
Thang đo nào sau đây chỉ dùng để phân loại các đối tượng mà không có sự so sánh hơn kém?
💡 Lời giải chi tiết:
Thang đo định danh là mức độ đo lường thấp nhất, dùng để đặt tên hoặc phân loại các đối tượng vào các nhóm riêng biệt không có thứ tự. Kết luận Lý giải Thang đo định danh.
Câu 3:
Điểm khác biệt cơ bản nhất của thang đo tỷ lệ so với thang đo khoảng là gì?
💡 Lời giải chi tiết:
Thang đo tỷ lệ sở hữu tất cả đặc điểm của thang đo khoảng nhưng có thêm điểm gốc không tuyệt đối, cho phép so sánh về mặt tỷ lệ. Kết luận Lý giải Có điểm 0 tuyệt đối thực sự.
Câu 4:
Dữ liệu thứ cấp là loại dữ liệu nào?
💡 Lời giải chi tiết:
Dữ liệu thứ cấp là những thông tin đã được thu thập và công bố bởi người khác hoặc cho các mục đích khác trước đó. Kết luận Lý giải Dữ liệu đã được thu thập và công bố từ trước.
Câu 5:
Phương pháp chọn mẫu ngẫu nhiên đơn giản đảm bảo điều gì?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là quy trình mà mỗi đơn vị trong danh sách tổng thể đều có xác suất được chọn vào mẫu là như nhau. Kết luận Lý giải Mọi đơn vị trong tổng thể đều có cơ hội được chọn ngang nhau.
Câu 6:
Khi nào thì phương pháp chọn mẫu phân tầng thường được ưu tiên sử dụng?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng giúp tăng tính đại diện bằng cách chia tổng thể thành các tầng đồng nhất và chọn ngẫu nhiên từ mỗi tầng đó. Kết luận Lý giải Khi tổng thể bao gồm các nhóm có đặc điểm khác biệt rõ rệt.
Câu 7:
Chỉ số nào sau đây bị ảnh hưởng mạnh nhất bởi các giá trị ngoại lệ (outliers)?
💡 Lời giải chi tiết:
Số trung bình cộng được tính toán dựa trên tất cả các giá trị nên nó rất nhạy cảm với những giá trị cực đại hoặc cực tiểu trong tập dữ liệu. Kết luận Lý giải Số trung bình cộng.
Câu 8:
Trong một tập dữ liệu có độ lệch lớn, chỉ số nào phản ánh trung tâm dữ liệu tốt hơn?
💡 Lời giải chi tiết:
Số trung vị không bị ảnh hưởng bởi các giá trị cực biên nên nó đại diện tốt hơn cho xu hướng tập trung của các phân phối lệch. Kết luận Lý giải Số trung vị.
Câu 9:
Độ lệch chuẩn là chỉ tiêu dùng để đo lường điều gì?
💡 Lời giải chi tiết:
Độ lệch chuẩn là căn bậc hai của phương sai, phản ánh sự biến động hoặc độ phân tán trung bình của các quan sát so với giá trị trung bình cộng. Kết luận Lý giải Mức độ phân tán của các giá trị xung quanh số trung bình.
Câu 10:
Để so sánh mức độ biến thiên của hai tập dữ liệu có đơn vị tính khác nhau, ta nên dùng chỉ tiêu nào?
💡 Lời giải chi tiết:
Hệ số biến thiên là một chỉ số tương đối giúp so sánh độ phân tán giữa các bộ dữ liệu có quy mô hoặc đơn vị đo lường khác biệt. Kết luận Lý giải Hệ số biến thiên (CV).
Câu 11:
Theo quy tắc kinh nghiệm, trong phân phối chuẩn, có bao nhiêu phần trăm dữ liệu nằm trong khoảng cộng trừ 2 lần độ lệch chuẩn so với trung bình?
💡 Lời giải chi tiết:
Quy tắc 68-95-99.7 trong thống kê xác định rằng có khoảng 95% quan sát của phân phối chuẩn rơi vào phạm vi 2 độ lệch chuẩn quanh giá trị trung bình. Kết luận Lý giải Khoảng 95%.
Câu 12:
Giá trị Z (Z-score) bằng 0 cho biết điều gì về quan sát đó?
💡 Lời giải chi tiết:
Z-score đo lường số lượng độ lệch chuẩn mà một quan sát nằm cách xa trung bình, do đó Z bằng 0 nghĩa là quan sát trùng với trung bình. Kết luận Lý giải Quan sát đó bằng đúng giá trị trung bình của tập dữ liệu.
Câu 13:
Sai lầm loại I trong kiểm định giả thuyết xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I (mức ý nghĩa alpha) là xác suất bác bỏ giả thuyết không (H0) mặc dù thực tế H0 là đúng. Kết luận Lý giải Bác bỏ giả thuyết không khi nó đúng.
Câu 14:
Sai lầm loại II trong kiểm định giả thuyết được định nghĩa là gì?
💡 Lời giải chi tiết:
Sai lầm loại II xảy ra khi kết quả kiểm định không đủ bằng chứng để bác bỏ giả thuyết không mặc dù giả thuyết đó không chính xác. Kết luận Lý giải Chấp nhận giả thuyết không khi nó sai.
Câu 15:
Trong kiểm định giả thuyết, nếu p-value nhỏ hơn mức ý nghĩa alpha đã chọn, ta sẽ làm gì?
💡 Lời giải chi tiết:
P-value thấp hơn mức alpha cho thấy bằng chứng thực nghiệm đủ mạnh để bác bỏ giả thuyết không và chấp nhận giả thuyết đối. Kết luận Lý giải Bác bỏ giả thuyết không.
Câu 16:
Khi độ tin cậy của khoảng ước lượng tăng lên (ví dụ từ 95% lên 99%) thì độ rộng của khoảng sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Để có độ tin cậy cao hơn trong việc bao phủ giá trị thực của tham số, chúng ta cần một phạm vi ước lượng rộng hơn. Kết luận Lý giải Khoảng ước lượng sẽ rộng ra.
Câu 17:
Hệ số tương quan Pearson (r) có giá trị nằm trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan Pearson là một chỉ số chuẩn hóa đo lường mối quan hệ tuyến tính, luôn nằm trong đoạn từ âm 1 đến dương 1. Kết luận Lý giải Từ -1 đến 1.
Câu 18:
Hệ số xác định (R-squared) trong hồi quy tuyến tính cho biết điều gì?
💡 Lời giải chi tiết:
R-squared phản ánh tỷ lệ phần trăm sự biến động của biến y được giải thích bởi các biến độc lập x có trong mô hình hồi quy. Kết luận Lý giải Sự phù hợp của mô hình thông qua tỷ lệ biến thiên của biến phụ thuộc được giải thích.
Câu 19:
Trong phương trình hồi quy y = a + bx, hệ số b (hệ số góc) biểu thị điều gì?
💡 Lời giải chi tiết:
Hệ số hồi quy b đo lường mức độ tác động biên của biến độc lập lên biến phụ thuộc trong mô hình tuyến tính. Kết luận Lý giải Mức thay đổi trung bình của y khi x tăng thêm một đơn vị.
Câu 20:
Để đưa một biến định tính có 4 biểu hiện (ví dụ: Xuân, Hạ, Thu, Đông) vào mô hình hồi quy, cần sử dụng bao nhiêu biến giả?
💡 Lời giải chi tiết:
Để tránh hiện tượng đa cộng tuyến hoàn hảo (bẫy biến giả), số lượng biến giả luôn bằng số nhóm trừ đi một. Kết luận Lý giải 3 biến giả.
Câu 21:
Thành phần 'Xu thế' (Trend) trong dãy số thời gian thể hiện điều gì?
💡 Lời giải chi tiết:
Xu thế là thành phần phản ánh xu hướng phát triển hoặc suy giảm cơ bản của hiện tượng trong một thời gian dài. Kết luận Lý giải Sự thay đổi dài hạn, có tính hướng dòng của hiện tượng.
Câu 22:
Biến động thời vụ là những biến động có đặc điểm gì?
💡 Lời giải chi tiết:
Biến động thời vụ phản ánh các quy luật thay đổi theo mùa, tháng hoặc quý lặp lại định kỳ trong một chu kỳ năm. Kết luận Lý giải Lặp lại theo chu kỳ đều đặn trong vòng một năm.
Câu 23:
Chỉ số giá Laspeyres sử dụng quyền số là lượng hàng hóa ở thời kỳ nào?
💡 Lời giải chi tiết:
Công thức Laspeyres tính toán sự thay đổi giá cả bằng cách cố định giỏ hàng hóa (quyền số) ở thời kỳ gốc. Kết luận Lý giải Thời kỳ gốc.
Câu 24:
Điểm khác biệt của chỉ số Paasche so với chỉ số Laspeyres là gì?
💡 Lời giải chi tiết:
Chỉ số Paasche cập nhật quyền số theo lượng tiêu dùng thực tế ở thời kỳ báo cáo thay vì giữ nguyên như kỳ gốc. Kết luận Lý giải Sử dụng lượng hàng hóa của thời kỳ báo cáo làm quyền số.
Câu 25:
Định lý giới hạn trung tâm có ý nghĩa quan trọng nhất trong việc gì?
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm khẳng định rằng trung bình mẫu sẽ có phân phối xấp xỉ chuẩn khi kích thước mẫu tăng lên, bất kể phân phối gốc. Kết luận Lý giải Cho phép sử dụng phân phối chuẩn để ước lượng khi mẫu đủ lớn.