Câu 1:
Trong bốn loại thang đo đo lường dữ liệu, thang đo nào có đầy đủ đặc tính của các thang đo khác và có điểm gốc '0' tuyệt đối?
💡 Lời giải chi tiết:
Thang đo tỷ lệ là cấp độ đo lường cao nhất trong thống kê, cho phép xác định tỷ lệ giữa các giá trị nhờ sự tồn tại của điểm gốc '0' thực sự. Kết luận Lý giải Thang đo tỷ lệ
Câu 2:
Trong một phân phối dữ liệu bị lệch phải (lệch dương), mối quan hệ phổ biến nhất giữa các tham số đặc trưng là gì?
💡 Lời giải chi tiết:
Trong phân phối lệch phải, các giá trị cực lớn kéo số trung bình về phía đuôi bên phải khiến nó thường lớn hơn số trung vị. Kết luận Lý giải Số trung bình lớn hơn Số trung vị
Câu 3:
Tổng diện tích dưới đường cong của một phân phối chuẩn bất kỳ luôn bằng bao nhiêu?
💡 Lời giải chi tiết:
Theo tính chất của hàm mật độ xác suất, tổng diện tích dưới đường cong phân phối chuẩn đại diện cho tổng xác suất của tất cả các biến cố và luôn bằng 1. Kết luận Lý giải 1.0
Câu 4:
Sai lầm loại I trong kiểm định giả thuyết thống kê xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I, còn gọi là mức ý nghĩa alpha, là lỗi xảy ra khi ta bác bỏ một giả thuyết không (H0) dù thực tế giả thuyết đó là đúng. Kết luận Lý giải Bác bỏ giả thuyết H0 khi nó thực sự đúng
Câu 5:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn có giá trị bằng 0.81 nghĩa là gì?
💡 Lời giải chi tiết:
Hệ số xác định R-squared đo lường tỷ lệ phần trăm sự biến động của biến phụ thuộc được giải thích bởi các biến độc lập có trong mô hình hồi quy. Kết luận Lý giải 81% sự biến động của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình
Câu 6:
Sai số chọn mẫu (Sampling error) được định nghĩa là gì?
💡 Lời giải chi tiết:
Sai số chọn mẫu là sự khác biệt nảy sinh tự nhiên giữa đặc điểm của mẫu được chọn và đặc điểm thực tế của toàn bộ tổng thể. Kết luận Lý giải Sự khác biệt giữa tham số của tổng thể và thống kê của mẫu
Câu 7:
Tham số nào đo lường mức độ phổ biến nhất hoặc giá trị xuất hiện nhiều nhất trong tập dữ liệu?
💡 Lời giải chi tiết:
Yếu vị là giá trị có tần suất xuất hiện cao nhất trong một dãy số liệu hoặc một tập hợp quan sát. Kết luận Lý giải Yếu vị (Mode)
Câu 8:
Để so sánh độ phân tán của hai tập dữ liệu có đơn vị tính khác nhau, ta nên sử dụng chỉ tiêu nào?
💡 Lời giải chi tiết:
Hệ số biến thiên là một chỉ số tương đối giúp so sánh mức độ biến động giữa các tập dữ liệu không cùng đơn vị tính hoặc có quy mô khác nhau. Kết luận Lý giải Hệ số biến thiên (CV)
Câu 9:
Trong phân phối chuẩn hóa (Z-distribution), giá trị trung bình và độ lệch chuẩn lần lượt là bao nhiêu?
💡 Lời giải chi tiết:
Phân phối chuẩn hóa là trường hợp đặc biệt của phân phối chuẩn với kỳ vọng (trung bình) bằng 0 và phương sai (độ lệch chuẩn) bằng 1. Kết luận Lý giải Trung bình bằng 0, Độ lệch chuẩn bằng 1
Câu 10:
Dữ liệu về 'Màu mắt của sinh viên trong một lớp học' thuộc loại biến số nào?
💡 Lời giải chi tiết:
Màu mắt là một đặc tính không thể biểu diễn bằng con số có ý nghĩa toán học mà dùng để phân loại đối tượng nên nó là biến định tính. Kết luận Lý giải Biến định tính (Qualitative)
Câu 11:
Phương pháp chọn mẫu nào thực hiện việc chia tổng thể thành các nhóm đồng nhất rồi chọn ngẫu nhiên các đơn vị từ mỗi nhóm?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng đảm bảo mọi nhóm nhỏ quan trọng trong tổng thể đều được đại diện bằng cách chia nhóm theo đặc điểm rồi lấy mẫu ngẫu nhiên từ đó. Kết luận Lý giải Chọn mẫu phân tầng (Stratified sampling)
Câu 12:
Quy tắc quyết định phổ biến nhất để bác bỏ giả thuyết không (H0) dựa trên giá trị p (p-value) là gì?
💡 Lời giải chi tiết:
Nếu giá trị p nhỏ hơn mức ý nghĩa đã chọn (thường là 0.05), ta có đủ bằng chứng thống kê để bác bỏ giả thuyết H0. Kết luận Lý giải p-value nhỏ hơn mức ý nghĩa alpha
Câu 13:
Hệ số tương quan tuyến tính Pearson (r) nhận giá trị trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan Pearson đo lường mức độ và chiều hướng của mối quan hệ tuyến tính giữa hai biến, luôn nằm trong đoạn từ -1 đến 1. Kết luận Lý giải Từ -1 đến 1
Câu 14:
Cho dãy số liệu: 2, 4, 6, 8, 10. Giá trị trung vị của dãy số này là bao nhiêu?
💡 Lời giải chi tiết:
Trung vị là giá trị nằm ở vị trí chính giữa của dãy số đã được sắp xếp thứ tự, trong dãy 2, 4, 6, 8, 10 thì số 6 ở giữa. Kết luận Lý giải 6
Câu 15:
So với phân phối chuẩn Z, phân phối t-Student có đặc điểm hình dáng như thế nào khi kích thước mẫu nhỏ?
💡 Lời giải chi tiết:
Phân phối t-Student có độ phân tán lớn hơn phân phối chuẩn Z khi cỡ mẫu nhỏ, dẫn đến hình dáng thấp hơn ở trung tâm và bè ra ở hai đuôi. Kết luận Lý giải Thấp hơn ở đỉnh và đuôi dày hơn
Câu 16:
Hai biến cố A và B được gọi là độc lập nếu điều kiện nào sau đây thỏa mãn?
💡 Lời giải chi tiết:
Theo định nghĩa về xác suất có điều kiện, hai biến cố độc lập khi việc biến cố này xảy ra không làm ảnh hưởng đến xác suất xảy ra của biến cố kia. Kết luận Lý giải Xác suất của A không thay đổi khi biết B đã xảy ra
Câu 17:
Trong phân tích hồi quy, 'Phần dư' (Residual) được tính bằng cách nào?
💡 Lời giải chi tiết:
Phần dư là khoảng chênh lệch giữa giá trị thực tế thu thập được và giá trị mà mô hình hồi quy ước tính tại điểm đó. Kết luận Lý giải Giá trị quan sát trừ đi giá trị dự báo
Câu 18:
Bậc tự do (Degrees of Freedom) khi tính phương sai mẫu của một tập dữ liệu gồm n quan sát là bao nhiêu?
💡 Lời giải chi tiết:
Khi tính phương sai mẫu, ta mất một bậc tự do do phải sử dụng số trung bình mẫu để ước lượng, vì vậy bậc tự do còn lại là n - 1. Kết luận Lý giải n - 1
Câu 19:
Luật số lớn (Law of Large Numbers) trong thống kê khẳng định điều gì?
💡 Lời giải chi tiết:
Luật số lớn mô tả kết quả của việc lặp lại cùng một thí nghiệm nhiều lần, chỉ ra rằng trung bình của các kết quả sẽ hội tụ về kỳ vọng thực sự. Kết luận Lý giải Số trung bình mẫu sẽ tiến gần đến số trung bình tổng thể khi kích thước mẫu tăng lên
Câu 20:
Ví dụ nào sau đây đại diện cho dữ liệu ở thang đo định danh (Nominal scale)?
💡 Lời giải chi tiết:
Mã bưu điện chỉ đóng vai trò là nhãn dán để phân loại các vùng địa lý, không có ý nghĩa về thứ tự hay tính toán định lượng. Kết luận Lý giải Mã bưu điện của các thành phố
Câu 21:
Các giá trị tứ phân vị (Quartiles) chia tập dữ liệu đã sắp xếp thành bao nhiêu phần có số lượng quan sát bằng nhau?
💡 Lời giải chi tiết:
Tứ phân vị bao gồm ba giá trị Q1, Q2, Q3 chia tập dữ liệu thành bốn phần bằng nhau, mỗi phần chứa 25% số lượng quan sát. Kết luận Lý giải 4 phần
Câu 22:
Sai số chuẩn (Standard Error) của số trung bình mẫu cho biết điều gì?
💡 Lời giải chi tiết:
Sai số chuẩn đo lường mức độ dao động kỳ vọng của các số trung bình mẫu khác nhau quanh số trung bình thực của tổng thể. Kết luận Lý giải Độ chính xác của số trung bình mẫu trong việc ước lượng số trung bình tổng thể
Câu 23:
Hiện tượng 'Chệch' (Bias) trong thống kê thường dùng để chỉ điều gì?
💡 Lời giải chi tiết:
Chệch là loại sai số xảy ra khi phương pháp lấy mẫu hoặc đo lường dẫn đến kết quả luôn nghiêng về một hướng nhất định so với giá trị thực tế. Kết luận Lý giải Sai số hệ thống làm cho kết quả ước lượng lệch khỏi giá trị thực
Câu 24:
Nếu hai biến cố A và B là xung khắc (mutually exclusive) thì xác suất để cả hai cùng xảy ra P(A và B) là bao nhiêu?
💡 Lời giải chi tiết:
Biến cố xung khắc là những biến cố không thể xảy ra đồng thời trong cùng một phép thử, do đó xác suất giao của chúng bằng 0. Kết luận Lý giải 0
Câu 25:
Độ lệch (Skewness) của một phân phối cho biết thông tin về đặc điểm nào của dữ liệu?
💡 Lời giải chi tiết:
Hệ số độ lệch đo lường mức độ và hướng mà một phân phối xác suất lệch khỏi hình dáng đối xứng của phân phối chuẩn. Kết luận Lý giải Tính không đối xứng của phân phối quanh giá trị trung tâm