Bộ 11 - Trắc nghiệm Thống kê ứng dụng online có đáp án
Thời gian còn lại: --:--
Kết quả của bạn:
Bạn đã đúng:
Bạn đã sai:
Tổng số câu:
Câu 1:
Trong thống kê ứng dụng, biến định tính (qualitative variable) được định nghĩa là loại biến mà các giá trị của nó dùng để?
💡 Lời giải chi tiết:
Theo lý thuyết thống kê cơ bản, biến định tính được sử dụng để mô tả các đặc điểm, tính chất của đối tượng nghiên cứu thay vì giá trị số học cụ thể. Kết luận Lý giải Phân loại các đối tượng vào các nhóm dựa trên đặc tính hoặc thuộc tính không mang tính số lượng.
Câu 2:
Tham số nào sau đây trong các số đặc trưng đo lường xu hướng trung tâm nhạy cảm nhất với các giá trị ngoại lai (outliers)?
💡 Lời giải chi tiết:
Theo tính chất toán học, giá trị trung bình được tính bằng tổng tất cả các quan sát chia cho số lượng, nên chỉ cần một giá trị cực đoan cũng có thể làm thay đổi đáng kể kết quả. Kết luận Lý giải Trung bình cộng (Mean).
Câu 3:
Trong phân phối chuẩn (Normal Distribution), khoảng bao nhiêu phần trăm dữ liệu sẽ nằm trong khoảng cộng trừ 1 độ lệch chuẩn xung quanh giá trị trung bình?
💡 Lời giải chi tiết:
Theo quy tắc thực nghiệm 68-95-99.7 trong thống kê, diện tích dưới đường cong phân phối chuẩn trong phạm vi 1 độ lệch chuẩn chiếm khoảng 68% tổng thể. Kết luận Lý giải Khoảng 68%.
Câu 4:
Sai lầm loại I (Type I Error) trong kiểm định giả thuyết thống kê được xác định khi người nghiên cứu thực hiện hành động nào?
💡 Lời giải chi tiết:
Theo định nghĩa về xác suất kiểm định, sai lầm loại I xảy ra khi ta đưa ra kết luận bác bỏ một giả thuyết không (H0) đang đúng trong thực tế. Kết luận Lý giải Bác bỏ giả thuyết H0 khi giả thuyết H0 thực sự đúng.
Câu 5:
Nếu hệ số tương quan Pearson (r) giữa hai biến X và Y có giá trị bằng -0.85, kết luận nào sau đây là chính xác nhất?
💡 Lời giải chi tiết:
Giá trị r âm cho thấy mối quan hệ nghịch biến và trị tuyệt đối gần 1 cho thấy mức độ liên kết tuyến tính chặt chẽ giữa hai biến. Kết luận Lý giải X và Y có mối quan hệ tuyến tính nghịch biến mạnh.
Câu 6:
Định lý giới hạn trung tâm (Central Limit Theorem) đóng vai trò quan trọng trong thống kê vì nó khẳng định rằng?
💡 Lời giải chi tiết:
Theo nguyên lý thống kê suy diễn, định lý này cho phép sử dụng các kiểm định tham số dựa trên phân phối chuẩn cho các mẫu lớn ngay cả khi dữ liệu gốc không chuẩn. Kết luận Lý giải Phân phối của trung bình mẫu sẽ tiến tới phân phối chuẩn khi kích thước mẫu n đủ lớn, bất kể hình dạng phân phối của tổng thể.
Câu 7:
Trong kiểm định giả thuyết, giá trị P (p-value) được hiểu theo cách phổ biến nhất là?
💡 Lời giải chi tiết:
P-value đo lường mức độ tương thích giữa dữ liệu mẫu quan sát được và giả thuyết không, giúp đưa ra quyết định bác bỏ hay chưa bác bỏ H0. Kết luận Lý giải Xác suất quan sát được kết quả mẫu như hiện tại hoặc cực đoan hơn nếu giả thuyết không (H0) là đúng.
Câu 8:
Khi muốn so sánh giá trị trung bình của ba nhóm độc lập trở lên để xem có sự khác biệt có ý nghĩa thống kê hay không, phương pháp nào thường được sử dụng?
💡 Lời giải chi tiết:
Phân tích phương sai (ANOVA) là kỹ thuật được thiết kế để kiểm tra sự bằng nhau của các trung bình giữa nhiều nhóm cùng một lúc thay vì thực hiện nhiều kiểm định t lẻ tẻ. Kết luận Lý giải Phân tích biến số một chiều (One-way ANOVA).
Câu 9:
Hệ số xác định R bình phương (R-squared) trong mô hình hồi quy tuyến tính đơn có ý nghĩa gì?
💡 Lời giải chi tiết:
R-squared là một chỉ số đo lường mức độ phù hợp của mô hình, phản ánh phần trăm sự thay đổi của biến Y được giải thích bởi sự thay đổi của biến X. Kết luận Lý giải Cho biết tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình.
Câu 10:
Trong kiểm định Chi-bình phương về tính độc lập giữa hai biến định tính, giả thuyết không (H0) được phát biểu là?
💡 Lời giải chi tiết:
Kiểm định tính độc lập sử dụng giả thuyết mặc định rằng không có sự phụ thuộc giữa các tiêu thức phân loại của hai biến nghiên cứu. Kết luận Lý giải Hai biến định tính độc lập với nhau trong tổng thể.
Câu 11:
Độ lệch chuẩn (Standard Deviation) là một tham số đo lường?
💡 Lời giải chi tiết:
Độ lệch chuẩn phản ánh mức độ biến động hoặc sự không đồng nhất của dữ liệu so với giá trị đại diện là trung bình. Kết luận Lý giải Mức độ phân tán của các giá trị dữ liệu xung quanh giá trị trung bình cộng.
Câu 12:
Điều gì xảy ra với sai số chuẩn của trung bình (Standard Error of the Mean) khi kích thước mẫu (n) tăng lên?
💡 Lời giải chi tiết:
Công thức tính sai số chuẩn bằng độ lệch chuẩn chia cho căn bậc hai của n, do đó khi n tăng thì mẫu số tăng dẫn đến giá trị sai số chuẩn giảm. Kết luận Lý giải Sai số chuẩn sẽ giảm dần.
Câu 13:
Việc thiết lập khoảng tin cậy 95% cho trung bình tổng thể có ý nghĩa thực tế là?
💡 Lời giải chi tiết:
Độ tin cậy 95% đề cập đến độ tin cậy của phương pháp ước lượng qua nhiều lần lặp lại chứ không phải xác suất cho một khoảng cụ thể đơn lẻ. Kết luận Lý giải Trong 100 lần lấy mẫu và lập khoảng tin cậy tương tự, trung bình sẽ có khoảng 95 khoảng chứa giá trị trung bình thực của tổng thể.
Câu 14:
Biểu đồ hộp (Box plot) hiển thị 5 chỉ số thống kê quan trọng (5-number summary) bao gồm?
💡 Lời giải chi tiết:
Biểu đồ hộp là công cụ trực quan hóa sự phân bố dữ liệu dựa trên các mốc phân vị quan trọng của tập dữ liệu. Kết luận Lý giải Min, Tứ phân vị thứ nhất (Q1), Trung vị (Q2), Tứ phân vị thứ ba (Q3), Max.
Câu 15:
Trong một phân phối có hình dáng lệch phải (positive skewness), thứ tự về giá trị của các tham số thường là?
💡 Lời giải chi tiết:
Khi dữ liệu lệch phải, các giá trị cực lớn kéo giá trị trung bình về phía bên phải nhiều hơn so với trung vị và yếu vị. Kết luận Lý giải Trung bình lớn hơn Trung vị lớn hơn Yếu vị.
Câu 16:
Đặc điểm cơ bản của phương pháp chọn mẫu hệ thống (systematic sampling) là gì?
💡 Lời giải chi tiết:
Chọn mẫu hệ thống là phương pháp chọn mẫu xác suất dựa trên việc áp dụng một quy luật khoảng cách đều đặn trên danh sách đơn vị tổng thể. Kết luận Lý giải Chọn một điểm khởi đầu ngẫu nhiên, sau đó chọn các phần tử tiếp theo theo một bước nhảy k cố định.
Câu 17:
Giả định quan trọng nhất về phần dư (residuals) trong mô hình hồi quy tuyến tính để đảm bảo các ước lượng là tin cậy là?
💡 Lời giải chi tiết:
Để các kiểm định thống kê trong hồi quy có giá trị, phần dư cần thỏa mãn các tính chất về phân phối chuẩn, tính độc lập và phương sai đồng nhất. Kết luận Lý giải Phần dư phải tuân theo phân phối chuẩn với trung bình bằng 0 và phương sai không đổi (homoscedasticity).
Câu 18:
Độ mạnh của kiểm định (Power of a test) được định nghĩa là xác suất để?
💡 Lời giải chi tiết:
Độ mạnh của kiểm định (1 trừ beta) thể hiện khả năng phát hiện ra sự khác biệt hoặc hiệu ứng khi chúng thực sự tồn tại. Kết luận Lý giải Bác bỏ đúng giả thuyết không (H0) khi giả thuyết đó thực sự sai.
Câu 19:
Phân phối Poisson thường được ứng dụng phù hợp nhất để mô tả đại lượng nào sau đây?
💡 Lời giải chi tiết:
Phân phối Poisson được dùng cho các biến ngẫu nhiên rời rạc biểu thị số lần xảy ra của một sự kiện trong một đơn vị thời gian hoặc không gian nhất định. Kết luận Lý giải Số lượng khách hàng đến một cửa hàng tiện lợi trong một giờ nhất định.
Câu 20:
Điểm Z (Z-score) bằng +2.0 có ý nghĩa cụ thể là gì đối với một giá trị quan sát?
💡 Lời giải chi tiết:
Điểm Z chuẩn hóa dữ liệu bằng cách đo lường khoảng cách từ một điểm dữ liệu đến trung bình theo đơn vị độ lệch chuẩn. Kết luận Lý giải Giá trị đó cao hơn giá trị trung bình một khoảng bằng 2 lần độ lệch chuẩn.
Câu 21:
Sự khác biệt cốt lõi giữa kiểm định T-test mẫu độc lập và T-test mẫu cặp (paired samples) là?
💡 Lời giải chi tiết:
Kiểm định mẫu cặp xử lý sự phụ thuộc giữa các quan sát (như đo trước và sau tác động trên cùng một người), giúp loại bỏ biến động giữa các cá thể. Kết luận Lý giải T-test mẫu độc lập so sánh hai nhóm không có liên hệ, còn mẫu cặp so sánh hai quan sát trên cùng một đối tượng (hoặc cặp tương ứng).
Câu 22:
Tại sao trong thực tế, trung vị (median) thường được dùng để báo cáo thu nhập bình quân thay vì trung bình cộng (mean)?
💡 Lời giải chi tiết:
Dữ liệu thu nhập thường bị lệch phải mạnh do các tỷ phú, nên trung vị là thước đo xu hướng trung tâm ổn định và đại diện tốt hơn cho người dân bình thường. Kết luận Lý giải Vì trung vị không bị ảnh hưởng bởi một số ít người có thu nhập cực cao, phản ánh chính xác hơn mức thu nhập của đa số.
Câu 23:
Trong kiểm định giả thuyết hai phía (two-tailed test) về trung bình tổng thể, giả thuyết đối (H1) được phát biểu dưới dạng?
💡 Lời giải chi tiết:
Kiểm định hai phía quan tâm đến bất kỳ sự sai khác nào so với giả thuyết không, dù là lớn hơn hay nhỏ hơn giá trị giả định. Kết luận Lý giải Trung bình tổng thể khác với giá trị mốc cho trước.
Câu 24:
Hiện tượng đa cộng tuyến (multicollinearity) trong hồi quy bội gây ra vấn đề gì sau đây?
💡 Lời giải chi tiết:
Đa cộng tuyến xảy ra khi các biến độc lập tương quan mạnh với nhau, dẫn đến việc ước lượng đóng góp riêng lẻ của từng biến trở nên không chính xác. Kết luận Lý giải Làm tăng sai số chuẩn của các hệ số hồi quy, khiến các kiểm định t cho từng biến khó đạt ý nghĩa thống kê.
Câu 25:
Sai số biên (Margin of Error) của một ước lượng khoảng sẽ giảm xuống khi nào?
💡 Lời giải chi tiết:
Sai số biên tỷ lệ nghịch với căn bậc hai của kích thước mẫu, do đó mẫu càng lớn thì ước lượng càng chính xác và khoảng tin cậy càng hẹp. Kết luận Lý giải Khi tăng kích thước mẫu nghiên cứu.