Câu 1:
Trong thống kê học, loại biến số nào mà các giá trị của nó chỉ dùng để phân loại và không có ý nghĩa về mặt thứ tự hay tính toán số học?
💡 Lời giải chi tiết:
Theo phân loại thang đo đo lường, biến định danh chỉ dùng để đặt tên hoặc phân loại các đối tượng vào các nhóm riêng biệt mà không có sự so sánh hơn kém. Kết luận Lý giải Biến định danh
Câu 2:
Thang đo nào sau đây có đầy đủ các đặc tính của thang đo khoảng và bổ sung thêm đặc điểm có điểm 0 tuyệt đối?
💡 Lời giải chi tiết:
Trong lý thuyết đo lường, thang đo tỷ lệ là mức độ cao nhất cho phép thực hiện tất cả các phép tính toán học và so sánh tỷ lệ nhờ sự tồn tại của điểm gốc 0 thực sự. Kết luận Lý giải Thang đo tỷ lệ
Câu 3:
Khi một phân phối dữ liệu có hình dáng lệch phải (skewed to the right), mối quan hệ giữa các tham số đặc trưng thường là gì?
💡 Lời giải chi tiết:
Trong một phân phối lệch phải, các giá trị cực lớn ở đuôi bên phải kéo số trung bình về phía đó khiến nó thường lớn hơn số trung vị và số yếu vị. Kết luận Lý giải Số trung bình lớn hơn Số trung vị
Câu 4:
Chỉ số nào sau đây đo lường mức độ biến thiên của dữ liệu và có cùng đơn vị tính với dữ liệu gốc?
💡 Lời giải chi tiết:
Độ lệch chuẩn được tính bằng căn bậc hai của phương sai nhằm đưa giá trị đo lường sự phân tán về cùng đơn vị với biến số ban đầu. Kết luận Lý giải Độ lệch chuẩn
Câu 5:
Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I Error) xảy ra khi nào?
💡 Lời giải chi tiết:
Sai lầm loại I, còn gọi là mức ý nghĩa alpha, là rủi ro khi người nghiên cứu đưa ra kết luận bác bỏ một giả thuyết không thực sự đúng. Kết luận Lý giải Bác bỏ giả thuyết H0 khi H0 thực sự đúng
Câu 6:
Giá trị p (p-value) trong kiểm định giả thuyết được hiểu là gì?
💡 Lời giải chi tiết:
Theo định nghĩa thống kê chuẩn, p-value đo lường bằng chứng chống lại H0 dựa trên xác suất xảy ra của dữ liệu mẫu dưới giả định H0 là đúng. Kết luận Lý giải Xác suất quan sát được kết quả cực đoan như thực tế hoặc hơn thế nếu H0 đúng
Câu 7:
Nếu hệ số tương quan tuyến tính (r) giữa hai biến X và Y bằng -0,95, điều này cho thấy điều gì?
💡 Lời giải chi tiết:
Hệ số tương quan r gần bằng -1 thể hiện một mối quan hệ tuyến tính ngược chiều (nghịch biến) với cường độ rất mạnh giữa hai biến. Kết luận Lý giải X và Y có mối quan hệ tuyến tính nghịch biến rất chặt chẽ
Câu 8:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn có ý nghĩa gì?
💡 Lời giải chi tiết:
R-squared phản ánh khả năng giải thích của mô hình bằng cách cho biết bao nhiêu phần trăm sự thay đổi của biến Y là do tác động của biến X trong mô hình. Kết luận Lý giải Tỷ lệ phần trăm sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
Câu 9:
Định lý giới hạn trung tâm (Central Limit Theorem) khẳng định rằng khi quy mô mẫu đủ lớn, phân phối của số trung bình mẫu sẽ xấp xỉ phân phối nào?
💡 Lời giải chi tiết:
Định lý giới hạn trung tâm là nền tảng của thống kê suy diễn, chỉ ra rằng phân phối của các trung bình mẫu sẽ tiến tới phân phối chuẩn bất kể hình dạng của phân phối tổng thể khi cỡ mẫu tăng lên. Kết luận Lý giải Phân phối chuẩn
Câu 10:
Khoảng tin cậy 95% cho số trung bình của tổng thể có nghĩa là gì?
💡 Lời giải chi tiết:
Độ tin cậy 95% mô tả quy trình ước lượng dài hạn, nghĩa là 95% các khoảng tin cậy được tính toán từ các mẫu ngẫu nhiên khác nhau sẽ bao phủ tham số thực. Kết luận Lý giải Nếu lấy nhiều mẫu lặp lại, khoảng 95% các khoảng tin cậy được xây dựng sẽ chứa số trung bình thực của tổng thể
Câu 11:
Để so sánh số trung bình của nhiều hơn hai nhóm độc lập, phương pháp thống kê nào thường được sử dụng phổ biến nhất?
💡 Lời giải chi tiết:
Phân tích biến phương (ANOVA) được thiết kế đặc biệt để kiểm tra sự khác biệt giữa các trung bình nhóm khi số lượng nhóm từ ba trở lên. Kết luận Lý giải Phân tích biến phương (ANOVA)
Câu 12:
Trong một nghiên cứu, nếu tăng kích thước mẫu (n) trong khi giữ nguyên độ lệch chuẩn và độ tin cậy, sai số biên (margin of error) sẽ thay đổi như thế nào?
💡 Lời giải chi tiết:
Sai số biên tỷ lệ nghịch với căn bậc hai của kích thước mẫu, do đó việc tăng cỡ mẫu giúp thu hẹp khoảng tin cậy và giảm sai số ước lượng. Kết luận Lý giải Giảm đi
Câu 13:
Chỉ số giá Laspeyres sử dụng quyền số (lượng hàng hóa) của thời kỳ nào?
💡 Lời giải chi tiết:
Chỉ số Laspeyres là phương pháp tính chỉ số giá bằng cách giữ cố định giỏ hàng hóa ở thời kỳ gốc để so sánh sự thay đổi về giá. Kết luận Lý giải Thời kỳ gốc
Câu 14:
Dãy số thời gian là tập hợp các trị số của một chỉ tiêu thống kê được sắp xếp theo thứ tự nào?
💡 Lời giải chi tiết:
Theo định nghĩa cơ bản, dãy số thời gian phản ánh sự biến động của hiện tượng qua các mốc hoặc khoảng thời gian liên tiếp. Kết luận Lý giải Thứ tự thời gian
Câu 15:
Thành phần nào trong dãy số thời gian phản ánh những biến động lặp đi lặp lại có tính chu kỳ trong vòng một năm?
💡 Lời giải chi tiết:
Biến động thời vụ là những thay đổi có quy luật xảy ra hàng năm do tác động của thời tiết, lễ hội hoặc tập quán tiêu dùng. Kết luận Lý giải Biến động thời vụ (Seasonal variation)
Câu 16:
Trong kiểm định Chi-bình phương về tính độc lập giữa hai biến định tính, giả thuyết H0 thường được phát biểu là gì?
💡 Lời giải chi tiết:
Kiểm định Chi-bình phương tính độc lập bắt đầu với giả định mặc định là không có mối liên hệ (độc lập) giữa các tiêu thức phân loại. Kết luận Lý giải Hai biến độc lập với nhau
Câu 17:
Độ lệch chuẩn của phân phối mẫu của một thống kê (như trung bình mẫu) được gọi là gì?
💡 Lời giải chi tiết:
Sai số chuẩn đo lường mức độ biến thiên của các ước lượng mẫu xung quanh tham số thực của tổng thể. Kết luận Lý giải Sai số chuẩn (Standard Error)
Câu 18:
Nếu một tập dữ liệu có giá trị ngoại lai (outliers) cực lớn, tham số đặc trưng nào sau đây sẽ bị ảnh hưởng mạnh nhất?
💡 Lời giải chi tiết:
Số trung bình có tính nhạy cảm cao vì nó sử dụng tất cả các giá trị trong tập dữ liệu để tính toán, bao gồm cả các giá trị bất thường. Kết luận Lý giải Số trung bình
Câu 19:
Phương pháp chọn mẫu nào đảm bảo mọi đơn vị trong tổng thể đều có xác suất được chọn như nhau vào mẫu?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là kỹ thuật lấy mẫu xác bản cơ bản nhất nơi mỗi phần tử có cơ hội trúng tuyển ngang nhau. Kết luận Lý giải Chọn mẫu ngẫu nhiên đơn giản
Câu 20:
Trong mô hình hồi quy Y = 20 + 5X, hệ số hồi quy (độ dốc) bằng 5 có ý nghĩa là gì?
💡 Lời giải chi tiết:
Hệ số góc trong mô hình hồi quy tuyến tính đơn phản ánh mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị. Kết luận Lý giải Khi X tăng 1 đơn vị, Y sẽ tăng trung bình 5 đơn vị
Câu 21:
Đặc điểm nào sau đây KHÔNG thuộc về phân phối chuẩn (Normal Distribution)?
💡 Lời giải chi tiết:
Phân phối chuẩn là phân phối hoàn toàn đối xứng qua giá trị trung tâm, nên nó không bao giờ có đặc tính bị lệch. Kết luận Lý giải Phân phối bị lệch đáng kể về phía trái
Câu 22:
Trong phân tích hồi quy, 'phần dư' (residual) được xác định như thế nào?
💡 Lời giải chi tiết:
Phần dư phản ánh sai số của mô hình tại từng điểm dữ liệu, tính bằng khoảng cách từ giá trị quan sát đến đường hồi quy ước lượng. Kết luận Lý giải Hiệu số giữa giá trị thực tế và giá trị dự báo
Câu 23:
Sai số phi chọn mẫu (Non-sampling error) phát sinh chủ yếu từ đâu?
💡 Lời giải chi tiết:
Khác với sai số chọn mẫu, sai số phi chọn mẫu xảy ra do các khiếm khuyết trong quy trình thực hiện nghiên cứu thực địa và xử lý dữ liệu. Kết luận Lý giải Do lỗi trong thiết kế bảng hỏi, thu thập hoặc nhập liệu
Câu 24:
Khi giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha) đã chọn, kết luận đưa ra là gì?
💡 Lời giải chi tiết:
Quy tắc quyết định trong kiểm định thống kê là bác bỏ giả thuyết không khi xác suất dữ liệu xảy ra (p-value) thấp hơn ngưỡng rủi ro cho phép (alpha). Kết luận Lý giải Bác bỏ giả thuyết H0
Câu 25:
Yếu tố nào sau đây là biến định lượng rời rạc?
💡 Lời giải chi tiết:
Biến rời rạc là biến mà các giá trị của nó có thể đếm được và thường là các số nguyên, ví dụ như số lượng đơn vị sản phẩm. Kết luận Lý giải Số lượng xe máy bán được trong một ngày