Câu 1:
Trong các loại thang đo dữ liệu, thang đo nào được coi là mức độ đo lường cao nhất và có điểm gốc 'không' tuyệt đối?
💡 Lời giải chi tiết:
Theo lý thuyết thống kê, thang đo tỷ lệ bao gồm tất cả các tính chất của các thang đo khác và cho phép thực hiện các phép tính số học do có điểm 'không' thực sự. Kết luận Lý giải Thang đo tỷ lệ.
Câu 2:
Khi phân phối dữ liệu có dạng lệch phải (skewed to the right), thứ tự các giá trị đặc trưng thường gặp là gì?
💡 Lời giải chi tiết:
Trong một phân phối lệch phải, giá trị trung bình bị ảnh hưởng mạnh bởi các giá trị cực lớn ở đuôi bên phải nên thường lớn hơn trung vị và yếu vị. Kết luận Lý giải Mean > Median > Mode.
Câu 3:
Sai lầm loại I (Type I error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
💡 Lời giải chi tiết:
Theo định nghĩa về kiểm định giả thuyết, sai lầm loại I là việc bác bỏ một giả thuyết không (H0) trong khi thực tế nó là đúng. Kết luận Lý giải Bác bỏ giả thuyết H0 khi H0 đúng.
Câu 4:
Hệ số xác định (R-squared) trong mô hình hồi quy tuyến tính đơn có ý nghĩa gì?
💡 Lời giải chi tiết:
Hệ số xác định R-squared phản ánh tỷ trọng phần biến động của biến phụ thuộc được giải thích bởi mô hình hồi quy đã xây dựng. Kết luận Lý giải Cho biết tỷ lệ phần trăm sự biến thiên của biến phụ thuộc Y được giải thích bởi biến độc lập X.
Câu 5:
Phương pháp chọn mẫu nào đảm bảo mọi đơn vị trong tổng thể đều có cơ hội được chọn ngang nhau và độc lập?
💡 Lời giải chi tiết:
Chọn mẫu ngẫu nhiên đơn giản là kỹ thuật cơ bản nhất trong thống kê đảm bảo tính khách quan tối đa vì mỗi cá thể có xác suất chọn như nhau. Kết luận Lý giải Chọn mẫu ngẫu nhiên đơn giản.
Câu 6:
Chỉ số giá Laspeyres sử dụng quyền số là lượng hàng hóa của thời kỳ nào?
💡 Lời giải chi tiết:
Theo công thức thống kê kinh tế, chỉ số Laspeyres cố định quyền số ở thời kỳ gốc để so sánh sự thay đổi mức giá theo thời gian. Kết luận Lý giải Thời kỳ gốc.
Câu 7:
Theo Định lý Giới hạn Trung tâm, khi kích thước mẫu (n) đủ lớn, phân phối của trung bình mẫu sẽ xấp xỉ phân phối nào?
💡 Lời giải chi tiết:
Định lý Giới hạn Trung tâm khẳng định rằng phân phối của tổng hoặc trung bình của các biến ngẫu nhiên độc lập sẽ hội tụ về phân phối chuẩn khi mẫu lớn. Kết luận Lý giải Phân phối Chuẩn.
Câu 8:
Hệ số tương quan Pearson (r) nhận giá trị trong khoảng nào?
💡 Lời giải chi tiết:
Hệ số tương quan Pearson là chỉ số đo lường mức độ và chiều hướng liên hệ tuyến tính, dao động trong đoạn từ âm một đến dương một. Kết luận Lý giải Từ -1 đến 1.
Câu 9:
Trong phân tích dãy số thời gian, các biến động xảy ra lặp đi lặp lại có chu kỳ trong vòng một năm được gọi là gì?
💡 Lời giải chi tiết:
Theo phân tích thời gian, biến động thời vụ là những thay đổi có tính chất quy luật lặp lại định kỳ theo các quý hoặc tháng trong năm. Kết luận Lý giải Biến động thời vụ.
Câu 10:
Phân phối chuẩn (Normal Distribution) có đặc điểm nào sau đây về hình dáng đồ thị?
💡 Lời giải chi tiết:
Đường cong phân phối chuẩn là một đường cong hình chuông, đối xứng hoàn toàn qua trục đi qua giá trị trung bình, trung vị và yếu vị. Kết luận Lý giải Đồ thị có hình quả chuông và đối xứng qua giá trị trung bình.
Câu 11:
Dữ liệu về 'Giới tính' (Nam/Nữ) thuộc loại thang đo nào?
💡 Lời giải chi tiết:
Thang đo định danh được dùng để phân loại các đối tượng vào các danh mục khác nhau mà không có sự so sánh hơn kém hay tính toán số học. Kết luận Lý giải Thang đo định danh.
Câu 12:
Nếu giá trị P (P-value) nhỏ hơn mức ý nghĩa (alpha), quyết định thống kê sẽ là gì?
💡 Lời giải chi tiết:
Theo quy tắc bác bỏ trong kiểm định giả thuyết, khi giá trị P thấp hơn mức alpha, kết quả được coi là có ý nghĩa thống kê để bác bỏ H0. Kết luận Lý giải Bác bỏ giả thuyết không H0.
Câu 13:
Độ rộng của một khoảng tin cậy sẽ thay đổi như thế nào nếu kích thước mẫu tăng lên (giữ nguyên độ tin cậy)?
💡 Lời giải chi tiết:
Khi kích thước mẫu tăng, sai số chuẩn của ước lượng giảm xuống, dẫn đến khoảng tin cậy trở nên chính xác và hẹp hơn. Kết luận Lý giải Độ rộng thu hẹp lại.
Câu 14:
Hệ số biến thiên (CV) được sử dụng để so sánh độ phân tán của hai tập dữ liệu khi nào?
💡 Lời giải chi tiết:
Hệ số biến thiên là thước đo tương đối cho phép so sánh sự phân tán giữa các nhóm dữ liệu không đồng nhất về đơn vị hoặc quy mô. Kết luận Lý giải Khi hai tập dữ liệu khác nhau về đơn vị tính hoặc quy mô giá trị trung bình.
Câu 15:
Biến số 'Chiều cao của sinh viên' thuộc loại biến gì trong thống kê?
💡 Lời giải chi tiết:
Chiều cao là một biến số lượng có thể nhận bất kỳ giá trị thực nào trong một khoảng xác định, do đó nó được phân loại là biến liên tục. Kết luận Lý giải Biến liên tục.
Câu 16:
Chỉ số nào sau đây đo lường độ phân tán và rất nhạy cảm với các giá trị cực biên (outliers)?
💡 Lời giải chi tiết:
Khoảng biến thiên chỉ dựa vào giá trị lớn nhất và nhỏ nhất nên nó bị ảnh hưởng cực lớn bởi bất kỳ giá trị ngoại lai nào. Kết luận Lý giải Khoảng biến thiên (Range).
Câu 17:
Trong phương trình hồi quy Y = a + bX, hệ số b (slope) cho biết điều gì?
💡 Lời giải chi tiết:
Hệ số góc b biểu thị mức độ phản ứng của biến phụ thuộc khi biến độc lập thay đổi một đơn vị trong điều kiện các yếu tố khác không đổi. Kết luận Lý giải Sự thay đổi trung bình của Y khi X tăng thêm một đơn vị.
Câu 18:
Phân tầng trong chọn mẫu (Stratified Sampling) thường được áp dụng khi nào?
💡 Lời giải chi tiết:
Chọn mẫu phân tầng giúp tăng tính đại diện bằng cách chia tổng thể thành các nhóm nhỏ đồng nhất trước khi chọn ngẫu nhiên từ mỗi nhóm. Kết luận Lý giải Khi các đơn vị trong tổng thể có sự khác biệt rõ rệt theo một tiêu thức nào đó.
Câu 19:
Giả thuyết không (Null Hypothesis - H0) thường được phát biểu theo hướng nào?
💡 Lời giải chi tiết:
Giả thuyết H0 luôn là giả thuyết về sự nguyên trạng, tức là không có sự thay đổi hay tác động nào xảy ra cho đến khi được chứng minh ngược lại. Kết luận Lý giải Không có sự khác biệt hoặc không có mối liên hệ giữa các tham số.
Câu 20:
Chỉ số giá Paasche khác với chỉ số giá Laspeyres ở điểm nào cơ bản?
💡 Lời giải chi tiết:
Theo quy tắc tính toán chỉ số, chỉ số Paasche sử dụng cơ cấu hàng hóa ở thời kỳ hiện tại (kỳ báo cáo) để tính toán quyền số. Kết luận Lý giải Sử dụng lượng của kỳ báo cáo làm quyền số.
Câu 21:
Điều kiện nào sau đây là bắt buộc đối với một thực nghiệm tuân theo phân phối nhị thức (Binomial Distribution)?
💡 Lời giải chi tiết:
Phân phối nhị thức đòi hỏi mỗi phép thử độc lập chỉ dẫn đến một trong hai kết quả đối kháng thường gọi là thành công hoặc thất bại. Kết luận Lý giải Mỗi phép thử chỉ có hai kết quả có thể xảy ra.
Câu 22:
Nếu một tập dữ liệu có số quan sát là chẵn, trung vị (Median) được tính như thế nào?
💡 Lời giải chi tiết:
Trong trường hợp số lượng đơn vị là chẵn, không có một giá trị đơn nhất ở giữa nên ta lấy trung bình của hai vị trí trung tâm. Kết luận Lý giải Là trung bình cộng của hai giá trị đứng giữa sau khi đã sắp xếp.
Câu 23:
Đơn vị tính của độ lệch chuẩn (Standard Deviation) là gì?
💡 Lời giải chi tiết:
Vì độ lệch chuẩn là căn bậc hai của phương sai nên nó quay trở về cùng đơn vị đo lường với các giá trị quan sát ban đầu. Kết luận Lý giải Cùng đơn vị tính với dữ liệu gốc.
Câu 24:
Giả định về 'đẳng phương sai' (Homoscedasticity) trong hồi quy OLS có nghĩa là gì?
💡 Lời giải chi tiết:
Đẳng phương sai là giả định quan trọng đảm bảo tính hiệu quả của ước lượng OLS, yêu cầu độ phân tán của sai số phải đồng nhất. Kết luận Lý giải Phương sai của sai số ngẫu nhiên là không đổi đối với mọi giá trị của biến độc lập.
Câu 25:
Mục đích chính của việc tính số trung bình trượt (Moving Average) trong dãy số thời gian là gì?
💡 Lời giải chi tiết:
Phương pháp trung bình trượt giúp triệt tiêu các dao động nhỏ, ngắn hạn để làm nổi bật xu thế phát triển cơ bản của hiện tượng. Kết luận Lý giải Để làm trơn dãy số và loại bỏ các biến động ngẫu nhiên.