Câu 1:
Vào tháng 3 năm 2024, chỉ số nào chính thức thay thế First Input Delay (FID) trong bộ chỉ số Core Web Vitals của Google?
💡 Lời giải chi tiết:
Theo thông báo chính thức từ Google Search Central, chỉ số Interaction to Next Paint (INP) đã chính thức thay thế FID để đo lường khả năng phản hồi toàn diện của trang web kể từ ngày 12 tháng 3 năm 2024. Kết luận Lý giải Interaction to Next Paint (INP).
Câu 2:
Phương pháp nào sau đây là cách hiệu quả nhất để ngăn Google lập chỉ mục (index) một trang web cụ thể?
💡 Lời giải chi tiết:
Theo tài liệu của Google, lệnh Disallow trong robots.txt chỉ ngăn việc thu thập thông tin (crawl) chứ không ngăn lập chỉ mục nếu trang được liên kết từ nơi khác, trong khi thẻ 'noindex' ra lệnh trực tiếp cho robot không đưa trang vào chỉ mục. Kết luận Lý giải Sử dụng thẻ meta robots với giá trị 'noindex'.
Câu 3:
Trong SEO Technical, mục đích chính của việc sử dụng thẻ 'canonical' là gì?
💡 Lời giải chi tiết:
Thẻ 'canonical' giúp công cụ tìm kiếm hiểu được đâu là phiên bản nội dung chính khi có nhiều URL chứa nội dung tương tự nhau, giúp tập trung sức mạnh xếp hạng vào một URL duy nhất. Kết luận Lý giải Giải quyết vấn đề nội dung trùng lặp bằng cách xác định phiên bản gốc ưu tiên.
Câu 4:
Giới hạn tối đa về số lượng URL và dung lượng chưa nén của một tệp XML Sitemap theo tiêu chuẩn hiện nay là bao nhiêu?
💡 Lời giải chi tiết:
Theo quy chuẩn chung của Sitemaps.org mà Google và Bing áp dụng, một tệp sitemap đơn lẻ không được vượt quá 50.000 URL và kích thước tệp khi chưa nén không được quá 50 MB. Kết luận Lý giải 50.000 URL và 50 MB.
Câu 5:
Mã trạng thái HTTP (HTTP Status Code) nào thông báo cho công cụ tìm kiếm rằng trang web đã được chuyển hướng vĩnh viễn sang một địa chỉ mới?
💡 Lời giải chi tiết:
Mã 301 là tín hiệu chuẩn để thông báo sự dịch chuyển vĩnh viễn của một URL, giúp chuyển giao phần lớn giá trị SEO (link equity) từ URL cũ sang URL mới. Kết luận Lý giải 301 Moved Permanently.
Câu 6:
Trong các định dạng dữ liệu có cấu trúc (Structured Data), Google khuyến nghị sử dụng định dạng nào nhất hiện nay?
💡 Lời giải chi tiết:
Google ưu tiên định dạng JSON-LD vì nó dễ triển khai, bảo trì và không gây ảnh hưởng đến cấu trúc hiển thị HTML của trang web như Microdata hay RDFa. Kết luận Lý giải JSON-LD.
Câu 7:
Chỉ số Cumulative Layout Shift (CLS) trong Core Web Vitals dùng để đo lường yếu tố nào?
💡 Lời giải chi tiết:
CLS đo lường tổng điểm của tất cả các thay đổi bố cục không mong muốn xảy ra trong toàn bộ vòng đời của trang, phản ánh trải nghiệm người dùng về sự ổn định giao diện. Kết luận Lý giải Sự ổn định về mặt thị giác của trang web trong quá trình tải.
Câu 8:
Khi cấu hình thuộc tính 'hreflang' cho trang web đa ngôn ngữ, giá trị 'x-default' có ý nghĩa gì?
💡 Lời giải chi tiết:
Giá trị 'x-default' trong thuộc tính 'hreflang' được dùng để chỉ định trang mặc định cho người dùng toàn cầu khi cài đặt ngôn ngữ của họ không khớp với bất kỳ phiên bản ngôn ngữ cụ thể nào mà trang web cung cấp. Kết luận Lý giải Chỉ định trang đích cho người dùng khi không có ngôn ngữ nào khác phù hợp.
Câu 9:
Sự khác biệt chính giữa mã lỗi 404 và mã lỗi 410 là gì?
💡 Lời giải chi tiết:
Trong khi mã 404 là lỗi không tìm thấy tài nguyên (có thể tạm thời), mã 410 (Gone) thông báo rõ ràng cho bot rằng tài nguyên đã bị xóa vĩnh viễn và không nên quay lại thu thập thông tin thường xuyên nữa. Kết luận Lý giải 404 nghĩa là không tìm thấy, còn 410 nghĩa là nội dung đã bị xóa vĩnh viễn.
Câu 10:
Việc sử dụng tệp robots.txt để chặn Googlebot truy cập các tệp CSS và JavaScript có thể dẫn đến hệ quả gì?
💡 Lời giải chi tiết:
Google cần truy cập các tệp CSS và JavaScript để hiểu được giao diện và chức năng của trang web, nếu bị chặn, Googlebot sẽ không thể render đầy đủ trải nghiệm người dùng (Mobile-Friendly). Kết luận Lý giải Google không thể render trang web chính xác và có thể đánh giá thấp chất lượng trang.
Câu 11:
Trong báo cáo Crawl Stats của Google Search Console, 'Crawl Budget' của một trang web bị ảnh hưởng trực tiếp nhất bởi yếu tố nào?
💡 Lời giải chi tiết:
Theo định nghĩa từ Google, Crawl Budget được quyết định bởi khả năng chịu tải của máy chủ (Crawl limit) và mức độ quan trọng/tần suất cập nhật của nội dung (Crawl demand). Kết luận Lý giải Tốc độ phản hồi của trang (Host load capacity) và nhu cầu thu thập dữ liệu (Crawl demand).
Câu 12:
Thẻ 'meta name robots content nosnippet' có tác dụng gì đối với kết quả tìm kiếm?
💡 Lời giải chi tiết:
Chỉ thị 'nosnippet' yêu cầu các công cụ tìm kiếm không hiển thị bất kỳ đoạn trích văn bản hoặc bản xem trước video nào cho trang đó trên trang kết quả tìm kiếm. Kết luận Lý giải Ngăn công cụ tìm kiếm hiển thị phần mô tả (snippet) của trang trong kết quả tìm kiếm.
Câu 13:
Kỹ thuật 'Lazy Loading' hình ảnh mang lại lợi ích kỹ thuật SEO nào lớn nhất?
💡 Lời giải chi tiết:
Lazy loading trì hoãn việc tải các hình ảnh nằm ngoài màn hình đầu tiên, giúp giảm tài nguyên tải ban đầu và cải thiện đáng kể thời gian tải phần tử lớn nhất (LCP). Kết luận Lý giải Cải thiện chỉ số LCP bằng cách ưu tiên tải các nội dung quan trọng trước.
Câu 14:
Khi một trang web gặp lỗi 'Soft 404', điều đó có nghĩa là gì?
💡 Lời giải chi tiết:
Lỗi Soft 404 xảy ra khi máy chủ trả về mã thành công (200 OK) cho một trang thực tế không tồn tại hoặc nội dung quá nghèo nàn, gây nhầm lẫn cho công cụ tìm kiếm. Kết luận Lý giải Trang web thông báo không tìm thấy nội dung nhưng lại trả về mã trạng thái HTTP 200 OK.
Câu 15:
Trong cấu trúc URL, việc sử dụng 'Dấu gạch chéo cuối' (Trailing Slash) có ảnh hưởng như thế nào đến SEO Technical?
💡 Lời giải chi tiết:
Về mặt kỹ thuật, Google đối xử với URL kết thúc bằng gạch chéo và không có gạch chéo là hai thực thể riêng biệt, do đó cần sử dụng redirect 301 hoặc thẻ canonical để tránh trùng lặp. Kết luận Lý giải Google coi hai URL có và không có dấu gạch chéo là hai trang khác nhau, có thể gây trùng lặp nội dung.
Câu 16:
Giao thức bảo mật HSTS (HTTP Strict Transport Security) có vai trò gì trong SEO Technical?
💡 Lời giải chi tiết:
HSTS là một cơ chế chính sách bảo mật web giúp bảo vệ trang web chống lại các cuộc tấn công hạ cấp giao thức bằng cách buộc trình duyệt luôn sử dụng HTTPS. Kết luận Lý giải Ép buộc trình duyệt chỉ kết nối với trang web thông qua giao thức HTTPS an toàn.
Câu 17:
Chỉ số 'Largest Contentful Paint' (LCP) được Google đánh giá là 'Tốt' (Good) nếu thời gian tải đạt mức nào?
💡 Lời giải chi tiết:
Theo tiêu chuẩn Core Web Vitals của Google, để đảm bảo trải nghiệm người dùng tốt, chỉ số LCP của trang web nên diễn ra trong vòng 2,5 giây đầu tiên kể từ khi trang bắt đầu tải. Kết luận Lý giải Dưới 2,5 giây.
Câu 18:
Mục đích chính của việc phân tích 'Log File' (Tệp nhật ký máy chủ) trong SEO Technical là gì?
💡 Lời giải chi tiết:
Phân tích Log File cung cấp dữ liệu xác thực nhất về hoạt động của các bot tìm kiếm trên máy chủ, giúp xác định các vấn đề về ngân sách thu thập dữ liệu và lỗi crawl. Kết luận Lý giải Để xem chính xác cách thức và tần suất các công cụ tìm kiếm thu thập dữ liệu (crawl) trang web.
Câu 19:
Tại sao việc triển khai Pagination (phân trang) bằng 'Infinite Scroll' (cuộn vô hạn) có thể gây khó khăn cho SEO?
💡 Lời giải chi tiết:
Mặc dù Googlebot đã cải thiện việc xử lý JavaScript, nhưng nó không thực hiện các tương tác người dùng như cuộn trang, do đó nội dung tải thêm có thể không được thu thập nếu không có các liên kết thay thế. Kết luận Lý giải Bot tìm kiếm có thể không kích hoạt được hành động cuộn để thấy các nội dung tiếp theo.
Câu 20:
Thuộc tính 'rel sponsored' được sử dụng trong trường hợp nào là chính xác nhất theo hướng dẫn của Google?
💡 Lời giải chi tiết:
Google giới thiệu thuộc tính 'sponsored' vào năm 2019 để đánh dấu rõ ràng các liên kết được tạo ra như một phần của quảng cáo, tài trợ hoặc các thỏa thuận trả phí khác. Kết luận Lý giải Dành cho các liên kết là quảng cáo hoặc các vị trí đặt liên kết có trả phí.
Câu 21:
Mã trạng thái HTTP 503 (Service Unavailable) có ảnh hưởng như thế nào nếu kéo dài quá lâu?
💡 Lời giải chi tiết:
Mã 503 thông báo tạm thời ngừng hoạt động, nhưng nếu tình trạng này kéo dài (thường quá vài ngày), Google sẽ coi đó là lỗi vĩnh viễn và bắt đầu xóa URL khỏi chỉ mục. Kết luận Lý giải Google có thể gỡ bỏ các trang web khỏi chỉ mục tìm kiếm nếu lỗi này duy trì liên tục.
Câu 22:
Trong SEO Technical, 'Dynamic Rendering' là kỹ thuật được sử dụng để giải quyết vấn đề gì?
💡 Lời giải chi tiết:
Dynamic Rendering giúp các trang web nặng về JavaScript đảm bảo công cụ tìm kiếm nhận được nội dung HTML đầy đủ mà không cần bot phải thực thi các script phức tạp. Kết luận Lý giải Cung cấp phiên bản HTML đã render cho bot và phiên bản client-side render cho người dùng.
Câu 23:
Ưu điểm lớn nhất của định dạng hình ảnh WebP so với JPEG hay PNG trong tối ưu hóa tốc độ trang là gì?
💡 Lời giải chi tiết:
WebP là định dạng hình ảnh hiện đại sử dụng cả nén có tổn hao và không tổn hao, giúp giảm dung lượng tệp đáng kể so với PNG/JPEG, từ đó tăng tốc độ tải trang. Kết luận Lý giải Cung cấp khả năng nén tốt hơn, tạo ra kích thước tệp nhỏ hơn mà vẫn giữ được chất lượng tương đương.
Câu 24:
Trong tệp robots.txt, lệnh 'Crawl-delay' có tác dụng gì đối với Googlebot?
💡 Lời giải chi tiết:
Mặc dù một số bot khác như Bingbot hỗ trợ lệnh Crawl-delay, Googlebot hoàn toàn không tuân theo lệnh này mà tự động điều chỉnh tốc độ crawl dựa trên khả năng chịu tải của máy chủ. Kết luận Lý giải Lệnh này hoàn toàn bị Googlebot phớt lờ vì Google không hỗ trợ nó.
Câu 25:
Khi cấu hình dữ liệu có cấu trúc cho Breadcrumb (đường dẫn phân cấp), thuộc tính 'position' có vai trò gì?
💡 Lời giải chi tiết:
Theo Schema.org cho BreadcrumbList, thuộc tính 'position' là bắt buộc để xác định thứ tự logic của các liên kết trong thanh điều hướng phân cấp. Kết luận Lý giải Chỉ định thứ tự của các mục trong chuỗi Breadcrumb, bắt đầu từ 1.