Câu 1:Mục đích chính của tệp 'robots.txt' trong SEO Technical là gì?
💡 Lời giải chi tiết:
Theo tài liệu từ Google Search Central, tệp robots.txt được sử dụng chủ yếu để quản lý lưu lượng truy cập của trình thu thập dữ liệu nhằm tránh làm quá tải máy chủ. Kết luận Lý giải Hướng dẫn các trình thu thập dữ liệu về các trang hoặc tệp mà chúng có thể hoặc không thể yêu cầu từ trang web của bạn.
Câu 2:Giới hạn tối đa về số lượng URL và dung lượng tệp cho một sơ đồ trang web (Sitemap.xml) chưa nén theo tiêu chuẩn của Google là bao nhiêu?
💡 Lời giải chi tiết:
Google và các công cụ tìm kiếm khác quy định rằng một tệp sơ đồ trang web đơn lẻ không được vượt quá 50,000 URL và phải có kích thước dưới 50 MB khi chưa nén. Kết luận Lý giải 50,000 URL và 50 MB.
Câu 3:Chỉ số LCP (Largest Contentful Paint) trong Core Web Vitals đo lường yếu tố nào?
💡 Lời giải chi tiết:
LCP là một chỉ số quan trọng trong Core Web Vitals dùng để đánh giá hiệu suất tải trang dựa trên thời điểm phần tử lớn nhất hiển thị. Kết luận Lý giải Thời gian để phần tử nội dung lớn nhất hiển thị hoàn toàn trong khung hình.
Câu 4:Sự khác biệt cơ bản nhất giữa thẻ 'canonical' và lệnh chuyển hướng 301 là gì?
💡 Lời giải chi tiết:
Lệnh 301 buộc trình duyệt và bot di chuyển sang URL mới, trong khi thẻ canonical chỉ là tín hiệu để Google ưu tiên một URL gốc trong số các trang trùng lặp. Kết luận Lý giải 301 là lệnh chuyển hướng bắt buộc còn canonical là một gợi ý cho công cụ tìm kiếm.
Câu 5:Trong mã trạng thái HTTP, mã 410 (Gone) khác với mã 404 (Not Found) như thế nào về mặt SEO?
💡 Lời giải chi tiết:
Mã 410 cung cấp thông tin rõ ràng hơn cho công cụ tìm kiếm rằng tài nguyên đã bị gỡ bỏ vĩnh viễn, giúp tối ưu hóa ngân sách thu thập dữ liệu hiệu quả hơn 404. Kết luận Lý giải 410 thông báo trang đã bị xóa vĩnh viễn và không nên quay lại thu thập dữ liệu nữa.
Câu 6:Chỉ số CLS (Cumulative Layout Shift) đo lường khía cạnh nào của trải nghiệm người dùng?
💡 Lời giải chi tiết:
Theo tiêu chuẩn của Google, CLS đo lường tổng điểm của tất cả các thay đổi bố cục đột ngột xảy ra trong suốt vòng đời của trang. Kết luận Lý giải Độ ổn định của thị giác bằng cách đo lường các thay đổi bố cục không mong muốn.
Câu 7:Tại sao việc sử dụng dấu gạch ngang '-' thay vì dấu gạch dưới '_' trong URL được khuyến nghị cho SEO?
💡 Lời giải chi tiết:
Google ưu tiên dấu gạch ngang vì thuật toán của họ nhận diện nó như một khoảng cách giữa các từ, giúp hiểu rõ ngữ nghĩa của URL hơn. Kết luận Lý giải Công cụ tìm kiếm coi dấu gạch ngang là ký tự phân tách từ, còn dấu gạch dưới thì không.
Câu 8:Lỗi 'Soft 404' xảy ra khi nào?
💡 Lời giải chi tiết:
Lỗi Soft 404 gây lãng phí tài nguyên thu thập dữ liệu vì máy chủ thông báo trang hoạt động bình thường nhưng nội dung lại trống hoặc báo lỗi. Kết luận Lý giải Khi một trang trả về mã trạng thái 200 (Thành công) nhưng thực tế lại hiển thị thông báo lỗi hoặc không có nội dung.
Câu 9:Thẻ 'hreflang' được sử dụng nhằm mục đích gì trong SEO Technical?
💡 Lời giải chi tiết:
Thẻ hreflang giúp Google hiển thị đúng phiên bản ngôn ngữ của trang web cho người dùng dựa trên vị trí và cài đặt ngôn ngữ của họ. Kết luận Lý giải Để thông báo cho công cụ tìm kiếm về phiên bản ngôn ngữ và khu vực địa lý cụ thể của một trang.
Câu 10:Chỉ số INP (Interaction to Next Paint) chính thức thay thế chỉ số nào trong Core Web Vitals từ tháng 3 năm 2024?
💡 Lời giải chi tiết:
Theo thông báo từ Google, INP cung cấp cái nhìn toàn diện hơn về khả năng phản hồi của trang so với FID bằng cách quan sát tất cả các tương tác. Kết luận Lý giải FID (First Input Delay).
Câu 11:Lợi ích lớn nhất của việc sử dụng định dạng dữ liệu có cấu trúc JSON-LD so với Microdata là gì?
💡 Lời giải chi tiết:
JSON-LD được Google khuyến nghị vì tính linh hoạt, cho phép chèn vào thẻ 'head' hoặc 'body' mà không làm thay đổi cấu trúc hiển thị của HTML. Kết luận Lý giải Nó có thể được triển khai độc lập với mã HTML của nội dung hiển thị, dễ bảo trì hơn.
Câu 12:Khi một trang web sử dụng 'Mobile-first indexing', Google sẽ ưu tiên thu thập dữ liệu từ phiên bản nào?
💡 Lời giải chi tiết:
Theo cơ chế Mobile-first indexing, Googlebot chủ yếu sử dụng phiên bản di động của nội dung để lập chỉ mục và xếp hạng. Kết luận Lý giải Phiên bản dành cho thiết bị di động (Mobile).
Câu 13:Cấu trúc 'Breadcrumb' có vai trò gì quan trọng trong SEO Technical?
💡 Lời giải chi tiết:
Breadcrumbs không chỉ cải thiện trải nghiệm người dùng mà còn giúp Google hiểu rõ hơn về vị trí của trang trong hệ thống phân cấp trang web. Kết luận Lý giải Giúp người dùng và công cụ tìm kiếm hiểu được cấu trúc phân cấp của trang web.
Câu 14:Lệnh 'noindex' đặt trong tệp 'robots.txt' có tác dụng gì đối với Google?
💡 Lời giải chi tiết:
Từ năm 2019, Google chính thức ngừng hỗ trợ quy tắc noindex không chính thức trong tệp robots.txt và khuyến nghị sử dụng thẻ meta robots thay thế. Kết luận Lý giải Không có tác dụng vì Google đã ngừng hỗ trợ lệnh noindex trong tệp robots.txt.
Câu 15:Tại sao 'Redirect Chains' (Chuỗi chuyển hướng) lại có hại cho SEO?
💡 Lời giải chi tiết:
Mỗi bước chuyển hướng trung gian làm tăng thời gian chờ của người dùng và khiến bot mất thêm công sức để đi đến URL đích cuối cùng. Kết luận Lý giải Chúng làm chậm tốc độ tải trang và gây lãng phí ngân sách thu thập dữ liệu (crawl budget).
Câu 16:Trong SEO Technical, thuật ngữ 'Crawl Budget' (Ngân sách thu thập dữ liệu) ám chỉ điều gì?
💡 Lời giải chi tiết:
Crawl Budget phụ thuộc vào tốc độ phản hồi của máy chủ và mức độ quan trọng (nhu cầu) của các nội dung trên trang web đó đối với Google. Kết luận Lý giải Số lượng trang mà bot của công cụ tìm kiếm có thể và muốn thu thập dữ liệu trên một website trong một khoảng thời gian nhất định.
Câu 17:Ưu điểm chính của việc sử dụng giao thức HTTP/2 đối với SEO là gì?
💡 Lời giải chi tiết:
HTTP/2 cải thiện hiệu suất tải trang đáng kể thông qua kỹ thuật multiplexing, trực tiếp hỗ trợ các chỉ số tốc độ trong Core Web Vitals. Kết luận Lý giải Cho phép tải nhiều tài nguyên cùng lúc trên một kết nối TCP duy nhất, giúp tăng tốc độ tải trang.
Câu 18:Mã trạng thái HTTP 503 (Service Unavailable) nên được sử dụng khi nào?
💡 Lời giải chi tiết:
Mã 503 thông báo cho bot rằng việc không thể truy cập chỉ là tạm thời, giúp bảo vệ thứ hạng SEO thay vì bị coi là trang lỗi vĩnh viễn. Kết luận Lý giải Khi trang web đang được bảo trì tạm thời hoặc máy chủ bị quá tải.
Câu 19:Việc sử dụng thẻ 'rel=nofollow' trong các liên kết nội bộ (internal links) thường được khuyến nghị khi nào?
💡 Lời giải chi tiết:
Trong SEO Technical, việc dùng nofollow cho liên kết nội bộ cản trở quá trình phân phối sức mạnh và thu thập dữ liệu một cách hiệu quả của website. Kết luận Lý giải Hầu như không bao giờ, vì nó ngăn chặn bot chuyển giao giá trị giữa các trang trong cùng hệ thống.
Câu 20:Kỹ thuật 'Lazy Loading' hình ảnh ảnh hưởng như thế nào đến SEO nếu không được triển khai đúng cách?
💡 Lời giải chi tiết:
Nếu sử dụng JavaScript để lazy load mà không cung cấp thuộc tính dự phòng phù hợp, công cụ tìm kiếm có thể sẽ bỏ lỡ nội dung hình ảnh đó. Kết luận Lý giải Có thể ngăn cản Googlebot thu thập và lập chỉ mục các hình ảnh nếu chúng không xuất hiện trong DOM khi bot quét.
Câu 21:Lợi ích của việc phân tích 'Log Files' của máy chủ đối với một chuyên gia SEO Technical là gì?
💡 Lời giải chi tiết:
Dữ liệu log file là nguồn tin cậy nhất để xác định hành vi thực tế của Googlebot, bao gồm các trang nó đã ghé thăm và các lỗi gặp phải. Kết luận Lý giải Để hiểu chính xác cách thức và tần suất các bot tìm kiếm thu thập dữ liệu trên website thực tế.
Câu 22:Hệ quả của việc để tồn tại quá nhiều 'Orphan Pages' (Trang mồ côi) trên website là gì?
💡 Lời giải chi tiết:
Trang mồ côi không nhận được bất kỳ liên kết nào từ các trang khác trên cùng website, dẫn đến việc bot rất khó tìm thấy và người dùng cũng không thể truy cập thông thường. Kết luận Lý giải Khiến công cụ tìm kiếm khó phát hiện và lập chỉ mục các trang này vì không có liên kết nội bộ trỏ đến.
Câu 23:Kỹ thuật 'Dynamic Rendering' thường được áp dụng cho loại website nào?
💡 Lời giải chi tiết:
Dynamic rendering cung cấp phiên bản HTML tĩnh cho bot và phiên bản JavaScript cho người dùng để đảm bảo nội dung được lập chỉ mục chính xác. Kết luận Lý giải Các website dựa nhiều vào JavaScript mà bot tìm kiếm gặp khó khăn khi xử lý.
Câu 24:Vai trò của thẻ 'Vary: User-Agent' trong SEO cho các website phục vụ nội dung khác nhau cho di động và máy tính (Dynamic Serving) là gì?
💡 Lời giải chi tiết:
Thẻ này giúp ngăn chặn các máy chủ đệm gửi nhầm phiên bản nội dung dành cho máy tính đến người dùng di động và giúp Googlebot phát hiện nội dung di động nhanh hơn. Kết luận Lý giải Thông báo cho máy chủ bộ nhớ đệm (cache) rằng nội dung cần thay đổi dựa trên thiết bị của người dùng.
Câu 25:Tại sao việc nén tệp bằng Gzip hoặc Brotli lại quan trọng trong SEO Technical?
💡 Lời giải chi tiết:
Các kỹ thuật nén giúp tối ưu hóa băng thông và giảm thời gian phản hồi của máy chủ, một yếu tố then chốt trong đánh giá trải nghiệm trang của Google. Kết luận Lý giải Nó làm giảm kích thước tệp truyền tải, từ đó cải thiện tốc độ tải trang và chỉ số Core Web Vitals.