Image

[2.2] SEO 101 - CRAWLING: CÁC CỖ MÁY TÌM KIẾM CÓ THỂ TÌM RA TRANG CỦA BẠN KHÔNG ?



Như đã nói, việc đảm bảo rằng trang của bạn có thể được quét và ghi nhận để hiển thị trên các cỗ máy tìm kiếm. Nếu bạn đã có 1 website, thật tốt để tìm hiểu cách thức làm thể nào để các trang của bạn được index. Điều này sẽ có lợi cho Google khi index và tìm ra các trang của bạn khi bạn muốn, và nên tìm hiểu nó càng nhiều càng tốt.

CRAWLING: CÁC CỖ MÁY TÌM KIẾM CÓ THỂ TÌM RA TRANG CỦA BẠN KHÔNG ?

Một cách để bạn biết các trang đã được index là gõ “site:domain.com” (site:tên miền website – Web1trieudong.com dịch và chú giải), là một cú pháp tìm kiếm nâng cao. Bạn vào Google, gõ “site:domain.com” trong hộp tìm kiếm. Bạn sẽ thấy Google ghi nhận những gì trong website của bạn.

 

SEO - công cụ index bằng Crawler

Kết quả sau khi bạn gõ site:moz.com là các index được ghi nhận trên trang của bạn trên Google

 

Con số kết quả mà Google hiển thị (ví dụ: 5,000,000 results) thì không có chính xác, nhưng nó cung cấp cho bạn một hiểu biết tổng quan về các trang nào được ghi nhận index (đánh chỉ mục – Web1trieudong.com chú giải) và hiển thị trên kết quả tìm kiếm như thế nào.

Để đạt được nhiều kết quả chính xác & chuẩn xác hơn, hãy theo dõi và sửa dụng Index Coverage report (báo cáo Độ phủ Index) trong Google Search Console. Bạn đăng nhập vào Google Search Console, nếu không có tài khoản thì đăng ký 1 mail google, bạn sẽ vào được. Bằng công cụ này, bạn có thể gửi đi Sitemaps (Cấu trúc website – Web1trieudong.com dịch) cho website của bạn và xem thử các trang đã submit (gửi đi) có thực sự nằm trên Google index chưa.

Nếu bạn không thấy thứ gì hiển thị trên kết quả tìm kiếm của cỗ máy tìm kiếm, có vài lý do giải thích điều này như sau:

+ Trang web của bạn còn mới và chưa được crawler mò đến

+ Trang web của bạn không được liên kết đến bất kỳ các trang liên kết ngoài nào khác (website khác)

+ Cấu trúc website rắc rối hoặc gây khó cho robot để crawl hiệu quả

+ Trang của bạn chứa một số code mà dẫn dắt crawler mà cản trở tìm kiếm

+ Trang của bạn bị phạt bởi các điều luật spam của Google.

Hầu hết mọi người nghĩ rằng Google chắc chắn sẽ tìm ra các trang quan trọng của họ, nhưng hãy quên điều đó đi mặc dù các trang đó bạn nghĩ Google sẽ tìm ra. Điều này có thể bao gồm các link URLs đã cũ rồi, có chứa nội dung quá ít, nhân đôi hoặc trùng URLs (chẳng hạn như các bộ lọc và sắp xếp ở các trang bán hàng, các trang có mã khuyến mãi giảm giá, các trang bắt đầu hay test web, vân vân…

Để giúp Google tránh xa các trang hay các mục này trên website, hãy sử dụng robots.txt để gỡ chúng đi nếu chúng đã cũ hoặc bạn không cần Google ghi nhận làm gì.


Thiết kế bởi @Webdeponline.vn | Tags: Website chuẩn SEO, giá rẻ, giao diện đẹp, website giá 1 triệu đồng

Web 1 triệu đồng