Image

[2.1] SEO 101 - CÁCH THỨC CỖ MÁY TÌM KIẾM HOẠT ĐỘNG: CRAWLING, INDEXING VÀ RANKING



Như đã đề cập ở Phần 1, các công cụ tìm kiếm là các cỗ máy trả lời. Chúng tồn tại để phát hiện, hiểu biết và tổ chức nội dung internet tổ cung cấp các kết quả tương quan với các câu hỏi mà người dùng đang tìm kiếm.

Để thể hiện các kết quả tìm kiếm, nội dung của bạn cần được hiển thị trên cỗ máy tìm kiếm. Nếu trang của bạn không được cỗ máy tìm kiếm tìm thất, sẽ không có cách nào để hiển thị nó trên các cỗ máy tìm kiếm.

CÁC CỖ MÁY TÌM KIẾM HOẠT ĐỘNG NHƯ THẾ NÀO ?

Các cỗ máy tìm kiếm có 3 chức năng chính:

1/ Crawl: quét qua nội dung của Internet, quét qua code/nội dung cho mỗi URL chúng tìm ra.

2/ Index: Lưu trữ và tổ chức nội dung đã tìm thấy trong quy trình quét crawling. Một khi một trang được ghi nhận (index), nó sẽ được hiển thị như là một kết quả của truy vấn liên quan.

3/ Rank: cung cấp các mẫu nội dung tương ứng tốt nhất với câu trả lời mà người dùng truy vấn, đáp ứng với các kết quả và được sắp xếp theo thứ tự tương quan nhất đến ít tương quan nhất.

 

cach-thuc-crawling-du-lieu

 

CỖ MÁY TÌM KIẾM QUÉT THẾ NÀO ?

Việc crawling là quá trình phát hiện nơi mà các cỗ máy tìm kiếm gửi đến các robots (gọi là crawlers hoặc spiders) để tìm nội dung mới và nội dung được cập nhật. Nội dung có thể khác nhau – có thể là 1 webpage, một hình ảnh, một video, một PDF, vâng vâng – ngoại trừ định dạng, nội dung đi theo link.

Bot của Google bắt đầu tìm ra vài trang web, và sau đó đi theo các liên kết của các trang này để tìm ra các URLs mới. Thông qua đường liên kết, crawler có thể tìm ra nội dung mới và thêm nó vào để index chúng được gọi dưới cái tên là Caffeine – một cơ sở dữ liệu cực khủng về các URLs được phát hiện – để sau này lần dấu nó khi người dùng tìm kiếm thông tin mà nội dung trên URL đó là phù hợp nhất.

CỖ MÁY TÌM KIẾM GHI NHẬN INDEX THỨ GÌ ?

Quá trình cỗ máy tìm kiếm và lưu trữ thông tin chúng trong một index, một cơ sở dữ liệu cực khủng về tất cả các nội dung chúng tìm được và tương đối đầy đủ nhất để phục vụ người tìm kiếm sau này.

XẾP HẠNG CỖ MÁY TÌM KIẾM

Khi một ai đó thực hiện tìm kiếm trên cỗ máy tìm kiếm, các index có nội dung tương ứng được lấy ra và sau đó sắp sếp nội dung lại để giải quyết theo yêu cầu của người tìm kiếm. Thứ tự của các kết quả tìm kiếm tương quan thì được gọi là ranking (xếp hạn). Nhìn chung, bạn có thể nhận ra rằng website thứ hạng càng cao (được xếp hạng cao), cỗ máy tìm kiếm càng tin tưởng rằng site đó tương ứng và phù hợp với truy vấn tìm kiếm của người dùng.

Có thể chặn các crawlers của cỗ máy tìm kiếm các phần riêng của website của bạn, hoặc chỉ dẫn các cỗ máy tìm kiếm tránh việc ghi nhận lại một vài trang trong index của chúng. Chúng ta sẽ nói đến việc này ở các bài tiếp theo.

 


BÀI VIẾT KHÁC

6 SỰ THUẬT BẠN CẦN PHẢI BIẾT ĐỂ CHẾ NGỰ THƯƠNG MẠI ĐIỆN TỬ TRONG NĂM 2020

CORE WEB VITALS – CHỈ SỐ THIẾT YẾU CỦA WEB: CÁC YẾU TỐ XẾP HẠNG CHÍNH THỨC CỦA GOOGLE

CÁC CÁCH THỨC XÂY DỰNG CONTENT MARKETING HIỆU QUẢ - PHẦN 2

CÁC KẾ HOẠCH XÂY DỰNG CONTENT MARKETING - PHẦN 2

CÁC CHIẾN THUẬT XÂY DỰNG NỘI DUNG MARKETING

TẠO 1 RESTFUL API TRONG CODEIGNITER

CÁCH ĐỂ PHÁT HIỆN VÀ XÓA BỎ CÁC SPAM HACK CHO WEBSITE WORDPRESS

36 TIỆN ÍCH CHROME (CHROME EXTENSIONS) HỮU ÍCH CHO SEOs - PHẦN 1

SEO NĂM 2020: NHỮNG ĐIỀU CƠ BẢN BẠN CẦN BIẾT ĐỂ CÓ THỂ THÀNH CÔNG

BÀI 1- TỪNG BƯỚC ĐỂ TẠO 1 REST API ĐƠN GIẢN BẰNG PHP

5 CÁCH THỨC ĐỂ KIẾM TIỀN TRÊN 1 BLOG NĂM 2020 – LỜI KHUYÊN TỪ 1 BLOG THỰC SỰ ĐÃ KIẾM ĐƯỢC TIỀN

CÁCH THỨC TỐI ƯU HÓA TỐC ĐỘ LOAD TRANG CỦA WEBSITE

CÁCH THỨC TỐI ƯU HÓA LANDING PAGES THU HÚT NGƯỜI DÙNG

16 PLUGIN BẢO MẬT WORDPRESS PHỔ BIẾN 2019

HACKER HACK WEBSITE WORDPRESS NHƯ THẾ NÀO ?

CHỨNG THỰC SSL CHO WEBSITE

CÁC KỸ THUẬT HACKING KHIẾN WEBSITE WORDPRESS BỊ “TRỌNG THƯƠNG” - PHẦN 2

CÁC KỸ THUẬT HACKING KHIẾN WEBSITE WORDPRESS BỊ “TRỌNG THƯƠNG” - PHẦN 1

TOP 40+ CÔNG CỤ KINH DOANH ONLINE NĂM 2020 NHÀ KINH DOANH CẦN CÓ - PHẦN 5

TOP 40+ CÔNG CỤ KINH DOANH ONLINE NĂM 2020 NHÀ KINH DOANH CẦN CÓ - PHẦN 4

Thiết kế bởi @Webdeponline.vn | Tags: Website chuẩn SEO, giá rẻ, giao diện đẹp, website giá 1 triệu đồng