Image

MÁY HỌC GOOGLE RANKBRAIN - PHẦN 1



Google RankBrain là gì ?

Ngày Google chính thức tung ra RankBrain: 26/10/ 2015

RankBrain là một thành phần quan trọng trong thuật toán lõi của Google mà sử dụng máy học (khả năng của máy để tự đào tạo cho chính nó từ các nguồn input dữ liệu đầu vào) để quyết định xem các kết quả tương quan nhất với truy vấn cỗ máy tìm kiếm. Pre-RankBrain, Google sử dụng thuật toán cơ bản để quyết định liệu kết quả nào sẽ được chọn để trả về kết quả truy vấn tương ứng. Post-RankBrain, người ta tin rằng truy vấn đi cùng với các mẫu phiên dịch để đánh ứng các nhân tố khả thi chẳng hạng như địa chỉ của người dùng, bị phạt, và các từ của truy vấn quyết định kết quả chuẩn xác nhất cho người tìm kiếm.

Dựa vào thuật toán RankBrain, Google có thể nhận được các kết quả trả lời chuẩn xác hơn.

Về khía cạnh máy học của RankBrain chính là khả năng nó tự thiết lập và cập nhật. Để “dạy” thuật toán RankBrain cho chính nó, và để tạo ra các kết quả tìm kiếm tương ứng, Google đã đổ vào đó lượng data khủng từ rất nhiều nguồn. Thuật toán sau đó được lấy từ đó ra, tính toán và tự dạy cho nó qua thời gian để đáp ứng sự đa dạng của các kết quả và để xếp thứ hạng trên cỗ máy tìm kiếm dựa trên các kết quả tính toán này.

HIỂU VỀ RANKBRAIN

Để làm rõ khái niệm RankBrain, nó có thể giúp bạn hiểu thêm về Google, hiểu rõ các ý định trong truy vấn tìm kiếm.

Ta lấy ví dụ “Địa điểm Olympics”.

Vậy người dùng sẽ tìm thứ gì đây ? Có phải người dùng muốn hiểu về Thế vận hội mùa Hè hay mùa Đông ? Liệu họ đề cập đến Olympics có phải là nói tới các nơi tổ chức Thế Vận Hội 4 năm một lần không ? Có phải người tìm kiếm quan tâm đến Olympics hiện giờ không, họ ngồi trong một khách sạn và tìm kiếm các hướng dẫn đến địa điểm tổ chức lễ khai mạc? Thậm chí họ có thể tìm kiếm thông tin các di tích lịch sử liên quan khi lần đầu tiên của Thế Vận hội Olympic tổ chức ở Hy Lạp cổ đại ?

Nào, bây giờ hãy tưởng tượng rằng chúng ta phải cố gắng để trả lời các điều trên, chúng ta đưa vào các biến số của thuật toán chẳng hạn như đầu vào là chất lượng nội dung bài viết liên quan hay số liên kết có dính đến nội dung này để xếp hạng kết quả cho người tìm kiếm. Tưởng tượng rằng Thế Vận Hội mùa Đông tại Sochi, Nga tổ chức tháng rồi và website Sochi Olympics chính thức chứa hàng triệu liên kết về nội dung về các sự kiện đã qua. Nếu thuật toán của bạn đơn giản, bạn có thể chỉ thấy các kết quả liên quan đến Sochi Games, bởi vì tìm thấy nhiều link nhất… thậm chí người tìm kiếm thực sự muốn biết về địa điểm tổ chức Thế Vận Hội mùa đông ở Nam Hàn, Pyeongchang.

Với tính phức tạp của nó và một số tình huống liên quan đến năng lực của RankBrain đều được nói đến. Chỉ thông qua cách tính toán các kết quả toán học dựa trên các mẫu (pattern) trong thuật toán máy học để tìm ra các hành vi của người tiềm kiếm mà Google có thể suy luận, đa phần mọi người đi tìm “địa điểm Olympics” muốn biết nơi của Thế Vận Hội kế tiếp (Mùa Hè hay Mùa Đông) sẽ được tổ chức ở đâu. Vì thế, trong tình huống này, hộp trả lời của Google sẽ cho thêm đề xuất nơi tổ chức Thế Vận Hội kế tiếp để nhiều người tìm kiếm khác cần tìm.

Trong khi hộp tìm kiếm đề xuất địa điểm tổ chức Olympics, một số trường hợp lại đi tìm địa chỉ chuẩn xác hơn. Ví dụ, nếu người dùng muốn tìm thành phố Olympic (như Pyeongchang) trong thời gian tổ chức thế vận hội, Google sẽ phải cung cấp thêm các chỉ dẫn hướng lái xe đến các khu tổ chức lễ khai mạc. Nói tóm lại, dựa trên các dấu hiệu như địa chỉ người dùng và nội dung tương quan để đưa vào máy dịch (interpret intent) và gửi đi các kết quả làm thỏa mãn người tìm kiếm.

“RankBrain là 1 cỗ máy làm việc liên tục, với mục tiêu là hoàn thiện công việc biên dịch của Google về các ý định tìm kiếm của người dùng qua thời gian. Điều thú vị là trong truy vấn tìm “Địa điểm Olympics” được tìm thấy tại Hoa Kỳ và 04/2017, hộp trả lời của Google cho ra kết quả:

 

Các địa điểm tổ chức Olympics

 

Thế thì việc chỉ định này cho thấy máy học tin rằng hầu hết người dùng đang tìm kiếm các từ liên quan đến nơi này và nó có dính dáng đến Thế Vận Hội mùa Hè 2016 tại Rio de Janeiro được tổ chức ở đây, dựa trên các dữ liệu được vào được sàng lọc và tính toán, không hẳn các kết quả trả về là đúng nhưng chúng ta rõ ràng cần một câu trả lời về quá khứ, hiện tại, và tương lai của Thế Vận Hội. Thế thì tại sao truy vấn trả về lại đưa chúng ta một kết quả khác trong 01/2018 ? Ở thời điểm này, hộp trả lời tìm kiếm lại trả về Pyeongchang, có lẽ nói dựa vào các dấu hiệu xung quanh sự kiện này để đề xuất ở thời điểm này không ?

Bởi vì sự sâu rộng dưới ảnh hưởng của RankBrain mà thuật toán tìm kiếm lõi của google vẫn chưa hoàn thiện, một trong những cách tốt nhất của việc tự học là các RankBrain này vẫn phải tự học dựa trên các kết quả trả lời của Google đối với hàng ngàn câu truy vấn đáp ứng các câu hỏi của người đi tìm.

[Còn tiếp]


Bài viết được dịch bởi Web1trieudong.com - Web 1triệu đồng. Nguồn dịch: Moz


Thiết kế bởi @Webdeponline.vn | Tags: Website chuẩn SEO, giá rẻ, giao diện đẹp, website giá 1 triệu đồng

Web 1 triệu đồng