Chào mừng BERT: Cập nhật mới nhất cho thuật toán tìm kiếm của Google để có thể hiểu ngôn ngữ tự nhiên tốt hơn
Cứ 1 trong 10 truy vấn tìm kiếm sẽ bị ảnh hưởng bởi BERT. Đây là thay đổi lớn nhất của Google kể từ khi RankBrain được áp dụng.
Google đang chuẩn bị cho sự thay đổi lớn nhất cho hệ thống tìm kiếm của họ kể từ khi RankBrain được công bố gần 5 năm trước. Google nói rằng việc cập nhật này sẽ có ảnh hưởng đến 1 trong 10 truy vấn tìm kiếm về mặt xếp hạng của các kết quả cho các truy vấn tìm kiếm đó.
Bắt đầu ứng dụng: BERT sẽ bắt đầu được ứng dụng kể từ tuần này (thời điểm bài viết là ngày 25/10/2019) và sẽ được live trong thời gian ngắn sau đó. BERT đang được bắt đầu ứng dụng cho các truy vấn tìm kiếm ở ngôn ngữ tiếng Anh và sẽ dần mở rộng ra các ngôn ngữ khác trong tương lai.
Featured Snippets: việc update lần này cũng sẽ ảnh hưởng đến Featured Snippets. Google nói rằng BERT đang được ứng dụng cho Featured Snippets trên toàn thế giới, với tất cả các ngôn ngữ.
BERT là gì? BERT là viết tắt của từ Bidirectional Encoder Representations from Transformers – là kỹ thuật dựa vào hệ thống mạng nơ ron nhân tạo (Neural Network) để pre-train cho việc xử lý ngôn ngữ tự nhiên (Natural Language Processing)
Nó đã được công bố làm mã nguồn mở từ năm ngoái và bạn có thể tìm hiểu thêm chi tiết trên Google AI blog. Nói một cách ngắn gọn nhất, BERT có thể giúp máy tính hiểu được ngôn ngữ theo một cách “người” hơn trước.
BERT được sử dụng khi nào? Google nói rằng BERT giúp cho việc hiểu được các sắc thái cũng như ngữ cảnh của từ trong các tìm kiếm để hiển thị các kết quả có liên quan hơn đến các truy vấn tìm kiếm. BERT cũng sẽ được sử dụng cho Featured Snippets như đã được đề cập ở trên.
Theo như ví dụ của Google đưa ra, nếu trước đây truy vấn “2019 brazil traveler to usa need a visa” (2019 khách du lịch brazil đến mỹ cần có visa), từ “to” và mối liên hệ của nó với các từ còn lại trong truy vấn tìm kiếm sẽ là yếu tố quan trọng để hiểu được ý nghĩa của cả truy vấn. Trước đây, Google sẽ không hiểu được tầm quan trọng của sự liên kết này và sẽ hiển thị các kết quả về việc “U.S citizens traveling to Brazil” (người Mĩ du lịch đến Brazil). “Với sự hỗ trợ của BERT, công cụ tìm kiếm có thể nắm được cách diễn đạt và hiểu được từ “to” – một từ rất phổ biến – có ý nghĩa rất quan trọng ở đây, và chúng tôi có thể hiện tại các kết quả liên quan hơn với truy vấn tìm kiếm này” – Google giải thích.
Theo như 1 ví dụ khác, truy vấn “do esthaticians stand a lot at work” (các chuyên gia thẩm mỹ có phải đứng nhiều khi làm việc không”, Google nói rằng trước đây công cụ tìm kiếm sẽ đối sánh từ “stand” (đứng) trong truy vấn này với từ “stand-alone” (độc lập). Giờ đây, BERT có thể “hiểu được rằng từ “stand” ở đây sẽ có liên quan đến yêu cầu của công việc, từ đó hiển thị các kết quả có ích hơn” – Google giải thích.
Ở 1 ví dụ khác, Google có thể hiểu được truy vấn tìm kiếm một cách “người” hơn và hiển tại các kết quả có liên quan hơn đến truy vấn “Can you get medicine for someone pharmacy” (liệu tôi có thể lấy thuốc hộ người khác nhà thuốc – vì lí do chân thực nên người dịch sẽ giữ lại nguyên nghĩa)
Ví dụ về Featured Snippet: dưới đây là một ví dụ mà Google sẽ hiển thị các kết quả có liên quan hơn trên Featured Snippet cho truy vấn “Parking on a hill with no curb” (đỗ xe trên đồi không có lề đường). Trong quá khứ, truy vấn như vậy sẽ làm hệ thống của Google bị rối. Google giải thích “Chúng tôi quá chú ý đến từ “curb” (lề đường) và bỏ qua từ “no” (không) mà không hiểu được rằng từ đó quan trọng thế nào trong việc phản hồi lại truy vấn tìm kiếm này. Vì thế chúng tôi sẽ hiển thị kết quả cho “parking on a hill with a curb” (đỗ xe trên đồi có lề đường)
RankBrain không bị khai tử: RankBrain là phương pháp ứng dụng AI đầu tiên được Google ứng dụng vào năm 2015 để thấu hiểu truy vấn tìm kiếm. RankBrain sẽ dựa vào cả truy vấn tìm kiếm và nội dung trên trang web trong Google index để hiểu được nghĩa của các từ là gì. BERT không phải là để thay thế cho RankBrain, BERT là một phương pháp bổ sung giúp cho việc thấu hiểu nội dung và truy vấn tìm kiếm. Nó được thêm vào như một phần bổ trợ trong hệ thống xếp hạng của Google. RankBrain có thể và sẽ tiếp tục được sử dụng cho một vài truy vấn tìm kiếm. Tuy nhiên, khi Google nghĩ rằng một truy vấn có thể được hiểu một cách rõ ràng hơn với sự trợ giúp của BERT thì Google sẽ sử dụng nó. Trên thực tế, với 1 truy vấn tìm kiếm, Google có thể sẽ sử dụng nhiều phương pháp, bao gồm BERT, để thấu hiểu nó.
Việc đó sẽ được thực hiện thế nào? Google giải thích rằng sẽ có rất nhiều cách để hệ thống của họ hiểu được truy vấn tìm kiếm của bạn có nghĩa gì và nó có liên quan thế nào đến các nội dung trên Internet. Ví dụ, nếu bạn đánh vấn sai từ gì đó, hệ thống chính tả của Google sẽ giúp bạn tìm từ đúng để hiện thị cho bạn thứ bạn đang tìm kiếm. Và/nếu bạn dùng từ đồng nghĩa với từ chính gốc có xuất hiện trong các văn bản có liên quan, Google cũng có thể đối sánh từ đồng nghĩa và các văn bản đó với nhau. BERT là một tín hiệu khác là Google sử dụng để hiểu được ngôn ngữ. Tuỳ vào việc bạn đang tìm kiếm gì, một hoặc một tổ hợp của các tín hiệu đó sẽ được sử dụng để hiểu được truy vấn tìm kiếm của bạn để hiển thị kết quả liên quan.
Chúng ta có thể tối ưu cho BERT không? Có vẻ là không. Google đã nói rằng SEOs không thể tối ưu cho RankBrain. Nhưng đồng nghĩa với việc đó là Google sẽ dần hiểu được ngôn ngữ tự nhiên một cách tốt hơn. Hãy cứ viết nội dung có ích cho người dùng như cách bạn vẫn đang làm. Đây là sự cố gắng của Google trong việc thấu hiểu một cách tốt hơn truy vấn của người tìm kiếm và đối sánh nó để hiện tại các kết quả có liên quan hơn trước.
Tại sao chúng ta phải quan tâm? Chúng ta quan tâm, không chỉ bởi vì Google nói rằng sự thay đổi lần này “tượng trưng cho một cú nhảy lớn nhất về tương lai trong suốt 5 năm qua, và là một trong những bước nhảy lớn nhất về tương lai trong lịch sử của ngành tìm kiếm”
Ngoài ra, 10% các truy vấn tìm kiếm sẽ bị ảnh hưởng bởi lần cập nhật này. Đó là một sự thay đổi lớn.
Nguồn: Search Engine Land