GoogleBot sớm thu thập dữ liệu qua HTTP/2

Google đã thông báo rằng họ sẽ sớm bắt đầu thu thập thông tin một số trang web qua HTTP/2. HTTP/2 là thế hệ tiếp theo của HTTP, giao thức mà internet chủ yếu sử dụng để truyền dữ liệu. Nó yêu cầu ít kết nối mở hơn và do đó có thể hiệu quả hơn trên máy chủ của bạn khi thu thập dữ liệu các trang web của bạn.

Google cho biết không có lợi ích xếp hạng nào đối với thay đổi này hoặc trang web của bạn hỗ trợ thu thập thông tin qua HTTP/2.

HTTP/2 là gì? HTTP/2 là một bản sửa đổi lớn của giao thức mạng HTTP được World Wide Web sử dụng. Nó được bắt nguồn từ giao thức SPDY thử nghiệm trước đó, ban đầu được phát triển bởi Google. HTTP/2 được phát triển bởi Nhóm công tác HTTP của Lực lượng Đặc nhiệm Kỹ thuật Internet.

Ilya Grigorik từ Google đã viết: “HTTP/2 sẽ làm cho các ứng dụng của chúng tôi nhanh hơn, đơn giản hơn và mạnh mẽ hơn – một sự kết hợp hiếm có – bằng cách cho phép chúng tôi hoàn tác nhiều cách giải quyết HTTP/1.1 đã được thực hiện trước đây trong các ứng dụng của chúng tôi và giải quyết những lo ngại này trong quá trình vận chuyển lớp chính nó. Thậm chí tốt hơn, nó còn mở ra một số cơ hội hoàn toàn mới để tối ưu hóa các ứng dụng của chúng tôi và cải thiện hiệu suất ”.

Nó hiệu quả hơn. HTTP/2 (hay viết tắt là h2) đơn giản là hiệu quả hơn và đó là lý do tại sao Google thực hiện các bước này. Google cho biết “chúng tôi hy vọng thay đổi này sẽ làm cho việc thu thập thông tin hiệu quả hơn về việc sử dụng tài nguyên máy chủ. Với h2, Googlebot có thể mở một kết nối TCP duy nhất tới máy chủ và truyền song song nhiều tệp qua nó một cách hiệu quả, thay vì yêu cầu nhiều kết nối. Càng mở ít kết nối, máy chủ và Googlebot càng phải sử dụng ít tài nguyên hơn để thu thập thông tin ”.

Bắt đầu từ tháng 11 năm 2020. Google cho biết quá trình này sẽ bắt đầu với “một số lượng nhỏ các trang web” vào tháng 11 năm 2020 và sau đó từ từ tăng cường hỗ trợ cho ngày càng nhiều trang web. Điều này sẽ chỉ được thực hiện ban đầu cho “các trang web có thể được hưởng lợi từ các tính năng được hỗ trợ ban đầu, như ghép kênh yêu cầu,” Google cho biết.

Điều gì sẽ xảy ra nếu trang web của bạn không hỗ trợ HTTP/2? Điều đó là tốt, Google nói. “Nếu máy chủ của bạn vẫn chỉ nói HTTP/1.1, điều đó cũng tốt,” Google viết. Google cho biết “không có nhược điểm rõ ràng nào khi thu thập thông tin qua giao thức này; thu thập thông tin sẽ vẫn như cũ, chất lượng và số lượng khôn ngoan.”

Không có lợi ích xếp hạng. Không không không. Không có lợi ích xếp hạng cho HTTP/2. Google cho biết nếu Google thu thập dữ liệu bằng HTTP/1.1 hoặc HTTP/2, thì không có lợi ích xếp hạng trực tiếp nào cho điều đó.

Những lợi ích bạn nhận được là gì. Hiệu quả của việc thu thập thông tin, như chúng tôi đã đề cập ở trên, là những lợi ích. Google cho biết đây là ba lợi ích chính:

  • Ghép kênh và đồng thời: Mở ít kết nối TCP hơn đồng nghĩa với việc sử dụng ít tài nguyên hơn.
  • Nén tiêu đề: Kích thước tiêu đề HTTP giảm mạnh sẽ tiết kiệm tài nguyên.
  • Đẩy máy chủ: Tính năng này chưa được kích hoạt; nó vẫn đang trong giai đoạn đánh giá. Nó có thể có lợi cho việc kết xuất, nhưng chúng tôi không có bất kỳ điều gì cụ thể để nói về nó vào thời điểm này.

Trang web của tôi có hỗ trợ HTTP/2 không. Có thể, Cloudflare có một bài đăng trên blog chia sẻ cách bạn có thể kiểm tra hỗ trợ trang web của mình. Hoặc bạn có thể yêu cầu máy chủ và / hoặc nhà phát triển kiểm tra cho bạn.

Chọn tham gia hoặc không tham gia. Không có cách nào để chọn tham gia, điều này là tự động và bạn không thể buộc Google thu thập thông tin bạn qua HTTP / 2. Nhưng bạn có thể chọn không tham gia ngay bây giờ, Google cho biết. Để chọn không tham gia, hãy yêu cầu máy chủ của bạn phản hồi bằng mã trạng thái HTTP 421 khi Googlebot cố gắng thu thập dữ liệu trang web của bạn qua h2. Nếu điều đó không khả thi vào lúc này, bạn có thể gửi tin nhắn đến nhóm Googlebot, Google cho biết.

Bạn sẽ biết chứ? Google cho biết họ có thể hiển thị cho bạn một thông báo trong Google Search Console khi chuyển sang thu thập thông tin HTTP/2. Google đã viết “khi một trang web đủ điều kiện để thu thập thông tin trên h2, chủ sở hữu của trang web đó đã đăng ký trong Search Console sẽ nhận được thông báo rằng một số lưu lượng thu thập thông tin có thể trên h2 trong tương lai.” Google cũng cho biết “bạn cũng có thể kiểm tra nhật ký máy chủ của mình” cho điều này.

Tại sao chúng tôi quan tâm. Đối với các trang web lớn hơn, việc thu thập thông tin hiệu quả hơn có thể hữu ích cho việc lưu trữ ngân sách. Điều quan trọng nữa là phải biết GoogleBot đang thích ứng và cải thiện như thế nào theo thời gian.

Vào năm 2015, chúng tôi đã có một bài báo có tên Tại sao mọi người nên chuyển sang HTTP/2 giải thích thêm về những lợi ích.

Nguồn: searchengineland.com

Biên tập bởi VietMoz.net

Tác giả
Nhân viên SEO tại VietMoz Academy

Tin tức liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *