Thẻ canonical – cách tối ưu và sử dụng thẻ canonical trong SEO

Thông báo từ Yahoo!, Live & Google rằng họ sẽ hỗ trợ một “Canonical Url Tag” mới để giúp các nhà quản trị web và chủ sở hữu trang web loại bỏ nội dung trùng lặp tự tạo ra trong chỉ mục. Theo quan điểm của tôi, đó là sự thay đổi lớn nhất đối với kỹ thuật SEO kể từ khi có sự xuất hiện của Sitemaps.

Nhằm giúp cho các bạn làm SEO hiểu rõ hơn về thẻ này. Tôi sẽ hướng dẫn chi tiết về thẻ Canonical này, bạn hãy áp dụng và chia sẻ cho bạn bè mình nhé.

Thẻ Canonical hoạt động thế nào?

Vị trí của thẻ này được đặt gần với các thẻ title và thẻ meta description. Thật ra thì thẻ này không quá mới mẻ. Ví dụ:

Mẫu code canonical

Khi đã thêm thẻ này vào thì các máy tìm kiếm như Yahoo, Google sẽ xem liên kết vietmoz.com/blog là phiên bản gốc so với các liên kết tương tự.

So sánh liên kết với phiên bản gốc

Thuộc tính tag Canonical URL tương tự như cách để chuyển hướng 301 từ một khía cạnh nào đó. Về bản chất, bạn đang nói với các công cụ tìm kiếm rằng nhiều trang nên được xem xét như là một trang (như 301 làm), mà không thực sự chuyển hướng khách truy cập đến URL mới. Có một số khác biệt, mặc dù:

  • Trong khi đó, một chuyển hướng 301 ghi lại tất cả lưu lượng truy cập (cả bọ tìm kiếm và người dùng), thẻ URL Canonical chỉ dành cho các máy tìm kiếm, có nghĩa là bạn vẫn có thể theo dõi riêng biệt khách truy cập cho từng URL.
  • Phương thức 301 là một cách tốt hơn nhiều trang chỉ sử dụng duy nhất thẻ canonical. Các máy tìm kiếm đều hỗ trợ thẻ mới này và tin tưởng vào cách nhìn nhận của chủ sở hữu trang web, tuy nhiên sẽ có những hạn chế. Phân tích nội dung và các thuật toán khác sẽ được áp dụng để đảm bảo rằng một chủ sở hữu trang web đã không nhầm lẫn hoặc chủ quan khi áp dụng thẻ.
  • Phương thức 301 thực hiện chức năng cross-domain, có nghĩa là bạn có thể chuyển hướng một trang tại domain1.com đến domain2.com và thực hiện qua các công cụ tìm kiếm. Điều này không xảy ra với các thẻ URL Canonical, hoạt động trên một tên miền gốc duy nhất (nó sẽ thực hiện qua các thư mục phụ và các tên miền phụ).

Và tôi hy vọng chúng ta sẽ thấy sự khác biệt nhiều hơn, nhưng có lẽ người làm SEO ở Việt Nam vẫn chưa hiểu rõ và khai thác được hết sức mạnh của thẻ này, nó sẽ cần vài tháng để người làm SEO quen với cách sử dụng. Ra mắt trước đó như thẻ nofollow, sitemaps và các nền tảng công cụ quản trị trang web đã có sự thay đổi trong quá trình thực hiện sau khi được ban hành, và thẻ này cũng không ngoại lệ.

Khi nào, ở đâu và người làm SEO nên sử dụng thẻ này thế nào?

Trước đây, nhiều trang web đã gặp phải vấn đề với sự trùng lặp cùng một nội dung trên các URL khác nhau. Điều này tạo ra ba vấn đề lớn:

  1. Công cụ tìm kiếm không biết phiên bản nào là phiên bản gốc để chọn lựa.
  2. Công cụ tìm kiếm không biết đánh giá các tiêu chí như (độ tin tưởng, quyền tác giả, neo văn bản, các liên kết tự nhiên, v v) đến 1 trang hay chia đều giữa nhiều trang.
  3. Công cụ tìm kiếm không biết nên chọn lựa phiên bản nào để xếp hạng tìm kiếm.

Khi điều này xảy ra, chủ sở hữu trang web sẽ rơi vào trạng thái thứ hạng thay đổi thất thường và lưu lượng cũng thất thường. Vì vậy, để khắc phục những vấn đề này, chúng ta có thể áp dụng thẻ Canonical URL khi phát hiện xảy ra một trong các vấn đề sau:

Trang web của tôi đang bị trùng lặp về nội dung do hệ thống gây ra

Liên kết in ấn này của tôi cũng gây ra sự trùng lặp nội dung

Liên kết session ID này của tôi cũng gây ra trùng lặp về nội dung

Trong khi các ví dụ trên đại diện cho một vài trường hợp điển hình, chắc chắn vẫn tồn tại nhiều trường hợp khác, Nên trao đổi với các chuyên gia SEO của bạn để giúp xác định áp dụng chính xác thẻ này.

Bộ máy tìm kiếm đã cho ta biết những gì về thẻ này?

Xin được trích vài điều từ blog của Google:

Is rel=”canonical” a hint or a directive?
It’s a hint that we honor strongly. We’ll take your preference into account, in conjunction with other signals, when calculating the most relevant page to display in search results.

Tạm dịch

rel=canonical là gợi ý hay là yêu cầu?
Đó là 1 gợi ý tốt và chúng tôi sẽ lưu tâm vấn đề của bạn, cùng với các tín hiệu khác chúng tôi sẽ tính toán để chọn lựa đưa ra kết quả tìm kiếm.

Can I use a relative path to specify the canonical, such as
<link rel='canonical' data-cke-saved-href='product.php?item=swedish-fish' href='product.php?item=swedish-fish' />
Yes, relative paths are recognized as expected with the

tag. Also, if you include alink in your document, relative paths will resolve according to the base URL

Tạm dịch

Tôi có thể sử dụng một đường dẫn liên quan để xác định thẻ canonical, chẳng hạn như
demo <link rel='canonical' data-cke-saved-href='product.php?item=swedish-fish' href='product.php?item=swedish-fish' />
Có, đường dẫn liên quan được nhận biết như thẻ

Ngoài ra, nếu bao gồm một liên kếttrong nội dung của bạn, đường dẫn liên quan sẽ giải quyết dựa vào url base.

1. Khi áp dụng thẻ này thì kết quả có chính xác không?

Chúng tôi cho phép một vài khác biệt nhỏ, ví dụ, trong thứ tự sắp xếp của một bảng sản phẩm. Chúng tôi cũng nhận ra rằng chúng tôi có thể thu thập dữ liệu canonical và các trang trùng lặp tại các điểm khác nhau, do đó, chúng ta đôi khi có thể nhìn thấy các phiên bản khác nhau của nội dung của bạn. Tất cả điều đó không quan trọng với chúng tôi.

2. Điều gì sẽ xảy ra nếu rel = “canonical” trả về phương thức 404?

Chúng tôi sẽ tiếp tục lập chỉ mục nội dung của bạn và sử dụng một phương thức để tìm một canonical, nhưng chúng tôi khuyên bạn chỉ định các URL tồn tại như các canonical.

3. Điều gì sẽ xảy ra nếu các rel = “canonical” vẫn chưa được lập chỉ mục?

Giống như tất cả các nội dung hiển thị trên web, chúng tôi cố gắng để tìm kiếm và thu thập dữ liệu một URL canonical một cách nhanh chóng. Ngay sau khi chúng tôi lập mục, chúng tôi ngay lập tức sẽ xem xét lại các rel = “canonical” gợi ý.

4. rel = “canonical” có thể được chuyển hướng?

Có, bạn có thể chỉ định một URL chuyển hướng như một URL Canonical. Google sẽ xử lý chuyển hướng như bình thường và cố gắng lập chỉ mục nó.

5. Điều gì sẽ xảy ra nếu tôi có mâu thuẫn rel = “canonical” chỉ định?

Thuật toán của chúng tôi là khoan dung: Chúng tôi có thể làm theo các chuỗi kinh điển, nhưng chúng tôi khuyên bạn nên cập nhật liên kết để trỏ đến một trang chuẩn duy nhất để đảm bảo kết quả canonicalization tối ưu.

Từ Yahoo:
“Các đường dẫn URL trong thẻ có thể là tuyệt đối hay tương đối, mặc dù chúng tôi khuyên bạn nên sử dụng đường dẫn tuyệt đối để tránh các lỗi bất ngờ.”

Một thẻ chỉ có thể trỏ đến một thẻ URL canonical trong cùng một tên miền và không liên quan các tên miền khác. Ví dụ, một thẻ trên http://test.example.com có thể trỏ đến một URL trên http://www.example.com nhưng không phải trên http://yahoo.com hay lĩnh vực nào khác.

Thẻ sẽ được xử lý tương tự như một chuyển hướng 301, để chuyển liên kết và các hiệu ứng khác giống như thẻ canonical.

Chúng tôi sẽ sử dụng thông tin thẻ theo quy định, nhưng chúng tôi cũng sẽ sử dụng các cơ chế thuật toán để tránh những tình huống mà chúng tôi nghĩ rằng thẻ không được sử dụng như dự định. Ví dụ, nếu dạng canonical không tồn tại, trả về một lỗi hoặc trang 404, hoặc nếu nội dung trên nguồn và đích khác biệt và độc đáo, liên kết canonical có thể được coi là nhầm chỗ.

Có tính bắc cầu. Nếu URL A xem B như canonical, và B xem C như canonical, chúng tôi sẽ xét C như canonical cho cả A và B và từ Live/MSN:

  • Thẻ này như là một gợi ý của Live Search, không phải là một mệnh lệnh. Chúng tôi sẽ đánh giá điều này trong bối cảnh tất cả các thông tin khác mà chúng tôi biết về trang web và thử và đưa ra quyết định tốt nhất đối với URL canonical. Điều này sẽ giúp chúng tôi xử lý các lỗi xảy ra hoặc lạm dụng thẻ này.
  • Bạn có thể sử dụng các URL tương đối hoặc tuyệt đối trong các thuộc tính “href” của thẻ liên kết.
  • Trang web và URL trong các thuộc tính “href” phải trên cùng một tên miền. Ví dụ, nếu trang web được tìm thấy trên “http://mysite.com/default.aspx”, và “href” thuộc tính trong thẻ liên kết chứa “http://mysite2.com”, thẻ sẽ không hợp lệ và được bỏ qua.
  • Tuy nhiên, các thuộc tính “href” có thể trỏ đến một tên miền phụ khác nhau. Ví dụ, nếu trang được tìm thấy trên “http://mysite.com/default.aspx” và “thuộc tính” href trong thẻ liên kết chứa “http://www.mysite.com”, thẻ sẽ được coi là hợp lệ.
  • Live Search hy vọng sẽ thực hiện hỗ trợ cho tính năng này trong tương lai gần.

Nên nhớ những gì?

Một số điều vẫn còn chưa rõ ràng xung quanh các tính năng và kết quả thẻ URL Canonical. Chúng bao gồm:

  • Mức độ mà thẻ này sẽ được tin cậy bởi các công cụ sẽ khác nhau – nó chỉ hoạt động nếu nội dung 100% trùng lặp và 100% thời gian? Vậy thì khác biệt nhau như thế nào?
  • Điều này sẽ vượt qua 100% các liên kết từ một trang web đã có đến trang nào khác? Nhiều hay ít hơn một trang chuyển hướng 301? Trưởng nhóm chống spam của Google, Matt Cutts, cho biết hôm nay nó đi qua các cây liên kết giống như một 301 chuyển hướng nhưng cũng lưu ý (khi riêng Gillian Muessig của SEOmoz hỏi cụ thể) rằng “nó mất đi không nhiều hơn một 301,” điều này cho thấy rằng có một số tổn thất khi một trong hai số này được áp dụng.
  • Mức độ ứng dụng của thẻ trên các phiên bản ngôn ngữ không phải tiếng Anh. Các cấp độ khác nhau của nội dung / bản sao phân tích và quốc gia / các vấn đề ngôn ngữ cụ thể có được áp dụng?
  • Tất cả các bộ máy tìm kiếm đều áp dụng như nhau? Điều này có vẻ như không hẳn thế, vì chúng cần phải chia sẻ các thuật toán phân tích nội dung / link để làm điều đó. Mong đợi sự đột phá (và có thể thống kê) dữ liệu trong tương lai cho thấy rằng có sự khác biệt trong cách làm giữa các bộ máy tìm kiếm.
  • Yahoo! khuyến cáo sử dụng đường dẫn tuyệt đối cho việc này (mặc dù chúng ta chưa thực hiện nó, SEOmoz đã làm khá tốt, dựa vào các cạm bẫy tiềm năng với các URL tương đối), nhưng các bộ máy khác có nhiều thuyết bất khả tri – chúng ta cần sự chuẩn xác.
  • Yahoo! cũng đề cập đến các tính chất bắc cầu (đó là tin tuyệt vời cho bất cứ ai đã phải làm URL nhiều để thiết lập lại theo thời gian), nhưng nó không rõ ràng nếu các công cụ khác hỗ trợ điều này?
  • Live / MSN xuất hiện chưa thực sự hỗ trợ cho thẻ này, do đó, chúng ta sẽ nhìn thấy khi họ chính thức bắt đầu.

Bài tìm hiểu về Canonical với hướng dẫn của VietMoz (bài viết được VietMoz tổng hợp và lược dịch từ các tài nguyên trên internet trong đó có Google, Bing, Yahoo, SEOmoz)

Bài viết : ” Thẻ canonical – cách tối ưu và sử dụng thẻ canonical trong SEO 
Tác giả : Lee Nam
Ghi rõ nguồn vietmoz.net trung tâm Đào Tạo SEO tại Hà Nội khi đăng tải lại bài viết này

Các bài viết khác về Kiến thức cơ bản

9 Comments

  1. Tam

    Dùng thẻ này nó tránh bị lỗi Duplicate tiêu đề nhưng khi sử dụng nó thì báo là " page í not indexable because thí pages há a canonical url set go[url bài viết]
    Nó kèm theo

    Vậy thì có ảnh hưởng gì tới index của site không?

    1. imthankyou

      Bạn nghĩ sao nếu trang web của bạn có tới 2 trang cùng 1 nội dung được index? Khi đó Google biết phải làm sao để xác minh bài viết gốc cho bạn? Hiện tượng này được gọi là trùng lặp nội dung, vì thế chúng ta chỉ cần 1 link index thôi.

  2. vi duy

    anh lee Nam cho e hỏi với ạ. website của e bị đặt thẻ cannonical vào mục. bây giờ bài viết trong mục đấy của e lại không được google index. anh trả lời giúp e là phải làm thể nào được không ạ

    1. imthankyou

      Tại bài viết 1 nếu em canonical sang 1 URL khác thì URL bài viết đó sẽ không được index nữa :)

  3. luan

    Site của mình cũng đang bị duplicate content và mình có sử dụng rel = nocanical, nhưng mình chỉ làm được với trang chủ, còn các trang con thì mình chưa thực hiện được, mình có hỏi tham khảo một số người họ nói mình thiếu một hàm request url gì đó, minh không phải là coder nên không biết làm thế nào, site hiện tại la code tay php, xin hỏi có cách nào khác để có thể sử dụng canonical cho tất cả các trang không vay, xin cảm ơn

    1. imthankyou

      Để fix cho toàn trang bạn cần liên hệ coder để được hỗ trợ bạn ạ, mỗi site một cấu trúc khác nhau nên không thể có mã code chung được.

      Về trường hợp của bạn, bạn hạn chế post 1 bài ở 2 chuyên mục là ok :)

  4. Cái này có quan trọng không cả nhà. Để vậy có sao k?

  5. Tôi đang gặp vấn đề với site mới chưa được index. Vào phần tác vụ thủ công thì thấy rằng dính lỗi spam thuần túy, mặc dù nội dung 99% là tôi tự viết. Xin hỏi ad là có cách nào để google bỏ hình phạt này không? Xin cảm ơn.

  6. Anh cho e hỏi: Site của e sau khi sửa giao diện không còn được Googe index, em tìm kiếm các từ khóa theo link thì hầu hết các link đều đổ về trang chủ. Em kiểm tra mã nguồn thấy rằng trong tất cả các mục từ trang chủ và bài viết trên site đều có thẻ: link rel=”canonical” về URL của home.
    Vậy thì việc google ko index có phải một phần là do việc đặt thẻ ở tất cả các link bài viết ko? Em cảm ơn

Gửi phản hồi