Thẻ Canonical là gì? Cách sử dụng tối ưu nhất thẻ Canonical

Google thường xuyên hạ thấp các trang web bị trùng lặp nội dung. Canonical là gì? Canonical giúp chống trùng lặp như nào?

Thẻ Canonical theo các chuyên gia SEO là quá trình chọn lọc giữa những liên kết. Đôi khi bạn sẽ phải giật mình vì không hiểu tại sao lại có nội dung trùng lặp trên website của mình, trong khi mỗi bài viết trên site bạn dành rất nhiều tâm huyết để đảm bảo nội dung độc đáo. Một khi sử dụng thẻ Canonical bạn sẽ chẳng bao giờ phải lo lắng về trùng lặp nội dung nữa.

Thẻ Canonical là gì?

Thẻ Canonical hay còn được gọi là Canonicalization có thể là 1 khái niệm trừu tượng và khó khi phát âm “ca-non-ick-cull-eye-zay-shun”, nhưng nó là yếu tố cần thiết khi tối ưu hóa trang web.

Vấn đề cốt yếu liên quan đến thuật ngữ này đó chính là sự trùng lặp nội dung, có thể là 1 đoạn, hoặc 1 phần của trang web lặp đi lặp lại ở web của bạn, hoặc thậm chí trên những trang web khác. Đối với bộ máy tìm kiếm thì điều này thật sự nên tránh vì máy tìm kiếm không biết lựa chọn nội dung nào là phiên bản gốc để hiển thị cho người dùng. Theo các chuyên gia thì đây chính là vấn đề của sự trùng lặp nội dung.

Tựu chung lại có thể hiểu, thẻ canonical là cách các chủ website khai báo với công cụ tìm kiếm mà ở đây là các Bot của Google về việc định danh cho một nội dung gốc. Được sử dụng trong trường hợp trang web phát sinh nhiều URL thì dựa vào thẻ canonical, Google sẽ nhận biết và đánh giá được đây có phải là trùng lặp nội dung không.

the canonical la gi
Canonical là cách hữu hiệu tránh trùng lặp nội dung 
Ví dụ 1:
Xét trong trường hợp Website của bạn có phiên bản khác nhau:
  • http://www.example.com
  • https://www.example.com

Trong điều kiện cả 2 URL trên chưa được redirect về 1 URL chung và cả 2 đều có thể truy cập nhưng chỉ hiển thị chung một nội dung. Điều này rất có thẻ dẫn đến vấn đề trùng lặp nội dung và Google hoàn toàn có thể phạt bạn nếu thẻ rel =”canonical” không được sử dụng.

Ví dụ 2:

Trong trường hợp website của bạn là trang tổng hợp tin, và trong đó các tin được phân thành các trang 1, 2, 3… Lục này URL của các trang có thẻ sẽ là:

  • Expample.com/page/2
  • Expample.com/page/3

Khi đó bạn cũng sẽ cần phải dùng đến thẻ canonical để tránh Google nhận xét là các URL trùng lặp.

Tác động của thẻ Canonical đến SEO

Thẻ Canonical được sử đúng cách và hợp lý sẽ giúp các website giải quyết các vấn đề như duplicate content bằng cách xác nhận với Google rằng chỉ có 1 URL chính thức duy nhất, mọi URL còn lại là các bản sao.

Bản thân các công cụ tìm kiếm đều rất ghét các nội dung trùng lặp giữa các website và các trang trên cùng 1 website. Nhưng trên một website thường sẽ phát sinh rất nhiều vấn đề liên quan đển url và có rất nhiều đường dẫn gần như bắt buộc phải dùng đến thẻ canonical như:

  • Http và Https
  • www và non www
  • Index.php và Homepage
  • Sử dụng bộ lọc và sắp xếp (Filter & Sorting)

Để có thể điều kiểm tránh được các lỗi này gần như là không thể!

Việc xử lý các nội dung trùng lặp trên website nên là sự kết hợp giữa canonical url với các công cụ khác như chuyển hướng 301, robot.txt, google url removal, gắn thẻ noindex hoặc nofollow.

Cấu trúc chuẩn của một thẻ Canonical

Canonical URL là một đoạn HTML có cú pháp đơn giản so với các thẻ khác, vị trí của thẻ này thường được đặt ở <head>, đối với các trang web sử dụng các mã nguồn mở thì thẻ ày thường được tạo một cách tự động.

Cấu trúc Canonical tag:

Cách yếu tố trang web cần sử dụng canonical:

  • Sử dụng các công cụ hỗ trợ như Moz, SEOquake,…
  • Thẻ canonical đã trỏ đúng đến đúng trang chưa?
  • Trang đã được lập chỉ mục hay chưa bằng cú pháp site:url

Tại sao không sử dụng Redirect 301 mà lại dùng Canonical

Nhìn chung thì bản chất Redirect 301 và Canonical khá giống nhau đó khi xét dưới góc nhìn của những người dùng bình thường, còn đối với các công cụ tìm kiếm thì sẽ xem rằng đó là 2 trang hoàn toàn khác nhau và cả 2 URL vẫn được lập chỉ mục bình thường.

Ví dụ:

http://example.com/index.php  redirect 301 sang http://example.com

Thực sự thì điều này vẫn ít nhiều gây ảnh hưởng đến SEO vì như vậy chẳng khác nào là bạn đang ngầm khẳng định với Google rằng đây là 2 nội dung hoàn toàn khác nhau vậy.

Vì một lý do nào đó trang của bạn xuất hiện trùng lặp nội dung

Do đó trong những trường hợp như này chúng ta nên sử dụng đến thẻ Canonical.thì sẽ hợp lý hơn nhiêu. Khi các con bot truy cập vào http://example.com/index.php, chúng sẽ tự biết rằng địa chỉ này là https://example.com/ chứ không phải địa chỉ kia.

Sự ra đời của thẻ Canonical đã giải quyết không ít các nỗi phiền bấy lâu của dân làm SEO. Khi mà các nội dung được xuất bản quá nhiều và họ không thẻ control được tình hình Onpage SEO trên toàn site, nhất là các trang web phát sinh đường dẫn phía sau, thực rất khó để có thể xác định được chung.

Do vậy bạn phải hiểu rõ về thẻ canonical sao cho hợp lý là cực kỳ quan trong trong việc SEO website.

Hướng dẫn sử dụng thẻ Canonical đúng cách

Sử dụng URL chính xác

Theo John Mueller chuyên gia đến từ Google cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=”canonical”. Điều này có nghĩa là bạn nên sử dụng các đường dẫn chính sác như sau:

Không nên dùng:

Sử dụng các chữ cái thường trong việc đặt tên URL

Nếu có một bài viết nhưng lại tồn tại 2 URL, một url viết thường và một url viết hoa thì nên sử dụng canonical tag cho url viết thường. Bởi đối với Google thì các url viết hoa và viết thường hoàn toàn khác nhau, vì vây chúng vẫn sẽ được lập chỉ mục hoàn toàn bình thường.

Sử dụng một phiên bản tên miền duy nhất HTTP hoặc HTTPS

Hãy đảm bảo rằng bạn không khai báo thiếu bất kỳ URL không phải SSL (HTTP) nào trong việc sử dụng thẻ Canonical tag.

Nếu bạn đang dùng phiên bản HTTPS:

Còn đối với phiên bải HTTP sẽ là:

Sử dụng thẻ Canonical tự tham chiếu

Canonical tự tham chiếu ở đây có thể hiểu là thẻ canonical trên một trang mà trỏ link về chính nó.

Ví dụ: với url là https://example.com/sample-page, Canonical trên trang đó sẽ là:

Theo John Mueller, dù thẻ canonical canonical tự tham chiếu không hoàn toàn bắt buộc nhưng vẫn là sự lựa chọn đáng phải cân nhắc. Vì nó giúp cho Google hiểu rõ được bạn đang muốn index trang nào sẽ có cấu trucs như thế nào khi được index.

Hiện tại thì hầu hết các CMS phổ biến đều tự động them các URL tự tham chiếu. Chỉ những CMS tùy chỉnh, bạn sẽ cần nhờ đến sự trợ giúp của các nhà phát triển web hardcode nó.

Chỉ sử dụng 1 canonical duy nhất trên 1 trang

Nếu trên 1 trang xuất hiện nhiều hơn 1 thẻ canonical thì mặc định Google sẽ bỏ qua cả thảy. Do đó, mỗi trang chỉ nên sử dụng duy nhất 1 thẻ canonical.

5 cách triển khai thẻ Canonical:

  1. HTML tag
  2. HTTP header
  3. Sitemap
  4. 301 redirect
  5. Liên kết nội bộ (Internal link)

Thiết lập thẻ Canonical bằng Yoast SEO trong WordPress

Với các website được xây dựng trên nền tảng CMS WordPress thì việc gắn thẻ canonical cho trang được thực hiện khá đơn giản và nhanh tróng với các plugins  hỗ trợ như Rank Math và Yoast SEO, ở đây tôi sẽ ví dụ bằng Plugin Yoast SEO.

Đấu tiên bạn cần cài đặt plugin Yoast SEO, sau khi đã cài đặt và ích hoạt thanh công plugin thì truy cập vào phần setting và chọn “Advanced”.

thiet lap canonical trong yoast seo

Ngay khi cài đặt Yoast SEO thì thẻ canonical đã được thêm tự động rồi, còn nếu bạn muốn thêm các tùy chọn nâng cao hơn có thể thiếu lập ở đây nhé!

Cài đặt Canonical Tag trên Shopify

Shopify thêm URL gốc tự tham chiếu cho các sản phẩm và bài đăng trên blog theo mặc định. Để thêm mục tùy chỉnh cho URL gốc, bạn cần phải chỉnh sửa trực tiếp các tệp mẫu (.liquid).

Cài đặt Canonical Tag trên Squarespace

Squarespace cũng thêm các URL tự tham chiếu theo mặc định và tương tự như trường hợp của Shopify. Bạn cần phải chỉnh sửa mã trực tiếp nếu muốn thêm tùy chỉnh vào URL gốc.

Những lỗi thường gặp khi sử dụng Canonical

Đặt sai vị trí thẻ rel=”canonical”

Vị trí đặt thẻ canonical là bên trọng cặp thẻ <head></head>. Nhưng vẫn có không ít các trường hợp đặt sai vị trí mà phổ biến nhất ở đây là đặt trong thẻ <body>

Thông báo gây lẫn lộn

Cụ thể ở đây là việc gắn thẻ Canonical thành 1 vòng lặp ví dụ: Gắn Canonical từ trang A sang B và ngược lại hoặc thông báo chồng chéo A→B, B→C, C→D. Điều náy sẽ gây bối rối cho google bot và bò qua thẻ này. Tốt nhất gửi tín hiệu một cách rõ ràng, hoặc buộc công cụ tìm kiếm tự đưa ra lựa chọn.

Trang thiết lập không đủ điều kiện

Một lỗi phổ biến khác là trang được liên kết đến đã bị chặn bởi tệp robots.txt hoặc được thiết lập thuộc tính “noindex“.

Thiết lập nhiều hơn một thẻ Canonical:

Trường hợp này thường do website dùng nhiều plugin SEO khác nhau dẫn đến việc khai báo nhiều thẻ Canonical khác nhau cho trang. Khi đó công cụ tìm kiếm sẽ tự động bỏ qua trang này.

Thiết lập lập URL tương đối thay vì tuyệt đối

Như đã nói trong phần hướng dẫn sử dụng, các thẻ canonical nên được thiết lập bằng url tuyệt đối để tránh xảy ra sai sót.

Đặt mã HTTP 4xx cho URL gốc

Việc đặt mã HTTP 4XX cho URL gốc cũng như việc dùng thẻ “noindex”/ Điều này khiến Google sẽ không thể nhìn thấy Canonical tag để chuyển “link quity” snag bản gôc.

Một số lưu ý khi sử dụng thẻ Canonical

Chủ động chuẩn hóa homepage

Do các bản sao trang chủ là rất phổ biến, có thể liên kết đến trang chủ của bạn theo nhiều cách mà bạn rất khó kiểm soát chúng (ví dụ: trường hợp đặt UTM tracking hoặc A/B testing). Vì vậy đặt một thẻ chuẩn trên trang chủ để ngăn ngừa các sự cố là rất cần thiết.

Khai báo trang chuẩn cho các thiết bị mobile

Nếu trang chuẩn có biến thể dành cho thiết bị di động thì hãy thêm đường dẫn liên kết rel=”alternate” vào trang đó và trỏ đến phiên bản dành cho thiết bị di động của trang:

Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.
Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.

Tài liệu tham khảo thêm

HTTP Status Codes
Tài liệu chính thức cho các mã trạng thái HTTP trên W3C.
SEO Advice: URL Canonicalization
Matt Cutts, người đứng đầu của nhóm Webspam tại Google, tư vấn về canonicalization.

Hướng dẫn liên quan

Dao tao Seo, Khoa hoc Seo tai Ha Noi – Đào tạo SEO VietMoz
Đăng ký một khoá học SEO tại VietMoz để được hướng dẫn đầy đủ và chi tiết về cách làm SEO

Tác giả
Lê Nam là CEO & Founder của VietMoz, anh thành lập VietMoz Academy năm 2012. Với hơn 11 năm làm trong lĩnh vực quảng cáo trực tuyến, anh Nam từng là huấn luyện viên SEO của rất nhiều trang web nổi tiếng như Vietnamnet, Autodaily, CellphoneS, Kidsplaza

Tin tức liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *