Canonicalization

Canonicalization theo các chuyên gia seo là quá trình chọn lọc giữa những liên kết. Đôi khi bạn sẽ phải giật mình vì không hiểu tại sao lại có nội dung trùng lặp trên website của mình, trong khi mỗi bài viết trên site bạn dành rất nhiều tâm huyết để đảm bảo nội dung độc đáo. Một khi sử dụng thẻ Canonical bạn sẽ chẳng bao giờ phải lo lắng về trùng lặp nội dung nữa.

Canonicalization là gì?

Canonicalization có thề là 1 khái niệm trừu tượng và khó khi phát âm "ca-non-ick-cull-eye-zay-shun", nhưng nó là yếu tố cần thiết khi tối ưu hóa trang web. Vấn đề cốt yếu liên quan đến thuật ngữ này đó chính là sự trùng lặp nội dung, có thể là 1 đoạn, hoặc 1 phần của trang web lặp đi lặp lại ở web của bạn, hoặc thậm chí trên những trang web khác. Đối với bộ máy tìm kiếm thì điều này thật sự nên tránh vì máy tìm kiếm không biết lựa chọn nội dung nào là phiên bản gốc để hiển thị cho người dùng. Theo các chuyên gia thì đây chính là vấn đề của sự trùng lặp nội dung.

Nhằm hướng đến người dùng, thì máy tìm kiếm thường sẽ hiển thị các nội dung bị trùng lặp này cho người dùng nhưng phân vân vì không biết đâu là phiên bản gốc.

 
Canonical là gì
Canonical là cách hữu hiệu tránh trùng lặp nội dung 
 

Cách áp dụng Rel Canonical tốt nhất trong SEO

Theo các chuyên gia seo, canonicalization đề cập đến các trang web cá nhân xuất hiện từ nhiều liên kết. Đây là vấn đề thực sự vì có cùng nội dung chỉ khác nhau đường link. Điều này đồng nghĩa với việc hiệu quả sẽ giảm xuống. Vấn đề này làm cho các nhà phát triển web phải đau đầu vì các thiết lập mặc định đã gây ra vấn đề này. Danh sách sau sẽ cho ta thấy lỗi canonicalization được gây ra bởi các thiết lập mặc định của 2 web server nổi tiếng:

Apache web server:

  • http://www.example.com/
  • http://www.example.com/index.html
  • http:/example.com/
  • http://example.com/index.html

Microsoft Internet Information Services (IIS):

  • http://www.example.com/
  • http://www.example.com/default.asp (or .aspx depending on the version)
  • http://example.com/
  • http://example.com/default.asp (or .aspx)

Mẫu code

mẫu code canonical: <link rel='canonical' data-cke-saved-href='http://www.seomoz.org/blog' data-cke-707-href='http://www.seomoz.org/blog' />
 

Các đường link này đều dẫn đến trang chủ. Điều này có nghĩa là nếu trang chủ có nhiều liên kết tương tự nhau như thế, thì máy tìm kiếm sẽ xem đó là 2 trang web khác nhau chứ không phải cùng 1 trang.

Vì một lý do nào đó trang của bạn xuất hiện trùng lặp nội dung
Nội dung trùng lặp tự sinh ra do code

Nhưng may thay cho những người làm seo, các nhà phát triển web đã đưa ra phương pháp để khắc phục điều này. 2 cách thường làm nhất là chuyển hướng 301 và chuyển hướng 302.

  • A 301 tương tự như 1 mã trạng thái HTTP và được "di chuyển vĩnh viễn"
  • A 302 tương tự như 1 sự chuyển hướng tạm thời.

Để tốt hơn cho người làm SEO thì các chúng tôi khuyên bạn nên dùng phương thức A 301 vì hiệu quả từ 90% đến 99% sẽ thành công còn A 302 thì hầu như không có giá trị.

Canonicalization không giới hạn các ký tự chữ và số. Nó cũng thiết lập dấu gạch chéo trong các URL. Nếu một người dùng gõ http://www.google.com, họ sẽ tự động được chuyển đến http://www.google.com/ (chú ý dấu gạch chéo về phía trước). Điều này xảy ra bởi vì về mặt kỹ thuật thì định dạng có dấu gạch chéo là định dạng đúng cho URL. Mặc dù đây là một vấn đề được đa phần được giải quyết bởi các công cụ tìm kiếm, nhưng nó vẫn là điều cần chú ý vì nhiều máy chủ tự động chuyền hướng 301 từ phiên bản không có dấu gạch chéo lên phiên bản chính xác. Bằng cách này, một liên kết trỏ đến định dạng không đúng của URL sẽ mất từ 1% đến 10% giá trị của nó do chuyển hướng 301. Tham khảo thêm bài viết về liên kết nội bộ để có thể tối ưu hóa các đường liên kết trên trang web của bạn

Một trong những sai lầm phổ biến khi thực hiện các bản sửa lỗi canonicalization vô tình tạo ra một vòng lặp vô hạn giữa http://www.example.com và http://www.example.com/index.html. Các giải pháp cho vấn đề này đã được thảo luận trong bài viết này về việc chuyển hướng một tập tin chỉ mục đến tên miền của bạn mà không cần vòng lặp.

Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.
Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.


Tài liệu tham khảo thêm

HTTP Status Codes
Tài liệu chính thức cho các mã trạng thái HTTP trên W3C.
SEO Advice: URL Canonicalization
Matt Cutts, người đứng đầu của nhóm Webspam tại Google, tư vấn về canonicalization.

Hướng dẫn liên quan

Dao tao Seo, Khoa hoc Seo tai Ha Noi – Đào tạo SEO VietMoz
Đăng ký một khoá học SEO tại VietMoz để được hướng dẫn đầy đủ và chi tiết về cách làm SEO

Canonicalization
2.17 (43.33%) 6 bình chọn

Các bài viết khác về Kiến thức cơ bản

Gửi phản hồi