Ở phần 4 trong series các tiêu chí xếp hạng của Google, VietMoz đã đưa đến cho người dùng những thông tin về độ tươi mới của nội dung và cách thức Google xác định độ tươi mới của nội dung.
Nối tiếp series các tiêu chí xếp hạng của Google, hôm nay chúng tôi sẽ đem đến cho bạn những thông tin về duplicate content hay còn gọi là trùng lặp nội dung.
Nội dung trùng lặp (duplicate content)
Nội dung trùng lặp là thuật ngữ đề cập đến nội dung của một website nhưng lại xuất hiện trên nhiều nơi trên internet.
Ví dụ bạn viết một bài viết về tất cả các loài động vật đã được khám phá và đặt tên theo tên của Frank Zappa. Sau đó, có người copy và paste bài viết của bạn vào website họ. Như vậy, cả website của bạn và của người kia đều dính phải vấn đề trùng lặp nội dung.
Nội dung trùng lặp không hẳn là nội dung xấu. Như ở ví dụ bên trên thì nội dung trùng lặp là do nội dung bài viết bị ăn cắp.Google sẽ không phạt những trang web có nội dung trùng lặp. Thay vào đó, Google sẽ dựa vào ngày đăng bài để quyết định xem bài viết nào được hiển thị trên trang kết quả tìm kiếm.
Đôi khi sẽ có trường hợp Google sẽ không quan tâm đến nội dung của website nào xuất hiện trước. Mà Google sẽ quan tâm đến website nào uy tín hơn. Trường hợp này sẽ hiếm khi xảy ra. Bởi một website uy tín thì sẽ không bao giờ lấy cắp toàn bộ bài viết của website nhỏ hơn. Thực sự không đáng để giảm thiểu độ uy tín của website xuống.
Ngược lại, nhiều website lớn thường xuyên bị cóp nhặt nội dung và đăng tải lại ở đâu đó trên internet. Các bài viết về SEW của chúng tôi cũng bị copy hơn 10 lần bởi các website khác nhau. Tuy nhiên, điều này không bao giờ ảnh hưởng đến xếp hạng của bạn bởi vì các website này có chất lượng kém hơn và bị Google bỏ qua.
Làm thế nào để quản lý nội dung trùng lặp?
- Đầu tiên, không được sao chép nội dung của bất cứ website nào khi chưa có có sự đồng ý của chủ sở hữu. Việc này thực sự không tốt cho website của bạn và người đọc cũng cảm thấy khó chịu khi đọc đi đọc lại các nội dung giống nhau.
- Nếu bạn dùng các đoạn, các câu trích dẫn hay từ một website khác trong bài viết của mình. Hãy tạo sự tin cậy cho người dùng bằng cách ghi nguồn gốc của đoạn văn hay câu trích dẫn.
- Nếu bạn có nội dung trùng lặp trên chính website của mình, hãy thiết lập một trang chuyển hướng 301 để Google chỉ index một trang duy nhất mà bạn muốn.
- Đảm bảo rằng Google chỉ đánh chỉ mục tên miền được chuyển tiếp của bạn, ví dụ, sử dụng tiếp đầu tố www hay không: http://www.example.com hoặc http://example.com. Google có thể coi các phiên bản tên miền có www hay không có www của bạn là các site độc lập nên do đó sẽ ảnh hưởng đến mực độ hiện thị của bạn trên trang kết quả tìm kiếm.
- Bạn có thể gặp phải các vấn đề về nội dung trùng lặp nếu bạn sử dụng một phiên bản website trên điện thoại động. Thay vào đó sử dụng một website tương thích với thiết bị di động sẽ khắc phục được vấn đề này.
- Trước khi bạn phê duyệt bài viết từ tác giả là khách truy cập. Bạn hãy kiểm tra xem bài viết đó đã xuất hiện ở đâu chưa.
Tuy nhiên, có một cách an toàn để có thể chia sẻ những nội dung trùng lặp có lợi cho bạn, cho tác giả và cho cả bài viết trên website gốc và Google cũng hài lòng. Đó chính là khi bàn được sự cho phép của tác giả bài viết và website gốc.
Content Syndication
Content Syndication là thuật ngữ dùng để phương pháp tái bản lại bài viết của bạn trên trang web của bên thứ 3. Phương pháp này thực sự đem lại hiệu quả khi bạn là một nhà văn có triển vọng. Và bạn muốn có số lượng độc giả lớn hơn.
Nếu website chia sẻ nội dung đúng cách thì sẽ chẳng có lý do gì dẫn đến tình trạng trùng lặp nội dung.
Dưới đây là những cách thân thiện với SEO để chia sẻ lại những nội dung đã có trước đó.
1. Thẻ rel=canonical
Cách an toàn nhất để đảm bảo rằng website của bạn không gặp phải vấn đề về trùng lặp nội dung. Đó là sử dụng thẻ rel=canonical trên bài viết được chia sẻ lại. Thẻ này sẽ khai báo cho google biết rằng bài viết này là bài viết gốc. Vì thế bài viết này cần được lập chỉ mục và được hưởng các lợi ích xếp hạng tương ứng.
2. Thẻ meta noindex
Theo như Whiteboard Friday video của Eric Enge, thẻ này có nguyên tắc hoạt động tương tự như thẻ canonical. Website chia sẻ lại bài viết sử dụng thẻ meta noindex trên trang. Thẻ này có tác dụng hướng dẫn cho công cụ tìm kiếm xóa trang này khỏi chỉ mục tìm kiếm.
3. Xóa các liên kết đến bài viết gốc
Bạn có thể sử dụng công cụ clean text link bên trong chính bài viết. Đây là một phương pháp khá hữu ích khi bạn không có đủ quyền truy cập vào HTML của bài viết của mình và không thể sử dụng thẻ rel=canonical.
Các bài cùng series:
- Phần 1: Các yếu tố On-Page
- Phần 2: Từ khóa
- Phần 3: Nội dung chất lượng
- Phần 4: Độ tươi mới của nội dung
- Phần 6: Độ tin cậy, Authority và website chuyên môn
- Phần 7: Các tín hiệu đến từ website của bạn
- Phần 8: Internal link
- Phần 9: Outbound link
- Phần 10: Backlink
Nguồn: searchenginewatch.com
Dịch bởi Persotran
Biên tập bởi vietmoz.net
2 bình luận
Bài viết rất hay, cảm ơn Vietmoz rất nhiều
Cho mình hỏi web mình có nhiều sản phẩm giống nhau về cả thông số và chất lượng. Mình viết bài bề sản phẩm rồi copy ra các sản phẩm khác chỉ khác nhau ở màu sắc của sản phẩm thôi thì phải giải quyết như thế nào. Thank bạn