SlideShare a Scribd company logo
1 of 11
Download to read offline
Nội dung trùng lặp
• Nội dung trùng lặp thường đề cập đến nội dung của
  khối nội dung bên trong hoặc trên các tên miền hoặc
  là hoàn toàn phù hợp với các nội dung khác hoặc là
  đáng tương tự như công ty làm seo. Chủ yếu, điều
  này không phải là lừa đảo có nguồn gốc. Ví dụ về các
  nội dung trùng lặp không độc hại có thể bao gồm:
• Diễn đàn thảo luận có thể tạo ra các trang thường
  xuyên và tước xuống nhắm mục tiêu vào các thiết bị di
  động
  Các cửa hàng được hiển thị hoặc liên kết thông qua
  nhiều URL khác nhau của dịch vụ làm seo
  Máy in chỉ có các phiên bản của các trang web dịch vụ
  seo uy tín
• Nếu trang web của bạn có chứa nhiều trang với
  nội dung chủ yếu là giống hệt nhau, có một số
  cách bạn có thể chỉ URL ưa thích của bạn với
  Google. (Điều này được gọi là “canonicalization”).
  Thông tin về canonicalization.
• Tuy nhiên, trong một số trường hợp, nội dung là
  cố ý trùng lặp trên các lĩnh vực trong một nỗ lực
  để thao tác bảng xếp hạng công cụ tìm kiếm hoặc
  giành chiến thắng giao thông nhiều hơn. Hành vi
  lừa đảo như thế này có thể dẫn đến một trải
  nghiệm người dùng kém, khi khách truy cập thấy
  đáng kể cùng một nội dung lặp đi lặp lại trong một
  tập hợp các kết quả tìm kiếm.
• Google cố gắng để chỉ mục và hiển thị các thiết kế web trên
  trang web có thông tin riêng biệt. Điều này có nghĩa là lọc, ví
  dụ, nếu các thiết kế web trang web của bạn có một “thường
  xuyên” và “máy in” phiên bản của mỗi bài viết, và không phải
  của các bị chặn với một thẻ meta ngăn lập chỉ mục, chúng tôi
  sẽ chọn một trong số họ vào danh sách. Trong những trường
  hợp hiếm gặp trong đó Google nhận thấy rằng nội dung trùng
  lặp có thể được hiển thị với mục đích thao tác bảng xếp hạng
  của chúng tôi và đánh lừa người dùng của chúng tôi, chúng
  tôi cũng sẽ có những điều chỉnh thích hợp trong việc lập chỉ
  mục và xếp hạng của các các thiết kế web trang web có liên
  quan. Kết quả là, thứ hạng của các thiết kế web trên trang
  web có thể bị ảnh hưởng, hoặc các thiết kế web trang web có
  thể được xoá hoàn toàn khỏi chỉ mục của Google, trong
  trường hợp nó sẽ không còn xuất hiện trong kết quả tìm kiếm
  dịch vụ làm seo uy tín.
• Có một số bước bạn có thể làm để chủ động giải quyết các
  vấn đề nội dung trùng lặp, và đảm bảo rằng khách truy cập
  xem nội dung bạn muốn họ.
• Sử dụng 301s: Nếu bạn đã cơ cấu lại trang web của bạn, sử
  dụng chuyển hướng 301 (“RedirectPermanent”) trong tập tin
  htaccess của bạn để chuyển hướng người dùng thông minh,
  Googlebot, và nhện khác. (Trong Apache, bạn có thể làm điều
  này với một tập tin htaccess; trong IIS, bạn có thể làm điều
  này thông qua giao diện điều khiển hành chính).
• Hãy nhất quán: Cố gắng giữ liên kết nội bộ của bạn nhất
  quán. Ví dụ, không liên kết với http://www.example.com/page/
  và http://www.example.com/page và
  http://www.example.com/page/index.htm.
• Sử dụng tên miền cấp cao: Để giúp chúng tôi phục vụ phiên bản
  thích hợp nhất của một tài liệu, sử dụng tên miền cấp cao nhất bất
  cứ khi nào có thể để xử lý các nội dung cụ thể của quốc gia. Chúng
  tôi có nhiều khả năng để biết http://www.example.de có chứa Đức
  tập trung vào nội dung, ví dụ, hơn http://www.example.com/de hoặc
  http://de.example.com.
• Syndicate cẩn thận: Nếu bạn cung cấp thông nội dung của bạn trên
  các trang web khác, Google sẽ luôn luôn hiển thị phiên bản chúng
  tôi nghĩ là thích hợp nhất cho người sử dụng trong mỗi lần tìm kiếm
  nhất định, mà có thể hoặc có thể không phải là phiên bản mà bạn
  muốn. Tuy nhiên, nó là hữu ích để đảm bảo rằng mỗi trang web mà
  nội dung của bạn được cung cấp thông tin bao gồm một liên kết đến
  bài viết ban đầu của bạn. Bạn cũng có thể yêu cầu những người sử
  dụng các tài liệu cung cấp thông tin của bạn để sử dụng thẻ meta
  ngăn lập chỉ mục để ngăn chặn các công cụ tìm kiếm lập chỉ mục
  phiên bản của họ về nội dung.
• Sử dụng Công cụ quản trị trang web để cho chúng
  tôi biết cách bạn muốn trang web của bạn được
  lập chỉ mục: Bạn có thể nói Google tên miền ưa
  thích của bạn (ví dụ, http://www.example.com
  hoặc http://example.com).
• Giảm thiểu sự lặp lại boilerplate: Ví dụ, thay vì bao
  gồm cả văn bản bản quyền kéo dài trên dưới cùng
  của mỗi trang, bao gồm một bản tóm tắt rất ngắn
  gọn và sau đó liên kết đến một trang với các chi
  tiết hơn thiết kế web giá rẻ. Ngoài ra, bạn có thể
  sử dụng công cụ xử lý thông số để xác định cách
  mà bạn muốn Google để điều trị các tham số
  URL.
• Tránh khai xuất bản: Người sử dụng không thích nhìn
  thấy các trang “trống rỗng”, do đó, tránh giữ chỗ nếu
  có thể. Ví dụ, không xuất bản các trang mà bạn không
  có nội dung thực sự. Nếu bạn tạo các trang giữ chỗ,
  sử dụng thẻ meta ngăn lập chỉ mục để chặn các trang
  được lập chỉ mục.
• Hiểu hệ thống quản lý nội dung của bạn: Hãy chắc
  chắn rằng bạn đã quen thuộc với nội dung được hiển
  thị trên trang web của bạn. Blog, diễn đàn, và các hệ
  thống liên quan thường hiển thị cùng một nội dung
  trong nhiều định dạng. Ví dụ, một blog entry có thể
  xuất hiện trên trang chủ của một blog, trong một trang
  lưu trữ, và trong một trang mục khác với cùng một
  nhãn hiệu.
•   Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự, hãy xem
    xét mở rộng mỗi trang hoặc củng cố các trang thành một. Ví dụ, nếu bạn có
    một trong các mẫu thiết kế web trên trang web du lịch với các trang riêng
    biệt cho hai thành phố, nhưng thông tin tương tự trên cả hai trang, bạn có
    thể hợp nhất các trang vào một trang về cả hai thành phố hoặc bạn có thể
    mở rộng mỗi trang chứa nội dung độc đáo về mỗi thành phố.
•   Google không khuyến nghị trình thu thập dữ liệu truy cập chặn trùng lặp nội
    dung trên trang web của bạn, cho dù với một tập tin robots.txt hoặc các
    phương pháp khác. Nếu công cụ tìm kiếm không thể thu thập dữ liệu các
    trang có nội dung trùng lặp, họ có thể không tự động phát hiện rằng các
    URL trỏ đến cùng một nội dung và do đó sẽ có hiệu quả phải đối xử với họ
    như là riêng biệt, trang duy nhất. Một giải pháp tốt hơn là để cho phép các
    công cụ tìm kiếm thu thập dữ liệu các URL, nhưng đánh dấu chúng là bản
    sao bằng cách sử dụng các rel chuyển hướng = “canonical” liên kết phần
    tử, công cụ xử lý tham số URL, hoặc 301. Trong trường hợp nội dung trùng
    lặp dẫn đến chúng ta bò quá nhiều trang web của bạn, bạn cũng có thể
    điều chỉnh các thiết lập tốc độ thu thập dữ liệu trong Công cụ Quản trị Trang
    web.
• Nội dung trùng lặp trên một thiết kế web trên trang web không phải
  là căn cứ cho hành động trên trang web đó, trừ khi nó xuất hiện
  rằng ý định của nội dung trùng lặp là lừa đảo và thao tác kết quả
  công cụ tìm kiếm. Nếu trang web của bạn bị các vấn đề nội dung
  trùng lặp, và bạn không làm theo những lời khuyên được liệt kê ở
  trên, chúng tôi làm tốt công việc của việc lựa chọn một phiên bản
  của nội dung hiển thị trong kết quả tìm kiếm của chúng tôi dịch vụ
  seo giá rẻ.
• Tuy nhiên, nếu xem xét của chúng tôi chỉ ra rằng bạn tham gia vào
  các hành vi lừa đảo và trang web của bạn đã được gỡ bỏ từ các kết
  quả tìm kiếm của chúng tôi, xem xét trang web của bạn một cách
  cẩn thận. Nếu trang web của bạn đã được gỡ bỏ từ các kết quả tìm
  kiếm của chúng tôi, xem xét Hướng dẫn quản trị thiết kế web trên
  trang web của chúng tôi để biết thêm thông tin. Một khi bạn đã thực
  hiện thay đổi của bạn và tự tin rằng trang web của bạn không còn vi
  phạm nguyên tắc của chúng tôi, gửi trang web của bạn để xem xét
  lại dịch vụ seo uy tín.
• Trong tình huống hiếm hoi, thuật toán của
  chúng tôi có thể chọn một địa chỉ từ một
  trang web bên ngoài được lưu trữ nội dung
  của bạn mà không có sự cho phép của bạn.
  Nếu bạn tin rằng một trang web khác phải
  nhân đôi nội dung của bạn vi phạm luật bản
  quyền, bạn có thể liên lạc với máy chủ của
  trang web để yêu cầu loại bỏ. Ngoài ra, bạn
  có thể yêu cầu Google loại bỏ các trang vi
  phạm khỏi các kết quả tìm kiếm của chúng
  tôi bằng cách nộp đơn yêu cầu theo Đạo luật
  Bản quyền Kỹ thuật số Thiên niên kỷ.

More Related Content

Nội dung trùng lặp

  • 2. • Nội dung trùng lặp thường đề cập đến nội dung của khối nội dung bên trong hoặc trên các tên miền hoặc là hoàn toàn phù hợp với các nội dung khác hoặc là đáng tương tự như công ty làm seo. Chủ yếu, điều này không phải là lừa đảo có nguồn gốc. Ví dụ về các nội dung trùng lặp không độc hại có thể bao gồm: • Diễn đàn thảo luận có thể tạo ra các trang thường xuyên và tước xuống nhắm mục tiêu vào các thiết bị di động Các cửa hàng được hiển thị hoặc liên kết thông qua nhiều URL khác nhau của dịch vụ làm seo Máy in chỉ có các phiên bản của các trang web dịch vụ seo uy tín
  • 3. • Nếu trang web của bạn có chứa nhiều trang với nội dung chủ yếu là giống hệt nhau, có một số cách bạn có thể chỉ URL ưa thích của bạn với Google. (Điều này được gọi là “canonicalization”). Thông tin về canonicalization. • Tuy nhiên, trong một số trường hợp, nội dung là cố ý trùng lặp trên các lĩnh vực trong một nỗ lực để thao tác bảng xếp hạng công cụ tìm kiếm hoặc giành chiến thắng giao thông nhiều hơn. Hành vi lừa đảo như thế này có thể dẫn đến một trải nghiệm người dùng kém, khi khách truy cập thấy đáng kể cùng một nội dung lặp đi lặp lại trong một tập hợp các kết quả tìm kiếm.
  • 4. • Google cố gắng để chỉ mục và hiển thị các thiết kế web trên trang web có thông tin riêng biệt. Điều này có nghĩa là lọc, ví dụ, nếu các thiết kế web trang web của bạn có một “thường xuyên” và “máy in” phiên bản của mỗi bài viết, và không phải của các bị chặn với một thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một trong số họ vào danh sách. Trong những trường hợp hiếm gặp trong đó Google nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao tác bảng xếp hạng của chúng tôi và đánh lừa người dùng của chúng tôi, chúng tôi cũng sẽ có những điều chỉnh thích hợp trong việc lập chỉ mục và xếp hạng của các các thiết kế web trang web có liên quan. Kết quả là, thứ hạng của các thiết kế web trên trang web có thể bị ảnh hưởng, hoặc các thiết kế web trang web có thể được xoá hoàn toàn khỏi chỉ mục của Google, trong trường hợp nó sẽ không còn xuất hiện trong kết quả tìm kiếm dịch vụ làm seo uy tín.
  • 5. • Có một số bước bạn có thể làm để chủ động giải quyết các vấn đề nội dung trùng lặp, và đảm bảo rằng khách truy cập xem nội dung bạn muốn họ. • Sử dụng 301s: Nếu bạn đã cơ cấu lại trang web của bạn, sử dụng chuyển hướng 301 (“RedirectPermanent”) trong tập tin htaccess của bạn để chuyển hướng người dùng thông minh, Googlebot, và nhện khác. (Trong Apache, bạn có thể làm điều này với một tập tin htaccess; trong IIS, bạn có thể làm điều này thông qua giao diện điều khiển hành chính). • Hãy nhất quán: Cố gắng giữ liên kết nội bộ của bạn nhất quán. Ví dụ, không liên kết với http://www.example.com/page/ và http://www.example.com/page và http://www.example.com/page/index.htm.
  • 6. • Sử dụng tên miền cấp cao: Để giúp chúng tôi phục vụ phiên bản thích hợp nhất của một tài liệu, sử dụng tên miền cấp cao nhất bất cứ khi nào có thể để xử lý các nội dung cụ thể của quốc gia. Chúng tôi có nhiều khả năng để biết http://www.example.de có chứa Đức tập trung vào nội dung, ví dụ, hơn http://www.example.com/de hoặc http://de.example.com. • Syndicate cẩn thận: Nếu bạn cung cấp thông nội dung của bạn trên các trang web khác, Google sẽ luôn luôn hiển thị phiên bản chúng tôi nghĩ là thích hợp nhất cho người sử dụng trong mỗi lần tìm kiếm nhất định, mà có thể hoặc có thể không phải là phiên bản mà bạn muốn. Tuy nhiên, nó là hữu ích để đảm bảo rằng mỗi trang web mà nội dung của bạn được cung cấp thông tin bao gồm một liên kết đến bài viết ban đầu của bạn. Bạn cũng có thể yêu cầu những người sử dụng các tài liệu cung cấp thông tin của bạn để sử dụng thẻ meta ngăn lập chỉ mục để ngăn chặn các công cụ tìm kiếm lập chỉ mục phiên bản của họ về nội dung.
  • 7. • Sử dụng Công cụ quản trị trang web để cho chúng tôi biết cách bạn muốn trang web của bạn được lập chỉ mục: Bạn có thể nói Google tên miền ưa thích của bạn (ví dụ, http://www.example.com hoặc http://example.com). • Giảm thiểu sự lặp lại boilerplate: Ví dụ, thay vì bao gồm cả văn bản bản quyền kéo dài trên dưới cùng của mỗi trang, bao gồm một bản tóm tắt rất ngắn gọn và sau đó liên kết đến một trang với các chi tiết hơn thiết kế web giá rẻ. Ngoài ra, bạn có thể sử dụng công cụ xử lý thông số để xác định cách mà bạn muốn Google để điều trị các tham số URL.
  • 8. • Tránh khai xuất bản: Người sử dụng không thích nhìn thấy các trang “trống rỗng”, do đó, tránh giữ chỗ nếu có thể. Ví dụ, không xuất bản các trang mà bạn không có nội dung thực sự. Nếu bạn tạo các trang giữ chỗ, sử dụng thẻ meta ngăn lập chỉ mục để chặn các trang được lập chỉ mục. • Hiểu hệ thống quản lý nội dung của bạn: Hãy chắc chắn rằng bạn đã quen thuộc với nội dung được hiển thị trên trang web của bạn. Blog, diễn đàn, và các hệ thống liên quan thường hiển thị cùng một nội dung trong nhiều định dạng. Ví dụ, một blog entry có thể xuất hiện trên trang chủ của một blog, trong một trang lưu trữ, và trong một trang mục khác với cùng một nhãn hiệu.
  • 9. Giảm thiểu nội dung tương tự: Nếu bạn có nhiều trang tương tự, hãy xem xét mở rộng mỗi trang hoặc củng cố các trang thành một. Ví dụ, nếu bạn có một trong các mẫu thiết kế web trên trang web du lịch với các trang riêng biệt cho hai thành phố, nhưng thông tin tương tự trên cả hai trang, bạn có thể hợp nhất các trang vào một trang về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang chứa nội dung độc đáo về mỗi thành phố. • Google không khuyến nghị trình thu thập dữ liệu truy cập chặn trùng lặp nội dung trên trang web của bạn, cho dù với một tập tin robots.txt hoặc các phương pháp khác. Nếu công cụ tìm kiếm không thể thu thập dữ liệu các trang có nội dung trùng lặp, họ có thể không tự động phát hiện rằng các URL trỏ đến cùng một nội dung và do đó sẽ có hiệu quả phải đối xử với họ như là riêng biệt, trang duy nhất. Một giải pháp tốt hơn là để cho phép các công cụ tìm kiếm thu thập dữ liệu các URL, nhưng đánh dấu chúng là bản sao bằng cách sử dụng các rel chuyển hướng = “canonical” liên kết phần tử, công cụ xử lý tham số URL, hoặc 301. Trong trường hợp nội dung trùng lặp dẫn đến chúng ta bò quá nhiều trang web của bạn, bạn cũng có thể điều chỉnh các thiết lập tốc độ thu thập dữ liệu trong Công cụ Quản trị Trang web.
  • 10. • Nội dung trùng lặp trên một thiết kế web trên trang web không phải là căn cứ cho hành động trên trang web đó, trừ khi nó xuất hiện rằng ý định của nội dung trùng lặp là lừa đảo và thao tác kết quả công cụ tìm kiếm. Nếu trang web của bạn bị các vấn đề nội dung trùng lặp, và bạn không làm theo những lời khuyên được liệt kê ở trên, chúng tôi làm tốt công việc của việc lựa chọn một phiên bản của nội dung hiển thị trong kết quả tìm kiếm của chúng tôi dịch vụ seo giá rẻ. • Tuy nhiên, nếu xem xét của chúng tôi chỉ ra rằng bạn tham gia vào các hành vi lừa đảo và trang web của bạn đã được gỡ bỏ từ các kết quả tìm kiếm của chúng tôi, xem xét trang web của bạn một cách cẩn thận. Nếu trang web của bạn đã được gỡ bỏ từ các kết quả tìm kiếm của chúng tôi, xem xét Hướng dẫn quản trị thiết kế web trên trang web của chúng tôi để biết thêm thông tin. Một khi bạn đã thực hiện thay đổi của bạn và tự tin rằng trang web của bạn không còn vi phạm nguyên tắc của chúng tôi, gửi trang web của bạn để xem xét lại dịch vụ seo uy tín.
  • 11. • Trong tình huống hiếm hoi, thuật toán của chúng tôi có thể chọn một địa chỉ từ một trang web bên ngoài được lưu trữ nội dung của bạn mà không có sự cho phép của bạn. Nếu bạn tin rằng một trang web khác phải nhân đôi nội dung của bạn vi phạm luật bản quyền, bạn có thể liên lạc với máy chủ của trang web để yêu cầu loại bỏ. Ngoài ra, bạn có thể yêu cầu Google loại bỏ các trang vi phạm khỏi các kết quả tìm kiếm của chúng tôi bằng cách nộp đơn yêu cầu theo Đạo luật Bản quyền Kỹ thuật số Thiên niên kỷ.