No-Index tags là gì? Nên dùng noindex tag khi nào?

No-Index tags là gì? Nên dùng noindex tag khi nào?

Định nghĩa về noindex

Thuật ngữ noindex (hay no-index) là một giá trị dùng để khai báo với Googlebot những trang trên hệ thống website mà quản trị viên website không muốn được index. Và Googlebot có thể vẫn thu thập những dữ liệu được gán thẻ noindex này, tuy nhiên chúng sẽ không lập chỉ mục những trang này, đồng nghĩa với việc, người dùng sẽ thường không thể tìm thấy những trang web này trên SERP.

(tại sao lại là “thường không tìm thấy” mà không phải “không tìm thấy”, bạn sẽ được lý giải trong các phần dưới)

Meta noindex tag là một thẻ meta được gán thuộc tính no-index. Ví dụ:

[code]<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>[/code]

Vậy khi nào chúng ta nên sử dụng thẻ noindex?

Theo cách hiểu thông thường nhất, khi bạn thêm thuộc tính noindex vào một nội ducm trên site như trang quản trị admin, hoặc là những trang có nội dung kém chất lượng có thể gây ảnh hưởng đến ranking.

Tuy nhiên, kể cả khi bạn thêm thẻ meta noindex, Google vẫn có thể thu thập những dữ liệu trên trang đó, nhưng không lập chỉ mục hoặc hiển thị trang đó trên SERP. Để hiểu rõ hơn Googlebot sẽ làm gì với những đường dẫn có thêm thẻ meta noindex, xin mới các bạn đến với phần tiếp theo:

Có thể bạn chưa biết!

1. Google có thể noindex một trang mà không cần thẻ điều hướng meta no-index

Đây là tình trạng xảy ra phổ biến trên rất nhiều các trang web lớn hiện nay, khi mà số lượng trang đã index của website vượt quá mức tối đa cho phép của Google. Chính vì vậy, cũng giống như hình vẽ minh họa trên, khả năng index của Google lúc này không thể vươn tới bao phủ ngọn ngành tất cả các trang trong sơ đồ website.

2. Loại bỏ hoàn toàn đường dẫn của các trang noindex trên Google

Ngay khi nhận được tín hiệu noindex trên một trang nào đó, Google sẽ ngay lập tức loại bỏ tất cả đường dẫn trùng với url của trang này trên SERP.

Tuy nhiên, có một số trường hợp các trang noindex vẫn xuất hiện trên SERP như những trang chưa được thu thập dữ liệu. Có thể hiện tượng này sẽ xuất hiện khi Googlebot thu thập dữ liệu của một trang nào đó, và tìm thấy đường dẫn của một trang noindex. Sau đó, index và đánh dấu chưa crawl dữ liệu trên trang.

3. Thu thập thông tin về các liên kết đến các trang no-index

Thẻ no-index chỉ khiến cho Google có thể không index trang, tuy nhiên, lại không thể ngăn cản Googlebot thu thậ các dữ liệu có liên quan đến trang như backlink. Chính vì vậy, mặc dù các trang no-index không được Google lập chỉ mục, chúng vẫn được công cụ tìm kiếm xác nhận là tồn tại và theo dõi thông tin.

4. Tự động index các trang no-index

Trên quan điểm bảo vệ quyền lợi cho người dùng công cụ tìm kiếm, Google cho rằng, nếu một người dùng đã từng tìm thấy thông tin trên một trang web, họ có thể sẽ rất thất vọng nếu không tìm lại được nội dung này khi trang web bị chặn index vì một lý do nào đó, nhất là đối với những trang web uy tín có nhiều người biết đến.

Do vậy, Google có thể đưa các trang không index này quay trở lại kết quả tìm kiếm nếu người dùng tìm kiếm đến chúng, dựa trên lịch sử uy tín mà chúng đã từng thể hiện.

Nguồn: Vietmoz