Google làm tốt công việc của mình. Đôi khi, một chút quá tốt - các trang lập chỉ mục nó không bao giờ có nghĩa là để tìm.
Các URL không mong muốn không có trong sơ đồ trang web của bạn.
URL mồ côi không được liên kết trên trang web của bạn.
URL kỳ lạ bạn thậm chí có thể không biết tồn tại.
Hầu hết các chuyên gia SEO lo lắng về việc đưa các trang vào chỉ mục Google. Nhưng bạn cũng cần quan tâm đến việc đưa các trang có giá trị thấp ra khỏi chỉ mục.
Hãy đi sâu vào lý do tại sao có ít trang được lập chỉ mục thực sự có thể dẫn đến số phiên hữu cơ cao hơn. Và các phương pháp deindexing khác nhau ảnh hưởng đến SEO.
https://cdn.searchenginejournal.com/wp- ... 99989.webpChỉ số nở là gì?
Chỉ số phình to là khi một trang web có quá nhiều trang có giá trị thấp được các công cụ tìm kiếm lập chỉ mục. Các trang này thường được tạo tự động với ít hoặc không có nội dung độc đáo.
Sự tồn tại của các URL này có tác động xếp tầng đối với toàn bộ quy trình SEO kỹ thuật.
Các loại URL phổ biến gây phình chỉ mục bao gồm:
Kết hợp bộ lọc từ điều hướng mặt.
Trang lưu trữ không trật tự.
Các trang thẻ không bị hạn chế.
Pagination trang.
Trang tham số không đáng tin cậy .
Các trang nội dung đã hết hạn .
Các trang kết quả tìm kiếm không được tối ưu hóa tại chỗ .
Hồ sơ người dùng tự động tạo với ít nội dung.
Theo dõi URL.
Xử lý sai http đến https.
Không nhất quán www so với không www.
Các thư mục con không nên được lập chỉ mục.
Chỉ số phình làm giảm hiệu quả thu thập thông tin khi Googlebot trượt qua các đường dẫn có giá trị thấp. Điều này làm chậm tốc độ lập chỉ mục cho nội dung mới và thu thập lại nội dung được cập nhật có giá trị SEO.
Thông thường, phình chỉ mục chứa nội dung trùng lặp hoặc gây ra sự ăn cắp từ khóa. Với nhiều trang từ một trang web cạnh tranh cho cùng một mục đích tìm kiếm, điều này trở nên khó hiểu đối với các công cụ tìm kiếm, trang nào có liên quan nhất vì tín hiệu xếp hạng được phân chia trên nhiều URL. Điều này làm tổn thương khả năng của trang web để xếp hạng ở các vị trí hàng đầu.
Và nếu các trang chất lượng thấp không thể xếp hạng, người tìm kiếm có thể sẽ thất vọng với trang đích và pogostick. Gửi tín hiệu trải nghiệm người dùng kém đến Google và làm tổn thương thương hiệu của bạn.
Tất cả điều này kết hợp làm giảm đánh giá chất lượng của tên miền trong mắt các công cụ tìm kiếm.
Đây là một vấn đề vì các URL không chỉ được xếp hạng dựa trên giá trị riêng của chúng mà còn dựa trên trang web mà chúng thuộc về.
Mỗi trang được lập chỉ mục ảnh hưởng đến cách các thuật toán chất lượng của Google đánh giá danh tiếng của trang web.
Google Webmaster Central tuyên bố rằng:
Nội dung chất lượng thấp trên một số phần của trang web có thể ảnh hưởng đến toàn bộ bảng xếp hạng của trang web và do đó loại bỏ các trang chất lượng thấp cuối cùng có thể giúp xếp hạng nội dung chất lượng cao hơn của bạn.
John Mueller đã xây dựng về điều này vào năm 2015.
Các thuật toán chất lượng của chúng tôi nhìn vào trang web nói chung, vì vậy chúng nhìn vào mọi thứ được lập chỉ mục. Và nếu chúng ta thấy rằng phần lớn nội dung được lập chỉ mục thực sự là nội dung chất lượng thấp hơn thì chúng ta có thể nói 'tốt, có thể trang web này nói chung là loại chất lượng thấp hơn. Và nếu bạn có thể nói với chúng tôi rằng nội dung chất lượng thấp hơn này không nên được lập chỉ mục và không nên tính đến, thì chúng tôi thực sự có thể tập trung vào nội dung chất lượng cao mà bạn đang cho phép chúng tôi lập chỉ mục.
Và một lần nữa vào tháng 3/2017 . Và một lần nữa vào tháng 8 năm 2017 . Và một lần nữa vào tháng 10 năm 2017 .
Đây là lý do tại sao mục tiêu của SEO không phải là lấy càng nhiều trang vào chỉ mục càng tốt. Nhưng thay vào đó để tạo ra một trận đấu có giá trị giữa người tìm kiếm và trang đích.
Để đạt được mục tiêu này, bạn chỉ nên cho phép lập chỉ mục các trang bạn muốn người tìm kiếm truy cập và hủy bỏ tất cả các trang không cung cấp giá trị duy nhất cho công cụ tìm kiếm hoặc người dùng.
Cách chẩn đoán chỉ số phình
Báo cáo Bảo hiểm của Google Search Console (GSC) là một trong những cách nhanh nhất và đáng tin cậy nhất để xác định các loại trang gây phình to chỉ mục.
Giả sử sơ đồ trang XML của bạn phù hợp với các thực tiễn tốt nhất về SEO , do đó, chỉ chứa các URL có liên quan đến SEO, chỉ cần xem các URL mẫu được lập chỉ mục nhưng không được gửi trong sơ đồ trang web.
Báo cáo Bảo hiểm của Google Search Console cho thấy Index Bloat
Nếu sơ đồ trang XML của bạn không được tối ưu hóa, hãy chạy một công cụ thu thập thông tin không giới hạn và so sánh số lượng URL có thể lập chỉ mục được chọn bởi trình thu thập thông tin so với số lượng trang hợp lệ.
Nếu bạn có các trang hợp lệ hơn đáng kể so với các URL được thu thập thông tin, có khả năng xảy ra sự cố phình chỉ mục.
Không sử dụng trang web: tìm kiếm nhà điều hành nâng cao để đếm số lượng trang được lập chỉ mục, nó rất không đáng tin cậy.
Khi bạn đã xác định các trang có giá trị thấp sẽ bị khử, bạn nên tham khảo chéo các URL với dữ liệu Google Analytics để đánh giá hiệu quả có thể có trong các phiên không phải trả tiền.
Thông thường, do bản chất của chúng, sẽ không có tác động tiêu cực, nhưng tốt nhất là bạn nên chắc chắn trước khi bạn thực hiện bất kỳ quy mô lớn nào.
https://cdn.searchenginejournal.com/wp- ... 9cd532.pngCách Deindex Pages từ Google
Có nhiều cơ chế mà bạn có thể đẩy các trang không mong muốn ra khỏi chỉ mục của công cụ tìm kiếm. Mỗi người có ưu và nhược điểm riêng.
Nhưng hầu hết các phương pháp khử màu đều sửa lỗi phình chỉ số dựa trên các quy tắc cho các loại trang.
Điều này giúp thực hiện dễ dàng hơn các chiến lược cải tiến nội dung khác dựa trên cách tiếp cận từng trang, chẳng hạn như xuất bản lại nội dung.
1. 410 Đã qua hoặc 2. Không tìm thấy trang 404
Làm thế nào 404 & 401 mã deindex trang
Một cách nhanh chóng để deindex một trang là máy chủ trả về mã trạng thái 410 HTTP (hay còn gọi là Hồi Gone).
Điều này báo hiệu cho Google trang này đã bị xóa một cách có chủ ý, làm cho nó rõ ràng hơn mã 404 (hay còn gọi là Trang Page không tìm thấy), điều này sẽ dẫn đến việc khử nhiễu chậm hơn một chút.
Đối với bất cứ ai quan tâm về việc tích lũy 4xx lỗi lỗi, hãy để tôi yên tâm. Không có hình phạt Google cho mã 4xx. Nhưng nếu URL có bất kỳ tín hiệu xếp hạng nào, chúng sẽ bị mất.
Chỉ số phòng chống phình to : 1/5
Chỉ số kiểm soát thiệt hại phình to : 4/5
3. Chuyển hướng 301
301 chuyển hướng URL deindex
Nếu sự phình to chỉ số là do nhiều trang nhắm mục tiêu vào cùng một chủ đề, bạn có thể hợp nhất chúng thành một trang duy nhất với 301 chuyển hướng và hợp nhất các tín hiệu xếp hạng của chúng.
Để Google hủy bỏ các trang được chuyển hướng, nó phải thu thập dữ liệu URL gốc, xem mã trạng thái 301, thêm URL đích vào hàng đợi thu thập thông tin và sau đó xử lý nội dung để xác nhận tính chất tương đương. Nếu vậy, các tín hiệu xếp hạng, không pha loãng, sẽ được truyền lại.
Đây có thể là một quá trình chậm nếu URL đích có mức độ ưu tiên thấp trong hàng đợi thu thập dữ liệu. Và một quá trình cực kỳ chậm nếu bạn có chuỗi chuyển hướng.
Ngoài ra, nếu bạn chuyển hướng đến một trang không liên quan, chẳng hạn như trang chủ, Google sẽ coi đây là một 404 mềm và sẽ không chuyển các tín hiệu xếp hạng. Trong trường hợp đó, một chiếc 410 đã biến mất sẽ đạt được kết quả tương tự nhưng với quá trình khử màu nhanh hơn.
Chỉ số phòng chống phình to : 1/5
Chỉ số kiểm soát thiệt hại phình to : 3/5
4. Rel = Liên kết Canonical
Làm thế nào rel = trang deindex canonical
Đối với các URL nội dung trùng lặp, một liên kết rel = canonical gợi ý cho Google những URL trùng lặp nào để lập chỉ mục.
Nếu thẻ được chấp nhận, các trang thay thế (trùng lặp giá trị thấp hơn) sẽ được thu thập thông tin nhưng ít thường xuyên hơn và sẽ bị loại khỏi chỉ mục, chuyển các tín hiệu xếp hạng của chúng sang chính tắc (trang ưa thích được lập chỉ mục).
Nhưng để được chấp nhận, nội dung phải rất giống nhau và cả hai URL cần được Google thu thập và xử lý, điều này có thể hơi chậm.
Chỉ số phòng chống phình to : 4/5
Nghiên cứu từ khóa Chỉ cần nâng cấp.
Chúng tôi đã cung cấp cho các công cụ nghiên cứu từ khóa của chúng tôi một đại tu. Bây giờ, có được dữ liệu như bạn chưa từng thấy. Nhiều từ khóa hơn, cái nhìn sâu sắc hơn, ROI cao hơn. Hãy dùng thử miễn phí.
Dùng thử miễn phí
QUẢNG CÁO
Chỉ số kiểm soát thiệt hại phình to : 2/5
5. Công cụ tham số URL
Công cụ tham số URL & khử màu
Trong Google Search Console, bạn có thể chỉ định cách Googlebot nên xử lý các tham số.
Ba nhược điểm rõ ràng của công cụ tham số URL là:
Nó chỉ hoạt động nếu URL dựa trên tham số.
Nó không giải quyết bất kỳ công cụ tìm kiếm nào ngoài Google.
Nó được thiết kế chỉ để kiểm soát bò.
Mặc dù nó không kiểm soát việc lập chỉ mục trực tiếp, nhưng nếu bạn chỉ định không có Crawl Crawl trên một tham số, John Mueller đã nhận xét rằng các URL đó cuối cùng sẽ bị loại khỏi chỉ mục.
Nhưng điều này có giá, nếu Googlebot không thể thu thập dữ liệu, các tín hiệu không thể được xử lý, điều này có thể ảnh hưởng đến xếp hạng hoặc trích xuất các liên kết nội bộ để thêm vào hàng đợi thu thập thông tin, điều này có thể làm chậm việc lập chỉ mục trang web.
Chỉ số phòng chống phình to : 3/5
Chỉ số kiểm soát thiệt hại phình to : 1/5
6. Robots.txt
Cách robot.txt hoạt động
Không cho phép các lệnh trong tệp robot.txt cho các công cụ tìm kiếm biết trang nào không được phép thu thập dữ liệu.
Tương tự như công cụ tham số URL, điều này không kiểm soát việc lập chỉ mục trực tiếp. Nếu trang được liên kết từ các nơi khác trên web, Google có thể cho rằng nó có liên quan để đưa vào chỉ mục.
Ngoài ra, việc chặn trong tệp robots.txt không phải là một tín hiệu rõ ràng về cách các công cụ tìm kiếm nên xử lý các URL được lập chỉ mục hiện tại.
Vì vậy, theo thời gian, nhiều khả năng các trang sẽ bị loại khỏi chỉ mục vì Google có xu hướng không bao gồm các trang không thể thu thập dữ liệu, đây sẽ là một quá trình chậm.
Chỉ số phòng chống phình to : 2/5
Chỉ số kiểm soát thiệt hại phình to : 1/5
7. Thẻ Noindex
Không có thẻ chỉ mục kiểm soát phình chỉ số
Để dứt khoát chặn một trang khỏi bị lập chỉ mục, bạn cần sử dụng thẻ meta rô-bốt rô-bốt-rô-lô hoặc X-Robots-Tag. Không sử dụng lệnh noindex trong tệp robots.txt vì điều này không được các công cụ tìm kiếm tôn vinh.
Biết rằng một lệnh noindex có tác động xếp tầng:
Ngăn chặn bổ sung hoặc, sau khi được xử lý, đảm bảo khử nhiễu từ các công cụ tìm kiếm.
Làm cho các URL không có nội dung được thu thập thông tin ít thường xuyên hơn.
Dừng bất kỳ tín hiệu xếp hạng nào để URL không bị quy kết.
Nếu xuất hiện trong một thời gian dài, cũng sẽ dẫn đến một liên kết của trang nofollow, điều đó có nghĩa là Google sẽ không thêm các liên kết đó vào hàng đợi thu thập thông tin và tín hiệu xếp hạng sẽ không được chuyển đến các trang được liên kết.
Chỉ số phòng chống phình to : 4/5
Chỉ số kiểm soát thiệt hại phình to : 4/5
8. Bảo vệ mật khẩu
làm thế nào các hình thức đăng nhập dừng trình thu thập thông tin
Mật khẩu bảo vệ các tệp trên máy chủ của bạn dừng công cụ tìm kiếm trong các bản nhạc của họ. Các URL không thể được thu thập, lập chỉ mục hoặc chuyển qua bất kỳ tín hiệu xếp hạng nào.
Nhưng rõ ràng điều này cũng chặn người dùng, do đó, nó bị giới hạn trong việc khử nội dung mà bạn chọn để di chuyển phía sau đăng nhập.
Bất kỳ deindexing nào cũng yêu cầu các công cụ tìm kiếm thử và thu thập dữ liệu đường dẫn URL, xem nó không còn được chào đón và sau đó xóa nội dung.
Điều này có thể mất khá nhiều thời gian vì càng nhiều URL trong phần đó nó thu thập dữ liệu, nó sẽ càng hiểu rằng không có giá trị nào được trả về ngân sách thu thập thông tin và càng thấp trong hàng đợi thu thập thông tin, nó sẽ ưu tiên các URL tương tự.
Chỉ số phòng chống phình to : 2/5
Chỉ số kiểm soát thiệt hại phình to : 1/5
9. Xóa công cụ URL
Xóa công cụ URL trong Google Search Console
Nếu bạn có nhu cầu khẩn cấp để hủy đăng ký một trang khỏi Google, công cụ Xóa URL là một tùy chọn nhanh. Yêu cầu thường được xử lý vào ngày chúng được gửi.
Hạn chế ở đây là đây là một khối tạm thời. Yêu cầu xóa thành công sẽ kéo dài khoảng 90 ngày trước khi nội dung có thể xuất hiện lại trong SERPs.
Như vậy, trường hợp sử dụng có giá trị duy nhất ở đây là khi bạn cần chặn một trang khẩn cấp nhưng không thể lấy tài nguyên. Các biện pháp khác sẽ cần được thực hiện trước khi thời gian mất điện kết thúc nếu bạn muốn giữ trang ngoài chỉ mục.
Chỉ số phòng chống phình to : 1/5
Chỉ số kiểm soát thiệt hại phình to : 3/5
TL; DR
Làm cách nào để hủy một trang từ Google
Nhìn chung, phòng bệnh hơn chữa bệnh.
Một kiến trúc trang web được thiết kế chiến lược và chiến lược nội dung tập trung vào người dùng là cần thiết để thành công lâu dài trong SEO.
Điều này cần được hỗ trợ bằng cách sử dụng hợp lý các liên kết chính tắc và sử dụng hợp lý thẻ meta robot noindex để ngăn chặn chỉ số phình to.
Google có một bộ nhớ đặc biệt dài. Khi các trang được thu thập thông tin, Google có thể ngoan cố khi quên chúng. Điều này có thể làm cho deindexing một quá trình chậm chạp và tẻ nhạt.
Một khi bạn có một chiến lược deindexing thích hợp tại chỗ, hãy kiên nhẫn. Các kết quả có thể chậm để trở nên đáng chú ý, nhưng chúng sẽ có giá trị.
Xem thêm:
https://ggmedia.biz/huong-dan-toi-uu-toc-do-wordpree/để có thêm nhiều thông tin mới mẻ nhé