Hôm nay, Thứ 6 19/04/24 8:39

Thời gian được tính theo giờ UTC + 7 Giờ




Tạo chủ đề mới Gửi bài trả lời  [ 1 bài viết ] 
Người gửi Nội dung
Gửi bàiĐã gửi: Thứ 7 16/11/19 15:40 
Ngoại tuyến

Ngày tham gia: Thứ 2 10/12/18 19:33
Bài viết: 187
Có bao giờ bạn đọc được vài tip hoặc trick trên internet nói về file robots.txt để tối ưu SEO hiệu quả chưa?

File robots.txt có tác dụng dẫn đường và chỉ lối cho bộ máy tìm kiếm.

Rằng nó sẽ được và không được thu thập thông tin gì trên website của bạn.

Điều đó đã khiến nó thực sự rất quan trọng cho SEO.

Trong bài viết này tôi sẽ hướng dẫn bạn làm thế nào để tạo một file robots.txt để tối ưu SEO hiệu quả.

file robots.txt là gì
File robots.txt là gì
Robots.txt là một file dạng text mà khi xây dựng website bạn có thể tạo ra để nói cho những con bọ của bộ máy tìm kiếm rằng.

Làm thế nào để thu thập thông tin và index các trang trên website đó.

Đọc thêm bài Crawl và Index là gì? Cách mà Google đang thu thập thông tin website của bạn

Bạn có thể tìm thấy file robots.txt ở thư mực gốc của website hay còn gọi là folder chính của website đó.

Về cơ bản một file robots.txt sẽ có dạng như này:

1
User-agent: [user-agent name]
2
Disallow: [URL string not to be crawled]
3

4
User-agent: [user-agent name]
5
Allow: [URL string to be crawled]
6

7

8
Sitemap: [URL of your XML Sitemap]
Bạn có thêm nhiều dòng khác trong cấu trúc trên để allow hoặc disallow một đường dẫn cụ thể nào đó và thêm nhiều sitemap khác.

Nếu bạn không muốn disallow một URL nào cả, thì các con bọ của công cụ tìm kiếm sẽ được phép thu thập tất cả mọi thứ trên website đó.

Đây là một ví dụ về file robots.txt cơ bản hay sử dụng trong WordPress:

1
User-Agent: *
2
Allow: /wp-content/uploads/
3
Disallow: /wp-content/plugins/
4
Disallow: /wp-admin/
5

6
Sitemap: https://example.com/sitemap_index.xml
Trong ví dụ trên, tôi đã cho phép công cụ tìm kiếm thu thập thông tin và index file có trong thư mục uploads.

Sau đó thì tôi lại không cho phép nó thu thập 2 folder plugins và wp-admin và cuối cùng là thêm sitemap

Bạn có cần đến file robots.txt cho website WordPress không?
Mặc định thì kể cả bạn không có file này thì công cụ tìm kiếm nó vẫn index website.

Tuy nhiên đôi khi có một số file quan trọng bạn không muốn nó bị lộ thông tin ra ngoài thì đây là lúc cần nó.

Nếu bạn là một người mới bắt đầu và mới xây dựng blog với số lượng nội dung ít ỏi thì đây chắc chắn không phải vấn đề bạn cần để ý.

Nhưng dần dần khi website bạn phát triển có nhiều nội dung hơn, nhiều organic traffic hơn.

Thì bạn sẽ cần phải để ý về vấn đề số lượng thông tin bị thu thập.

Và đây là lý do tại sao file robots.txt lại quan trọng đến vậy

Các con bọ của công cụ tìm kiếm có một giới hạn nhất định cho mỗi website.

Có nghĩa là mỗi lần đi chúng sẽ thu thập một số lượng page nhất định trên website đó.

Nếu nó vẫn chưa thu thập xong hết tất cả các page thì lần sau nó sẽ quay lại và tiếp tục.

Vì vậy mà website với lượng bài viết lớn thì sẽ có thể việc index sẽ bị ảnh hưởng và chậm hơn.

Để khác phục điều này thì bạn có thể disallow một số page không cần thiết trong WordPress như admin, folder plugins và themes.

Như vậy là bạn đã bớt được số lượng thông tin mà các con bọ không cần thiết phải thu thập, và nó sẽ khiến những nội dung quan trọng được index nhanh hơn.

Còn trong một số trường hợp đặc biệt bạn còn có thể ngăn công cụ tìm kiếm không index một số Page hoặc Post nào đó trên website của bạn.

Mặc dù nó không phải là cách tốt nhất để che dấu nội dung đó, nhưng nó cũng khá hiệu quả để không bị tìm thấy trên kết quả tìm kiếm.

Một số ví dụ về file robots.txt mà bạn có thể sử dụng
Một số blog có file robots.txt khá đơn giản, mỗi website có một nội dung khác nhau tùy vào nhu cầu cụ thể của họ

1
User-agent: *
2
Disallow:
3

4
Sitemap: http://www.example.com/post-sitemap.xml
5
Sitemap: http://www.example.com/page-sitemap.xml
File robots.txt trên cho phép tất cả các con bot thu thập tất cả các thông tin trên website đó và có chứa thêm Sitemap XML.

Nhân tiện nếu bạn chưa biết tạo sitemap hãy xem hướng dẫn cách tạo XML Sitemap

Nếu bạn đang sử dụng WordPress Diều Hâu gợi ý bạn sử dụng file robots.txt có dạng như sau:

1
User-Agent: *
2
Allow: /wp-content/uploads/
3
Disallow: /wp-content/plugins/
4
Disallow: /wp-admin/
5
Disallow: /readme.html
6
Disallow: /refer/
7

8
Sitemap: http://www.example.com/post-sitemap.xml
9
Sitemap: http://www.example.com/page-sitemap.xml
Với dạng này cho phép công cụ tìm kiếm thu thập tất cả các file có trong thư mục uploads như ảnh.

Và disallow file plugins, khu vực admin, file readme, và affiliate link.

Nhớ thêm sitemap vào robots.txt để Google có thể dễ dàng thu thập mọi page đang có trên website nhé.
http://bit.ly/2OfIZBe
Giờ thì bạn đã hiểu cơ bản file robots.txt là gì và nó có cấu trúc như thế nào.

Làm thế nào để tạo file robots.txt trong WordPress
Có 2 cách để tạo file robots.txt trong WordPress, nói chung là đều khá đơn giản. Trong bài viết này tôi sẽ hướng dẫn bạn cả 2 cách.

Cách 1: Tạo file robots.txt bằng Yoast SEO plugin
Nếu bạn đang sử dụng Yoast SEO thì nó có sẵn tính năng tạo file robots.txt cho bạn.

Bạn có thể tạo và chỉnh sửa trực tiếp từ khu vực admin.

Đơn giản đi đến menu SEO » Tools và chọn File Editor


Đầu trang
 Xem thông tin cá nhân  
 
Hiển thị những bài viết cách đây:  Sắp xếp theo  
Tạo chủ đề mới Gửi bài trả lời  [ 1 bài viết ] 

Thời gian được tính theo giờ UTC + 7 Giờ


Ai đang trực tuyến?

Đang xem chuyên mục này: Không có thành viên nào đang trực tuyến5 khách


Bạn không thể tạo chủ đề mới trong chuyên mục này.
Bạn không thể trả lời bài viết trong chuyên mục này.
Bạn không thể sửa những bài viết của mình trong chuyên mục này.
Bạn không thể xoá những bài viết của mình trong chuyên mục này.
Bạn không thể gửi tập tin đính kèm trong chuyên mục này.

Tìm kiếm với từ khoá:
Chuyển đến:  
cron
Chứng nhận thanh toán bảo đảm

CÔNG TY TNHH DỊCH VỤ HÀNG HOÁ TRỰC TUYẾN

Diễn đàn sử dụng phần mềm phpBB® Forum


Chợ xây dựng Hà nội: Công ty TNHH Thương mại Dương Linh

Showroom: Số 1B, Ngõ 5, tổ 19, thị trấn Cầu Diễn, Huyện Từ Liêm, Thành phố Hà nội

Tel: 04.37737548; Fax: 04.38370082

Email Phòng kinh doanh: sale@choxaydung.vn

Chợ xây dựng Sài Gòn: Công ty TNHH SX-TM Đăng Hải

Địa chỉ: Số 140, Tô Hiến Thành, P15, Quận 10, Tp.HCM

Tel: 08.38620524; Fax: 08.38633011;

Email: saigonRep@choxaydung.vn