Thứ Ba, 27 tháng 5, 2008

VS3 Build 10: Dạng trang duyệt trong cấu hình luồng tải

Dạng trang duyệt là một dạng mẫu thức chung để chương trình tải (Crawler) dựa vào đó mà đi vào những liên kết sâu hơn trong website.

1 nhận xét:

 1. Ví dụ: Trên bề mặt báo Tuổi trẻ, nếu tôi muốn chương trình tải đi vào từng chuyên mục con, tôi cần tìm ra mẫu thức chung để cung cấp giá trị ở dạng trang duyệt.
  Mục Giáo dục có url là :
  http://www.tuoitre.com.vn/Tianyon/Index.aspx?ChannelID=13
  Mục Kinh tế có url là:
  http://www.tuoitre.com.vn/Tianyon/Index.aspx?ChannelID=11
  Như vậy dạng mẫu thức chung sẽ là:
  http://www.tuoitre.com.vn/Tianyon/Index.aspx?ChannelID=*

  Những giá trị (phần) không cố định được thay thế phần bằng dấu (*).

  Ví dụ: Với báo Vietnamnet.vn ta có:
  Mục Quốc tế : http://vietnamnet.vn/thegioi/
  Mục Văn hóa: http://vietnamnet.vn/vanhoa/
  Vậy mẫu trang duyệt có thể cung cấp là: http://vietnamnet.vn/*/

  Có thể cung cấp rất nhiều dạng trang duyệt. Khi đó chương trình tải sẽ so sánh các liên kết có được rồi quyết định đi vào sâu hay không. Dạng trang duyệt là một giá trị không bắt buộc. Nó dùng để tối ưu chương trình tải. Nó trợ giúp chương trình tải chỉ tập trung vào những nơi có dữ liệu cần lấy.
  Ví dụ: +  Trong website http://dantri.com.vn/news/ có rất nhiều các chuyên mục con như: Sự kiện trong ngày, Thế giới, Giáo dục-Khuyến học, Giải trí....với các tên miền hay địa chỉ URL khác nhau như sau:

  Thế giới: http://dantri.com.vn/Thegioi.vip
  Giải trí: http://dantri.com.vn/giaitri.vip
  Sức khỏe: http://dantri.com.vn/suckhoe.vip

   Ba chuyên mục của website http://dantri.com.vn/news/ có các phần http://dantri.com.vn/ và phần .vip là giống nhau còn khác nhau các phần có chữ màu đỏ là Thegioi, giaitri, suckhoe. Khi đó ta thay thế chúng bằng dấu (*) , như vậy dạng trang duyệt là http://dantri.com.vn/*.vip.
  Nếu muốn chương trình tải tiếp tục đi vào sâu bên trong nữa, chẳng hạn:
  Thế giới: http://dantri.com.vn/Thegioi/Trang-3.vip
  Giải trí: http://dantri.com.vn/giaitri/Trang-3.vip
  Sức khỏe: http://dantri.com.vn/suckhoe/Trang-2.vip
  Phần khác nhau bao gồm: Thegioi, giaitri, suckhoe, Trang-3, Trang-2. Ta thay thế chúng bằng dấu (*) . Ta có thêm dạng trang duyệt là http://dantri.com.vn/*/*.vip .

  Dùng chuột giữa để thêm dạng trang duyệt vào danh sách dạng trang duyệt.

  Trả lờiXóa

nhudinhthuan@gmail.com