Số 09
TÚI CÀN KHÔN IT

KHAI THÁC TÀI NGUYÊN TRÊN INTERNET:
LÀM SAO TẢI FILE, TẢI ẢNH HAY CẢ LÔ WEBSITE?
LÊ HOÀN

KHI MỚI LÀM QUEN VỚI INTERNET, chúng ta thường dùng chức năng tải về (download) của trình duyệt theo kiểu “trong nhờ đục chịu”. Khi có nhiều kinh nghiệm hơn, ta lại muốn được chủ động trong việc tải file nhưng lại không biết dùng chương trình gì cho thuận tiện. e-CHÍP xin giới thiệu và hướng dẫn bạn cách dùng một số chương trình tải file hiệu quả, dựa theo kinh nghiệm lướt web “thâm niên” của người viết.

1. Tải file với trình duyệt:

- Internet Explorer (IE): Đây là trình duyệt thông dụng nhất (vì đi kèm với Windows) nhưng chức năng tải file thuộc loại “dở” nhất (có lẽ do Microsoft muốn chừa đất sống cho các hãng phần mềm khác?) vì các lý do sau:

* Với tốc độ đường truyền thấp, quá trình tải file thường bị ngắt nửa chừng, khiến cho file hỏng (điều này hay xảy ra khi kết nối qua đường điện thoại), buộc bạn phải tải lại từ đầu. Tệ nhất là IE “tỉnh bơ” như là đã hoàn thành tốt nhiệm vụ, cũng tạo ra file (với dung lượng “trời ơi” nào đó) trên ổ cứng như bình thường, mặc cho bạn “đoán già đoán non” nếu không sử dụng được file đã tải về (bạn phải so sánh dung lượng file đã tải với file gốc để biết có bị hỏng hay không!).

* Không cho biết địa chỉ chính xác của file đang tải nên mỗi lần muốn tải lại, phải vào đúng trang web có liên kết (link) của file. Đặc biệt, khi tải file nâng cấp cho Windows, IE không hề cho biết file nâng cấp được lấy từ đâu và được lưu ở đâu khi tải về (Microsoft có ý đồ gì khi “mập mờ” như vậy chăng?).

- Opera: Trình duyệt này tuy không hiển thị trang web “đẹp” bằng IE nhưng có tốc độ rất nhanh và phần tải file chắc chắn là hơn IE “xa lắc”. Mỗi khi bạn bấm chuột vào một liên kết file để tải về, Opera sẽ mở một cửa sổ mới, trong cửa sổ này bạn có thể biết địa chỉ nguồn của file đang tải, nơi lưu trữ trên đĩa cứng, dung lượng file, dung lượng đã tải.

Với tính năng Resume, Opera cho phép bạn tải tiếp tục sau khi tạm ngưng tải hay khi quá trình tải file bị “đứt” bất ngờ do cúp điện, nghẽn đường truyền... (tính năng này chỉ hoạt động khi server cũng hỗ trợ resume).

Lời khuyên: Nếu các bạn đang sử dụng IE, các bạn nên cài thêm Opera để sử dụng trong việc tải file. Opera sẽ giúp bạn tiết kiệm thời gian và công sức rất nhiều, đừng bao giờ giao công việc này cho IE trừ những trường hợp bất khả kháng. Và may mắn là Opera và IE có thể chạy song song một cách tốt đẹp.

2. Tải file với NetAnts (Phiên bản 1.25)

Đây là chương trình chuyên dùng để tải file về từ các server FTP và HTTP. Sau khi cài NetAnts, bạn có thể nhanh chóng gọi chương trình này khi đang duyệt web bằng biểu tượng trong Toolbar, hoặc với lệnh trong menu phím phải. Nếu được server hỗ trợ, NetAnts có thể tải lại tiếp tục (resume) sau khi bị tạm ngưng nửa chừng, do lỗi đường truyền hay theo chủ ý của bạn. Điểm nổi bật của NetAnts là có thể cắt file cần tải thành nhiều “gói” rồi tải các gói đó về cùng lúc, giống như khi bạn có nhiều đường kết nối (Multi Connections).

Tính năng này giúp tận dụng tối đa băng thông đường truyền khi có ít người kết nối và server cho phép, thí dụ: nếu server quy định băng thông cho mỗi kết nối là 5Kb và nếu băng thông đường truyền chưa sử dụng của server là 25Kb, NetAnts sẽ tự động “chiếm dụng” năm đường để tải năm gói cùng lúc (rất hiệu quả khi kết nối mạng bằng đường truyền tốc độ cao). Hiện có vài server đối phó với kiểu “bành trướng” này bằng cách quy định mỗi địa chỉ IP chỉ được phép tạo một kết nối duy nhất.

Khi sử dụng NetAnts, cần chú ý các điểm dưới đây:

- Xác lập phương thức hoạt động (Menu Option/Preferences)

* Trong bảng Connection:

Error Handle: Chỉ định số lần (hay luôn luôn) tái kết nối khi có lỗi (Max error retries/ Always retry) cùng thời gian chờ (giây) giữa hai lần tái kết nối khi server bận hoặc không kết nối được (Retry delay).

Timeout: Chỉ định thời gian chờ khi bị mất liên lạc với máy chủ, nếu quá thời gian nầy xem như đường truyền đã bị ngắt và chương trình sẽ tái kết nối lại.

Limit: Giới hạn số file cho phép tải cùng lúc (Max downloading jobs) nhằm khai thác tối đa đường truyền của máy bạn. Tuy nhiên, việc tải cùng lúc nhiều file chỉ có lợi khi mỗi file ở trên một server khác nhau.

* Bảng Job default: File: Chỉ định thư mục mặc định để NetAnts lưu giữ các file tải về (Download directory).

Misc: Chỉ định số lượng gói khi cắt file để tải về cùng lúc cho nhanh (khi server hỗ trợ chức năng Multi Connections).

Chọn mục Download immediately khi cần tiến hành tải ngay lập tức mỗi khi nhập địa chỉ file. Những file vượt quá số lượng quy định trong Connection/Limit sẽ tự động “xếp hàng” chờ đợi trong danh mục.

* Bảng Automation: Integrate with browser clicks: Tích hợp NetAnts vào trình duyệt web của mình. Sau này, chỉ cần bạn nhấn chuột lên một liên kết trên trang web, NetAnts sẽ lập tức xuất hiện để tiến hành tải về cho bạn.

Clipboard Monitor: Mỗi khi bạn chép (copy) một địa chỉ URL vào clipboard, NetAnts sẽ tự động chíp địa chỉ đó và hỏi bạn có muốn tải về hay không.

Capture files of type: Chỉ định các file liên kết để NetAnts nhận diện. Bạn có thể bổ sung thêm các phần tên mở rộng khác như: ra, ram...

* Bảng Advanced: Stop if server doesn’t support resume: Không tiến hành tải nếu server không hỗ trợ chức năng Resume.

Delete job from list after complete: Xóa tên file trong danh sách tải sau khi tải hoàn tất.

Hang Up after done downloading: Ngắt kết nối mạng sau khi tải hoàn tất. Exit/Shutdown after done downloading: Tự động đóng NetAnts hay tắt máy sau khi tải tất cả file trong danh sách.

* Bảng Schedule: Lập lịch tải file tự động cho NetAnts. Quy định thời gian bắt đầu tiến hành tải (Start download at) và thời gian kết thúc (Hang Up at).

* Bảng Dial Up: Bảng nầy cần phải xác lập để kết hợp với lịch tải file trong bảng Schedule. Khi đến thời gian định trước, NetAnts sẽ tự động kết nối, tải file trong danh sách về rồi tự động ngắt.

- Sử dụng: Bạn có thể truy cập nhanh chương trình để tải file trực tiếp bằng cách bấm vào liên kết file trong trang web với lệnh Download by NetAnts trong menu shortcut, bấm phím phải chuột vào liên kết file trong trang web. Bạn cũng có thể bấm nút Add a new job trên thanh toolbar để mở hộp thoại Add Job, rồi nhập địa chỉ vào ô URL. Chỉ định thư mục trên ổ cứng để lưu file trong ô Save As. Chú ý: NetAnts có thể làm việc được với một số địa chỉ theo dạng truy xuất cơ sở dữ liệu.

Sau khi chạy, NetAnts sẽ có một biểu tượng chương trình trong khay đồng hồ. Bấm phím phải chuột vào icon sẽ cho phép bạn thực hiện nhanh một số việc như: Mở hộp thoại tải file (Add job); mở cửa sổ chương trình (Show Main Windows); mở hộp thoại xác lập (Preferences); đóng chương trình (Exit).

Trong quá trình tải về, bạn có thể theo dõi tình trạng của từng file trong cửa sổ thông tin. Có hai bảng đáng chú ý: Bảng Block - Bạn chọn file cần xem thông tin để xem tình trạng tải file hiển thị theo dạng từng gói (block). Bảng Info - Thông tin chi tiết về file đang tải như: địa chỉ nguồn (Target), thư mục lưu trữ trên đĩa cứng (Local File), kích thước (File Size), dung lượng đã tải (Byte Received), còn lại (Byte Left) cũng như thời gian đã tải (Time Elapsed), thời gian còn lại (Time Left). Bảng nầy có hai thông số quan trọng: Server có hỗ trợ Resume hay không (Resume), và tốc độ tải file hiện tại (Current BPS).

Ngoài ra, trong thanh tình trạng dưới cùng màn hình cũng có các thông tin về tổng số file (phân biệt rõ đang tải và chờ tải), tốc độ tải và tổng số dung lượng đã tải trong phiên làm việc của NetAnts. Có một toolbar theo dõi thường trực tốc độ tải file trong phiên làm việc theo dạng biểu đồ thanh (tốc độ nầy là tổng của toàn bộ file đang tải). Bạn có thể đổi màu và tốc độ cập nhật của toolbar nầy qua menu Option/Options/Visual.

[Đầu trang]

3. Tải file với Getright (Phiên bản 4.5a):

Đây cũng là chương trình tải file tương tự như NetAnts, cho phép resume, cắt file thành nhiều gói, kết hợp tốt với trình duyệt... Tuy vậy, chức năng khác biệt và quan trọng nhất của chương trình này là hỗ trợ việc tải file ở nhiều server khác nhau (mirror). Điều này có nghĩa: Nếu file cần tải có nhiều bản sao (cùng tên, cùng dung lượng) trên nhiều server, GetRight có thể chia file thành nhiều gói để tải cùng lúc ở nhiều server, tự động lựa chọn server có tốc độ cao nhất để tải, tự động chuyển đổi server khác khi server hiện hành bị “tắt đài”,...

Để sử dụng tốt chức năng đặc biệt này, bạn cần chú ý các xác lập sau:

- Xác lập thông số hoạt động (Option/GetRight Configuration):

* Bảng Limits:

Files or segments at the same time: Chỉ định số lượng file hay gói có thể tải về cùng lúc.

Files at the same time from each FTP server: Chỉ định số lượng file tải về một lần trong mỗi server FTP.

Files at the same time from each HTTP server: Chỉ định số lượng file tải về một lần trong mỗi server HTTP.

* Bảng Mirror Search/Mirror Options/Auto-Segment: Chỉ định cách thức tự động tìm kiếm các server có chứa cùng một file và và số lượng gói tách ra từ một file để tải về cùng lúc.

- Sử dụng: Để mở chương trình và tiến hành tải file, bạn có thể bấm chuột vào liên kết trong trang web, chép địa chỉ URL vào clipboard. Khi chương trình đang chạy, bạn chọn menu File/Enter New URL rồi nhập địa chỉ file cần tải. Mỗi file đang tải có một cửa sổ nhỏ thông báo tình trạng và các chức năng điều khiển quá trình tải.

* Bạn có thể tạm ngưng tải hay tiếp tục tải bằng nút Pause/Resume.

* Với Options/Download liệt kê danh sách các server mirror và tốc độ của chúng: Bạn có thể chuyển đổi server, chỉ định cho tải ở một server duy nhất (Lock On Current Server).

* Trong Options/Segment, bạn có thể chỉ định số lượng gói cho file đang tải.

* Bạn mở hộp thoại Options/Mirror Manager để thêm, sửa địa chỉ mirror, kiểm tra tình trạng hoạt động và tốc độ của mirror.

Lời khuyên: Bạn có thể cài đặt cả hai chương trình NetAnts và GetRight, do mỗi chương trình đều có ưu điểm khác nhau. Thí dụ: NetAnts có thể truy xuất địa chỉ cơ sở dữ liệu để tìm file tải về, GetRight có thể tải file trên nhiều server mirror...

4. Tải ảnh với Web Pictures Downloader

Khi cần tải toàn bộ ảnh trong một website ảnh, hay muốn tải nhiều ảnh có trong trang web nào đó, chắc là bạn hết sức bực mình vì cứ phải thao tác chép về từng ảnh mà không thể làm khác hơn với trình duyệt đang sử dụng.

Web Pictures Downloader (WPD) của Kerosoft giúp bạn tải hàng loạt hình ảnh có dạng thức JPG và Gif từ internet về hết sức dễ dàng và nhanh chóng.

Trước khi sử dụng chương trình (dĩ nhiên là sau khi cài chương trình xong), bạn cần tìm hiểu một số tuỳ chọn để chương trình chạy “ngon lành” nhất:

- Mở menu Tools, chọn Options:

* Directory/Picture Names: Chỉ định thư mục lưu trữ các file ảnh tải về.

* Search: Quy định số mức (Max Depth) tính từ địa chỉ đầu tiên để WPD tìm và tải file ảnh về. Có nhiều trang web sử dụng hình mẩu thu nhỏ để liên kết với ảnh chính (khi bấm chuột vào ảnh nhỏ, bạn mới xem được ảnh chính lớn hơn), trong trường hợp này, bạn nên chọn mục Extended Depth để tải luôn ảnh chính. Bạn có thể chỉ định dạng thức file và kích thước, dung lượng file để hạn chế số lượng ảnh tải về.

* Connection: Chỉ định số “luồng” để tìm và tải về cùng lúc (Max Threads) nếu server cho phép.

- Tải hình: Bạn nhập địa chỉ web site vào ô URL trên thanh Toolbar rồi bấm nút Run, bạn có thể chọn cho tải ảnh mẩu thu nhỏ hay ảnh chính, hay toàn bộ ảnh bằng cách bấm vào mũi tên bên cạnh Run. Bạn có thể ngừng tải nửa chừng để lúc khác tải tiếp...

[Đầu trang]

5. Tải toàn bộ Website với Webcopier

WebCopier có khả năng tải toàn bộ nội dung một website giống như Teleport, WebZip, SiteSnagger.

Chương trình này rất hữu ích khi bạn muốn sao chép các website trên internet về máy cá nhân làm tư liệu để có thể khảo sát tỉ mỉ ngay trên máy tính của mình mà không cần kết nối internet.

- Bước 1: Menu Project/Project Settings

Để sử dụng chương trình, trước tiên bạn cần xác lập các thông số để chương trình làm “chuẩn” khi chạy.

* Bảng General:

Title: Đặt tên cho dự án tải website này.

Save in Directory: Thư mục lưu trữ các file của website tải về.

Address (URL) of the website: Địa chỉ website cần tải về.

Authentication: Khai báo tên và mật khẩu để truy cập website, bạn có thể để trống khi website không đòi hỏi.

* Bảng Download:

Speed: Số lượng file có thể tải về cùng lúc.

Max...: Chỉ định dung lượng đĩa cứng tối đa (Total Disk Space) dùng để lưu trữ, số lượng file tối đa (Number of Files), kích thước tối đa/tối thiểu của file (File Size) và thời gian tối đa (Total Time) dành cho việc tải về.

* Bảng Contents:

Update during Download: Tự động cập nhật khi file có thay đổi trong thời gian tải.

Show: Hiển thị toàn bộ file (All Files) hay chỉ hiển thị file HTML (Only Text (HTML) Files).

* Bảng Advanced /Download:

Level Limits: Chỉ định số mức liên kết để tải về (tính từ trang đầu tiên), thí dụ: mức 0 là chỉ tải một trang, mức 1 là trang đầu tiên và tất cả các trang có liên kết trong trang này.

Main Links: Các file liên kết trong cùng tên miền (domain) với trang đầu tiên.

Offsite Links: Các file liên kết không cùng tên miền.

* Bảng Advanced/File Filters: Chỉ định các kiểu file để chương trình tải về (đánh dấu chọn) hay loại bỏ (không đánh dấu) khi tải.

* Bảng Advanced / URL Filters: Nếu bạn chỉ muốn tải các file có trong website chính thì chọn mục The starting Server only. Nếu muốn tải luôn file ở các website khác mà trong website chính có liên kết tới, chọn mục All Servers.

- Bước 2: Download

Để tiến hành tải về, bạn chọn menu Project/Start Download. Trong khi tải, chương trình sẽ hiển thị thông tin và bạn có thể xem file trực tiếp trong cửa sổ chương trình.

Bạn có thể tạm ngưng tải bằng cách chọn menu Project/Stop Download hay bấm nút Stop trong hộp thoại Download. Khi cần tải tiếp, bạn chọn menu Project/Start Download và chọn tiếp mục Continue previous download trong hộp thoại Choose the Download Type.

- Bước 3: Xem trang web Trong khi đang tải, bạn có thể xem trang web đã tải về bằng cách bấm kép chuột vào trang web liệt kê trong cửa sổ Contents.

Nếu muốn xem trang web của website khác, bạn chọn menu Browser/Go To rồi gõ địa chỉ URL. Ngoài ra, WebCopier còn cho phép bạn lập lịch để tải tự động (schedule).

[Đầu trang]
Trang chủ
Thư ngỏ
Nội lực "Peter Pan"
Cầu nối Intel Việt Nam
Chuyện trong tuần
Nhóm Frontpage
Cõi người ta
Kim cương doanh nghiệp
Bình luận thị trường
Cõi Mô-bai
Chuyên đề
Bổ ngửa
Nuôi hồn Robot
Túi càn khôn IT
Hồ lô biến
Cảm về Game
Nhật ký e-CHÍP
Bản quyền VASC Orient, Công ty phát triển phần mềm VASC
99 Triệu Việt Vương HN; Tel: (04) 9782235 • email: echip@vasc.com.vn