|
TÚI CÀN KHÔN IT |
|
KHAI THÁC TÀI
NGUYÊN TRÊN INTERNET:
LÀM SAO TẢI FILE, TẢI ẢNH HAY CẢ LÔ WEBSITE?
LÊ HOÀN |
|
KHI MỚI LÀM QUEN VỚI INTERNET, chúng ta thường
dùng chức năng tải về (download) của trình duyệt
theo kiểu “trong nhờ đục chịu”. Khi có nhiều kinh
nghiệm hơn, ta lại muốn được chủ động trong việc tải
file nhưng lại không biết dùng chương trình gì cho
thuận tiện. e-CHÍP xin giới thiệu và hướng dẫn bạn
cách dùng một số chương trình tải file hiệu quả, dựa
theo kinh nghiệm lướt web “thâm niên” của người
viết. |
|
1. Tải file với trình
duyệt: |
|
-
Internet Explorer (IE): Đây là trình duyệt thông
dụng nhất (vì đi kèm với Windows) nhưng chức năng
tải file thuộc loại “dở” nhất (có lẽ do Microsoft
muốn chừa đất sống cho các hãng phần mềm khác?) vì
các lý do sau: |
|
* Với tốc độ đường truyền thấp, quá trình tải file
thường bị ngắt nửa chừng, khiến cho file hỏng (điều
này hay xảy ra khi kết nối qua đường điện thoại),
buộc bạn phải tải lại từ đầu. Tệ nhất là IE “tỉnh
bơ” như là đã hoàn thành tốt nhiệm vụ, cũng tạo ra
file (với dung lượng “trời ơi” nào đó) trên ổ cứng
như bình thường, mặc cho bạn “đoán già đoán non” nếu
không sử dụng được file đã tải về (bạn phải so sánh
dung lượng file đã tải với file gốc để biết có bị
hỏng hay không!). |
|
* Không cho biết địa chỉ chính xác của file đang tải nên
mỗi lần muốn tải lại, phải vào đúng trang web có liên
kết (link) của file. Đặc biệt, khi tải file nâng cấp cho
Windows, IE không hề cho biết file nâng cấp được lấy từ
đâu và được lưu ở đâu khi tải về (Microsoft có ý đồ gì
khi “mập mờ” như vậy chăng?). |
|
-
Opera: Trình duyệt này tuy không hiển thị trang web
“đẹp” bằng IE nhưng có tốc độ rất nhanh và phần tải
file chắc chắn là hơn IE “xa lắc”. Mỗi khi bạn bấm
chuột vào một liên kết file để tải về, Opera sẽ mở
một cửa sổ mới, trong cửa sổ này bạn có thể biết địa
chỉ nguồn của file đang tải, nơi lưu trữ trên đĩa
cứng, dung lượng file, dung lượng đã tải. |
|
Với tính năng Resume, Opera cho phép bạn tải tiếp
tục sau khi tạm ngưng tải hay khi quá trình tải file
bị “đứt” bất ngờ do cúp điện, nghẽn đường truyền...
(tính năng này chỉ hoạt động khi server cũng hỗ trợ
resume). |
|
Lời khuyên: Nếu các bạn đang sử dụng IE, các bạn nên
cài thêm Opera để sử dụng trong việc tải file. Opera
sẽ giúp bạn tiết kiệm thời gian và công sức rất
nhiều, đừng bao giờ giao công việc này cho IE trừ
những trường hợp bất khả kháng. Và may mắn là Opera
và IE có thể chạy song song một cách tốt đẹp. |
|
2. Tải file với
NetAnts (Phiên bản 1.25) |
|
Đây là chương trình chuyên dùng để tải file về từ
các server FTP và HTTP. Sau khi cài NetAnts, bạn có
thể nhanh chóng gọi chương trình này khi đang duyệt
web bằng biểu tượng trong Toolbar, hoặc với lệnh
trong menu phím phải. Nếu được server hỗ trợ,
NetAnts có thể tải lại tiếp tục (resume) sau khi bị
tạm ngưng nửa chừng, do lỗi đường truyền hay theo
chủ ý của bạn. Điểm nổi bật của NetAnts là có thể
cắt file cần tải thành nhiều “gói” rồi tải các gói
đó về cùng lúc, giống như khi bạn có nhiều đường kết
nối (Multi Connections). |
|
Tính năng này giúp tận dụng tối đa băng thông đường
truyền khi có ít người kết nối và server cho phép,
thí dụ: nếu server quy định băng thông cho mỗi kết
nối là 5Kb và nếu băng thông đường truyền chưa sử
dụng của server là 25Kb, NetAnts sẽ tự động “chiếm
dụng” năm đường để tải năm gói cùng lúc (rất hiệu
quả khi kết nối mạng bằng đường truyền tốc độ cao).
Hiện có vài server đối phó với kiểu “bành trướng”
này bằng cách quy định mỗi địa chỉ IP chỉ được phép
tạo một kết nối duy nhất. |
|
Khi sử dụng NetAnts, cần chú ý các điểm dưới đây: |
|
- Xác lập phương thức hoạt động (Menu
Option/Preferences) |
|
* Trong bảng Connection: |
|
Error
Handle: Chỉ định số lần (hay luôn luôn) tái
kết nối khi có lỗi (Max error retries/ Always retry)
cùng thời gian chờ (giây) giữa hai lần tái kết nối
khi server bận hoặc không kết nối được (Retry
delay). |
|
Timeout: Chỉ định thời
gian chờ khi bị mất liên lạc với máy chủ, nếu quá
thời gian nầy xem như đường truyền đã bị ngắt và
chương trình sẽ tái kết nối lại. |
|
Limit: Giới hạn số file
cho phép tải cùng lúc (Max downloading jobs) nhằm
khai thác tối đa đường truyền của máy bạn. Tuy
nhiên, việc tải cùng lúc nhiều file chỉ có lợi khi
mỗi file ở trên một server khác nhau. |
|
* Bảng Job default: File: Chỉ định thư mục mặc định
để NetAnts lưu giữ các file tải về (Download
directory). |
|
Misc: Chỉ định số lượng
gói khi cắt file để tải về cùng lúc cho nhanh (khi
server hỗ trợ chức năng Multi Connections). |
|
Chọn
mục Download immediately khi cần tiến hành tải ngay
lập tức mỗi khi nhập địa chỉ file. Những file vượt
quá số lượng quy định trong Connection/Limit sẽ tự
động “xếp hàng” chờ đợi trong danh mục. |
|
* Bảng Automation: Integrate with browser
clicks: Tích hợp NetAnts vào trình duyệt web của
mình. Sau này, chỉ cần bạn nhấn chuột lên một liên
kết trên trang web, NetAnts sẽ lập tức xuất hiện để
tiến hành tải về cho bạn. |
|
Clipboard Monitor: Mỗi
khi bạn chép (copy) một địa chỉ URL vào clipboard,
NetAnts sẽ tự động chíp địa chỉ đó và hỏi bạn có
muốn tải về hay không. |
|
Capture files of type:
Chỉ định các file liên kết để NetAnts nhận diện. Bạn
có thể bổ sung thêm các phần tên mở rộng khác như:
ra, ram... |
|
* Bảng Advanced: Stop if server doesn’t
support resume: Không tiến hành tải nếu server không
hỗ trợ chức năng Resume. |
|
Delete job from list after
complete: Xóa tên file trong danh sách tải
sau khi tải hoàn tất. |
|
Hang Up after done downloading:
Ngắt kết nối mạng sau khi tải hoàn tất.
Exit/Shutdown after done downloading: Tự động đóng
NetAnts hay tắt máy sau khi tải tất cả file trong
danh sách. |
|
* Bảng Schedule: Lập lịch tải file tự động
cho NetAnts. Quy định thời gian bắt đầu tiến hành
tải (Start download at) và thời gian kết thúc (Hang
Up at). |
|
* Bảng Dial Up: Bảng nầy cần phải xác lập để
kết hợp với lịch tải file trong bảng Schedule. Khi
đến thời gian định trước, NetAnts sẽ tự động kết
nối, tải file trong danh sách về rồi tự động ngắt. |
|
- Sử dụng: Bạn có thể truy cập nhanh chương trình để
tải file trực tiếp bằng cách bấm vào liên kết file
trong trang web với lệnh Download by NetAnts trong
menu shortcut, bấm phím phải chuột vào liên kết file
trong trang web. Bạn cũng có thể bấm nút Add a new
job trên thanh toolbar để mở hộp thoại Add Job, rồi
nhập địa chỉ vào ô URL. Chỉ định thư mục trên ổ cứng
để lưu file trong ô Save As. Chú ý: NetAnts có thể
làm việc được với một số địa chỉ theo dạng truy xuất
cơ sở dữ liệu. |
|
Sau khi chạy, NetAnts sẽ có một biểu tượng chương
trình trong khay đồng hồ. Bấm phím phải chuột vào
icon sẽ cho phép bạn thực hiện nhanh một số việc
như: Mở hộp thoại tải file (Add job); mở cửa sổ
chương trình (Show Main Windows); mở hộp thoại xác
lập (Preferences); đóng chương trình (Exit). |
|
Trong quá trình tải về, bạn có thể theo dõi tình
trạng của từng file trong cửa sổ thông tin. Có hai
bảng đáng chú ý: Bảng Block - Bạn chọn file cần xem
thông tin để xem tình trạng tải file hiển thị theo
dạng từng gói (block). Bảng Info - Thông tin chi
tiết về file đang tải như: địa chỉ nguồn (Target),
thư mục lưu trữ trên đĩa cứng (Local File), kích
thước (File Size), dung lượng đã tải (Byte
Received), còn lại (Byte Left) cũng như thời gian đã
tải (Time Elapsed), thời gian còn lại (Time Left).
Bảng nầy có hai thông số quan trọng: Server có hỗ
trợ Resume hay không (Resume), và tốc độ tải file
hiện tại (Current BPS). |
|
Ngoài ra, trong thanh tình trạng dưới cùng màn hình
cũng có các thông tin về tổng số file (phân biệt rõ
đang tải và chờ tải), tốc độ tải và tổng số dung
lượng đã tải trong phiên làm việc của NetAnts. Có
một toolbar theo dõi thường trực tốc độ tải file
trong phiên làm việc theo dạng biểu đồ thanh (tốc độ
nầy là tổng của toàn bộ file đang tải). Bạn có thể
đổi màu và tốc độ cập nhật của toolbar nầy qua menu
Option/Options/Visual. |
|
|
|
3. Tải file
với Getright (Phiên bản 4.5a): |
|
Đây
cũng là chương trình tải file tương tự như NetAnts,
cho phép resume, cắt file thành nhiều gói, kết hợp
tốt với trình duyệt... Tuy vậy, chức năng khác biệt
và quan trọng nhất của chương trình này là hỗ trợ
việc tải file ở nhiều server khác nhau (mirror).
Điều này có nghĩa: Nếu file cần tải có nhiều bản sao
(cùng tên, cùng dung lượng) trên nhiều server,
GetRight có thể chia file thành nhiều gói để tải
cùng lúc ở nhiều server, tự động lựa chọn server có
tốc độ cao nhất để tải, tự động chuyển đổi server
khác khi server hiện hành bị “tắt đài”,... |
|
Để sử dụng tốt chức năng đặc biệt này, bạn cần chú ý
các xác lập sau: |
|
- Xác lập thông số hoạt động (Option/GetRight
Configuration): |
|
* Bảng Limits: |
|
Files or segments at the same
time: Chỉ định số lượng file hay gói có thể
tải về cùng lúc. |
|
Files at the same time from
each FTP server: Chỉ định số lượng file tải
về một lần trong mỗi server FTP. |
|
Files at the same time from each HTTP server: Chỉ
định số lượng file tải về một lần trong mỗi server
HTTP. |
|
* Bảng Mirror Search/Mirror Options/Auto-Segment:
Chỉ định cách thức tự động tìm kiếm các server có
chứa cùng một file và và số lượng gói tách ra từ một
file để tải về cùng lúc. |
|
- Sử dụng: Để mở chương trình và tiến hành tải file,
bạn có thể bấm chuột vào liên kết trong trang web,
chép địa chỉ URL vào clipboard. Khi chương trình
đang chạy, bạn chọn menu File/Enter New URL rồi nhập
địa chỉ file cần tải. Mỗi file đang tải có một cửa
sổ nhỏ thông báo tình trạng và các chức năng điều
khiển quá trình tải. |
|
* Bạn có thể tạm ngưng tải hay tiếp tục tải bằng nút
Pause/Resume. |
|
*
Với Options/Download liệt kê danh sách các server
mirror và tốc độ của chúng: Bạn có thể chuyển đổi
server, chỉ định cho tải ở một server duy nhất (Lock
On Current Server). |
|
* Trong Options/Segment, bạn có thể chỉ định số
lượng gói cho file đang tải. |
|
* Bạn mở hộp thoại Options/Mirror Manager để thêm,
sửa địa chỉ mirror, kiểm tra tình trạng hoạt động và
tốc độ của mirror. |
|
Lời khuyên: Bạn có thể cài đặt cả hai chương trình
NetAnts và GetRight, do mỗi chương trình đều có ưu
điểm khác nhau. Thí dụ: NetAnts có thể truy xuất địa
chỉ cơ sở dữ liệu để tìm file tải về, GetRight có
thể tải file trên nhiều server mirror... |
|
4. Tải ảnh
với Web Pictures Downloader |
|
Khi
cần tải toàn bộ ảnh trong một website ảnh, hay muốn
tải nhiều ảnh có trong trang web nào đó, chắc là bạn
hết sức bực mình vì cứ phải thao tác chép về từng
ảnh mà không thể làm khác hơn với trình duyệt đang
sử dụng. |
|
Web Pictures Downloader (WPD) của Kerosoft giúp bạn
tải hàng loạt hình ảnh có dạng thức JPG và Gif từ
internet về hết sức dễ dàng và nhanh chóng. |
|
Trước khi sử dụng chương trình (dĩ nhiên là sau khi
cài chương trình xong), bạn cần tìm hiểu một số tuỳ
chọn để chương trình chạy “ngon lành” nhất: |
|
- Mở menu Tools, chọn Options: |
|
* Directory/Picture Names: Chỉ định thư mục
lưu trữ các file ảnh tải về. |
|
* Search: Quy định số mức (Max Depth) tính từ
địa chỉ đầu tiên để WPD tìm và tải file ảnh về. Có
nhiều trang web sử dụng hình mẩu thu nhỏ để liên kết
với ảnh chính (khi bấm chuột vào ảnh nhỏ, bạn mới
xem được ảnh chính lớn hơn), trong trường hợp này,
bạn nên chọn mục Extended Depth để tải luôn ảnh
chính. Bạn có thể chỉ định dạng thức file và kích
thước, dung lượng file để hạn chế số lượng ảnh tải
về. |
|
* Connection: Chỉ định số “luồng” để tìm và
tải về cùng lúc (Max Threads) nếu server cho phép. |
|
- Tải hình: Bạn nhập địa chỉ web site vào ô URL trên
thanh Toolbar rồi bấm nút Run, bạn có thể chọn cho
tải ảnh mẩu thu nhỏ hay ảnh chính, hay toàn bộ ảnh
bằng cách bấm vào mũi tên bên cạnh Run. Bạn có thể
ngừng tải nửa chừng để lúc khác tải tiếp... |
|
|
|
5. Tải toàn
bộ Website với Webcopier |
|
WebCopier có khả năng tải toàn bộ nội dung một
website giống như Teleport, WebZip, SiteSnagger. |
|
Chương trình này rất hữu ích khi bạn muốn sao chép
các website trên internet về máy cá nhân làm tư liệu
để có thể khảo sát tỉ mỉ ngay trên máy tính của mình
mà không cần kết nối internet. |
|
- Bước 1: Menu Project/Project Settings |
|
Để sử dụng chương trình, trước tiên bạn cần xác lập
các thông số để chương trình làm “chuẩn” khi chạy. |
|
* Bảng General: |
|
Title: Đặt tên cho dự
án tải website này. |
|
Save in Directory: Thư
mục lưu trữ các file của website tải về. |
|
Address (URL) of the website:
Địa chỉ website cần tải về. |
|
Authentication: Khai
báo tên và mật khẩu để truy cập website, bạn có thể
để trống khi website không đòi hỏi. |
|
* Bảng Download: |
|
Speed: Số lượng file có thể tải về cùng lúc. |
|
Max...: Chỉ định dung
lượng đĩa cứng tối đa (Total Disk Space) dùng để lưu
trữ, số lượng file tối đa (Number of Files), kích
thước tối đa/tối thiểu của file (File Size) và thời
gian tối đa (Total Time) dành cho việc tải về. |
|
* Bảng Contents: |
|
Update during Download:
Tự động cập nhật khi file có thay đổi trong thời
gian tải. |
|
Show:
Hiển thị toàn bộ file (All Files) hay chỉ hiển thị
file HTML (Only Text (HTML) Files). |
|
* Bảng Advanced /Download: |
|
Level Limits: Chỉ định
số mức liên kết để tải về (tính từ trang đầu tiên),
thí dụ: mức 0 là chỉ tải một trang, mức 1 là trang
đầu tiên và tất cả các trang có liên kết trong trang
này. |
|
Main Links: Các file
liên kết trong cùng tên miền (domain) với trang đầu
tiên. |
|
Offsite Links: Các file
liên kết không cùng tên miền. |
|
* Bảng Advanced/File Filters: Chỉ định các
kiểu file để chương trình tải về (đánh dấu chọn) hay
loại bỏ (không đánh dấu) khi tải. |
|
*
Bảng Advanced / URL Filters: Nếu bạn chỉ muốn
tải các file có trong website chính thì chọn mục The
starting Server only. Nếu muốn tải luôn file ở các
website khác mà trong website chính có liên kết tới,
chọn mục All Servers. |
|
- Bước 2: Download |
|
Để tiến hành tải về, bạn chọn menu Project/Start
Download. Trong khi tải, chương trình sẽ hiển thị
thông tin và bạn có thể xem file trực tiếp trong cửa
sổ chương trình. |
|
Bạn có thể tạm ngưng tải bằng cách chọn menu
Project/Stop Download hay bấm nút Stop trong hộp
thoại Download. Khi cần tải tiếp, bạn chọn menu
Project/Start Download và chọn tiếp mục Continue
previous download trong hộp thoại Choose the
Download Type. |
|
- Bước 3: Xem trang web Trong khi đang tải, bạn có
thể xem trang web đã tải về bằng cách bấm kép chuột
vào trang web liệt kê trong cửa sổ Contents. |
|
Nếu muốn xem trang web của website khác, bạn chọn
menu Browser/Go To rồi gõ địa chỉ URL. Ngoài ra,
WebCopier còn cho phép bạn lập lịch để tải tự động
(schedule). |
|
|