MozTW 討論區 https://forum.moztw.org/ |
|
想要尋找可以抓取網頁全部資料的軟體 https://forum.moztw.org/viewtopic.php?f=11&t=16962 |
第 1 頁 (共 1 頁) |
發表人: | tsungchan [ 2006-12-20, 11:06 ] |
文章主題 : | 想要尋找可以抓取網頁全部資料的軟體 |
我有找過,有一個 Teleport Pro 的特色包括: 1. 可讀取各式 HTML 4.0、CSS 2.0 及 DHTML;並且執行一些 Javascript 分析 2. Java applet 擷取功能 3. 可擷取密碼保護的站台、FTP 檔案 4. 排程功能:讓你排定在任何時間,使用任何方式的連線來抓取站臺。你可以將數個抓取行程依序排列,下一個行程會在上一個行程結束後才開始執行 5. 自動連線/離線/重新連線系統:讓 Teleport 為你掌握撥接網際網路連線,所以你可以節省電話費和連線時間 6. 可調整的站臺內部和站臺外部抓取深度。設定一個可行的範圍,可略過不想捉的檔案 7. 十個同時執行的執行緒可以用最快的速度抓取資料 8. 完整的離線瀏覽和站臺對映功能 9. 網域分散查詢:讓速度較慢的站臺不至於延緩抓取的速度 10. 伺服器過載保護可以避免遠端的伺服器負載過重或過早切斷連接 11. 可調整的瀏覽器認證讓 Teleport Pro 喬裝為一般的瀏覽器 可是這個軟體是"共享"的,我想問有沒有"免費或擴充的套件可以使用",謝謝 |
發表人: | alex301 [ 2006-12-20, 11:27 ] |
文章主題 : | |
有免費的 http://www.httrack.com/ 唷~ 引言回覆: HTTrack is a free (GPL, libre/free software) and easy-to-use offline browser utility.
It allows you to download a World Wide Web site from the Internet to a local directory, building recursively all directories, getting HTML, images, and other files from the server to your computer. HTTrack arranges the original site's relative link-structure. Simply open a page of the "mirrored" website in your browser, and you can browse the site from link to link, as if you were viewing it online. HTTrack can also update an existing mirrored site, and resume interrupted downloads. HTTrack is fully configurable, and has an integrated help system. |
發表人: | 浩 [ 2006-12-20, 19:15 ] |
文章主題 : | |
不知道你的需求是要怎樣的 普通的話,我覺得ScrapBook就很好用了 |
第 1 頁 (共 1 頁) | 所有顯示的時間為 UTC + 8 小時 |
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/ |