网页剪贴簿
截图:
简介:
获取网页至本地或后端服务器供检索、组织、加注、编辑。
网页剪贴簿 (WebScrapBook) 可以忠实撷取网页内容,支援多种储存格式与客制化设定,还可以对撷取的资料做检索、组织、加注、编辑。本扩充套件继承自 Firefox 旧版附加元件 ScrapBook X。
功能特色:
1. 忠实撷取:可将浏览器显示的网页撷取储存而不遗失微小细节。一些重要的元资料如来源网址及撷取时间亦皆如实记录。
2. 客制撷取:网页剪贴簿可撷取选取的网页范围、撷取网页原貌(未经页面脚本处理)、或把网页撷取为书签。亦可自订如何处理网页中的图片、音讯、视讯、字体、框架页、样式表、脚本等资源。网页可储存为资料夹、ZIP 封存档案(HTZ 或 MAFF),或单一 HTML 档案。
3. 编辑网页:网页可在撷取前或撷取后加以标示、加注、或编辑。
4. 管理资料:可在浏览器侧边栏用一或多本剪贴簿以阶层化树状结构组织撷取的网页。也可以建立和管理 HTML 或 markdown 格式的笔记页面。(*)
5. 全文搜寻:每本剪贴簿可个别建立索引,用各种方式搜寻资料(如标题、全文、评注、来源网址、建立时间、修改时间等)。(*)
6. 远端存取:可架设后端伺服器托管撷取的资料,以便在其他机器阅读或编辑。剪贴簿亦可建立静态索引,发布为静态网站。(*)
7. 行动支援:网页剪贴簿支援行动浏览器,例如 Firefox for Android 和 Kiwi Browser,可在手机或平板电脑撷取及编辑网页。
8. 旧版 ScrapBook 支援:旧版附加元件 ScrapBook 或 ScrapBook X 建立的剪贴簿可转换为网页剪贴簿相容格式使用。(*)
* 打星号项目全部或部分功能需要搭配后端伺服器才能运作,后端伺服器可用 PyWebScrapBook 架设。
* HTZ 或 MAFF 封存档案可用内建的封存网页检视器检视,用 PyWebScrapBook 或其他辅助工具开启,或解压缩后开启入口页面检视。
参见:
* 下载及安装 PyWebScrapBook: https://pypi.org/project/webscrapbook/
* 进一步说明及常见问题可参阅此共笔: https://github.com/danny0838/webscrapbook/wiki/Intro-(zh_TW)
* 为方便汇整及做更完整的双向讨论,有问题请尽量回报到版本库: https://github.com/danny0838/webscrapbook/issues
* 若此工具对你有帮助,可小额捐款支持我们: https://www.paypal.me/danny0838/5usd