红薯HtmlSucker 0.0.1 提取HTML网页信息的工具包

作者：袖梨 2026-06-06

HtmlSucker是一款用来从一个HTML网页中提取文章信息的小工具包，例如从网页中提取文章标题、作者、发布时间、封面图以及文章正文内容。基于 jsoup 库进行 HTML 解析。

HtmlSucker 提供两种正文提取算法：