再次用Nodejs构建一个API,这时需要去parse html,找了很久没有找到一个好的库,这时看到了jsdom——关键是可以用jQuery。
有的时候想把HTML转成PDF, 方便用户下载离线使用或阅读。但并不是每个人都会制作PDF文档,幸好,有太多的PDF相关工具。
这里是用到了nokogiri库,从某HTML里读出内容。不过有意思的是,当我们加上一些特定功能的时候就可以当一个爬虫到处搜索资料了。
“There's something interesting happening right now. Startups are undergoing the same transformation that technology does when it becomes cheaper.”