Chrome headless 模式,爬虫、网页截图、生成PDF 利器

By youbbs at 2018-11-11 09:57 • 145次点击
youbbs

从 Chrome 59 开始具有 Headless 模式。这是一种在无需显示headless的环境下运行 Chrome 浏览器的方式。从本质上来说,就是不用 chrome 浏览器来运行 Chrome 的功能!它将 Chromium 和 Blink 渲染引擎提供的所有现代 Web 平台的功能都带入了命令行。

下图是Headless 模式具有的功能:

对于前端用大量js 渲染的网页可以用Chrome headless 来渲染以得到最终的显示效果。可以配合 selenium 在linux 服务器端自动运行,据测试,服务器最小内存为256MB,使用 python + selenium 驱动简单,使用 go + selenium 驱动能省点内存和CPU。

参考:
https://developers.google.com/web/updates/2017/04/headless-chrome 1
https://github.com/tebeka/selenium 122
https://pypi.org/project/selenium/ 1


chrome, headless, 模式, 爬虫, 网页截图


简单说有什么作用?采集?

root at 2018-11-11 15:09
1

@root 采集、功能测试、截图

youbbs at 2018-11-11 17:23
2
登录 后发表评论