我们面临的第一个问题不是模型,而是数据。具体来说,是为特定垂直领域的深度学习模型持续、自动化地获取高质量、动态渲染的网页数据。传统的爬虫库如 Scrapy 在面对重度依赖JavaScript的现代单页应用(SPA)时显得力不从心,而手动收集
2023-10-27