python自动化采集数据(二)- 图片采集

srq
srq
2024-06-19 / 0 评论 / 15 阅读
本文共291 个字,平均阅读时长 ≈ 1分钟

一、 采集图片库

内容站需要与内容相关的图片,本文的内容是采集图片

1.1 采集第一张图片

1.1.1 采集sougou图片,并压缩成一张原创的图片 ✓

1.1.2 采集bing图片,并压缩成一张原创的图片 ✓

  • 将图片压缩成一张大图(测试效果同上)
想法:用 pytorch 训练一个可以识别大楼的机器人,遇到不是大楼的图片能够智能化的筛掉

1.2 采集第二张图片 ✓

  • 获取页面的 1-3条 ,使用 DrissionPage 截图
  • 实用的加水印工具 pip install filestools -i https://pypi.org/simple/ -U
  • 如果页面少于3张,就截取1-2条,以此类推

0

评论 (0)

取消