归档
时光荏苒,文字留痕
共 15 篇文章
Selenium,Playwright,Puppeteer 做爬虫有哪些弊病?
selenium,playwright和puppeteer这几个自动化工具很适合采集那些动态加载的网站,比如电商、社交媒体等,需要你点击、翻页才能加载出来数据,它们模仿人工操作浏览器,完美解决了这个问题,这是requests做不到的。但这几个也有很大缺点,首先容易出错,对于浏览器和依赖库的配合程度要
Python打包exe,到底选PyInstaller还是Nuitka?
Python 打包成 exe有两种主要解决方案,PyInstaller还是Nuitka,孰优孰劣呢? 首先介绍下PyInstaller,PyInstaller特点是将乱七八糟的东西打包一起,比如各种依赖库,即使你的程序只使用了pandas很小一个功能,比如read_data,它也会将整个pandas
【学习分享】大文件上传:分片、断点续传和秒传的实现方案
处理大文件上传是个常见需求。直接上传大文件会遇到很多问题:网络不稳定、内存占用高、上传失败后又要从头开始。我们需要一套完整的解决方案。 核心思路 我们的做法是把大文件切成很多小片,分别上传这些小片,最后在服务器上把它们拼起来。这样做有几个好处: 分片上传:大文件变多个小文件,上传更稳定
【学习分享】H5跳转APP的3种方法,看看你掌握了几种?
我们经常会遇到这样的情况:在手机浏览器里浏览一个网页,点一个按钮或链接,就能直接打开对应的 APP。这个功能看起来简单,实现起来却有不少门道。 今天我们就来聊聊H5页面跳转到APP的3种常用方法。
【学习分享】前端如何应对海量的API请求:从奔溃到流畅的实战指南
大多数前端开发日常关注的是页面效果,交互体验,很少考虑到处理百万级别的api请求。当你项目突然爆火,或者使用的用户量突破百万级别时,那些随手写的api调用就会成为系统崩溃的根本原因所在。 一、缓存是前端的第一道防线 每个不必要的API调用都在消耗性能。合理使用缓存能大幅度减少请求数量。 1.1 浏览