生命不息,奋斗不止
08
20
19
15
07
29
24
Redis快速入门及使用 Redis快速入门及使用
概述redis 是一种支持分布式的 nosql 数据库,他的数据是保存在内存中,同时 redis 可以定时把内存数据同步到磁盘,即可以将数据持久化,并且他比 memcached 支持更多的数据结构(string,list 列表[队列和栈],
2019-07-24
22
一些精简的JavaScript代码集合 一些精简的JavaScript代码集合
日历创建过去七天的数组,如果将代码中的减号换成加号,你将得到未来 7 天的数组集合 // 创建过去七天的数组 [...Array(7).keys()].map((days) => new Date(Date.now() - 86400
2019-07-22
17
Scrapy-Redis分布式爬虫 Scrapy-Redis分布式爬虫
Scrapy-Redis 分布式爬虫组件Scrapy 是一个框架,他本身是不支持分布式的。如果我们想要做分布式的爬虫,就需要借助一个组件叫做 Scrapy-Redis,这个组件正是利用了 Redis 可以分布式的功能,集成到 Scrapy
2019-07-17
16
Scrapy框架 Scrapy框架
Scrapy 框架介绍写一个爬虫,需要做很多的事情,比如:发送网络请求、数据解析、数据存储、反反爬虫机制(ip 代理,设置请求头等)、异步请求等等。这些工作如果每次都要自己从零开始写的话,比较浪费时间。因此 scrapy 把一些基础的东西都
2019-07-16
15
图形验证码识别 图形验证码识别
图形验证码识别技术阻碍我们爬虫的。有时候正是在登录或者请求一些数据时候的图形验证码。因此这里我们讲解一种能将图片翻译成文字的技术。将图片翻译成文字一般被成为光学文字识别(Optical Character Recognition),简写为
2019-07-15
14
动态网页爬虫 动态网页爬虫
Ajax 是什么AJAX(Asynchronouse JavaScript And XML)异步 JavaScript 和 XML。过在后台与服务器进行少量数据交换,Ajax 可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下
2019-07-14
13
多线程爬虫 多线程爬虫
有些时候,比如下载图片,是一个比较耗时的操作,如果采用同步的方式去下载,效率肯定会特别慢,这时候我们就可以考虑使用多线程的方式来下载图片 多线程介绍 多线程是为了同步完成多项任务,通过提高资源使用效率来进一步提高系统的效率 线程是在同一时间
2019-07-13
12
2 / 3