“2021年10月”存档文章有18

Python Web API 错误消息示例

最近使用 Python Flask 框架编写 API 端点,如果错误发生了,如何向调用 API 的人显示错误消息是一件非常有必要的事情。除了 HTTP 规范中的 1 - 5 开头的状态码,我们还需要向客户显示详细的错误消息,以利于排查错误。下面是通过 Flask API 端点向客户发出错误消息的示例:response = { "code": 2014, "message": '当前 C...

爬虫系列:数据采集

在上一期,主要讲解了:连接网站与解析 HTML上一期只是一个简单的例子,获取了网站的一小部分内容,本期开始讲解需要获取网站的所有文章列表。在开始以前,还是要提醒大家:在网络爬虫的时候,你必须非常谨慎地考虑需要消耗多少网络流量,还要尽力思考能不能让采集目标的服务器负载更低一点。本次示例采集The ScrapingBee Blog博客的文章。在做数据采集以前,对网站经行分析,看看代码结构。需要采集的部...

IPv6 地址最大长度

下面是一个 IPv6 地址的示例:0000:0000:0000:0000:0000:0000:0000:0000长度为:8 * 4 + 7 = 398 组 4 位数字,:中间有 7 位。但是,如果您有一个IPv4 映射的 IPv6 地址,则后两组可以写在以 10 分隔的基数中.,例如。[::ffff:192.168.100.228]. 完整地写出来:0000:0000:0000:0000:0000...

Necro Python 僵尸网络开始瞄准可视化工具 DVR

安全研究人员发现了 Necro Python 僵尸网络的迹象,该网络针对 Visual Tools DVR 系统中的漏洞,以在受感染的系统上安装门罗币矿工。Necro Python 于今年 1 月首次发现,也被追踪为 N3Cr0m0rPh、FreakOut、Python.IRCBot,并因试图利用多个已知漏洞而闻名。根据瞻博网络威胁实验室的警告,9 月下旬,僵尸网络在其武器库中添加了一个针对 Vi...

爬虫系列:连接网站与解析 HTML

上一篇文章讲了:爬虫所带来的道德风险与法律责任这篇文章是爬虫系列第三期,讲解使用 Python 连接到网站,并使用 BeautifulSoup 解析 HTML 页面。在 Python 中我们使用 requests 库来访问目标网站,使用 BeautifulSoup 对获取的内容进行解析。由于这两个库并不是 Python 标准库,因此需要单独安装这两个库:pip install beautifuls...

百度联盟 User-agent 与 IP

百度联盟作为中国最具实力的联盟体系之一,同台具有四大优势:预算充足,流量全面、合作多元,样式丰富、精准匹配,高额变现、服务专业,运营高效。百度联盟专注于国内的广告市场,分为:信息流广告、沉浸视频广告、开屏广告、小程序广告。百度联盟与国外对标的是 Google AdSense。同时 Google AdSense 也有多种广告样式。爬虫识别与 IP 查询 投放百度联盟有一段时间,但是按照官方的文档,一...

SQLAlchemy OR 条件过滤查询

最近需要使用 SQLAlchemy 的 OR 查询,具体 SQL 查询示例:SELECT * FROM info WHERE user_agent='Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)' OR alias_user_agent='Mozilla/5.0 (compatible; MJ12bot/v1.4.8; ...

Python datetime.strftime() 格式化时间示例

最近需要将 datetime 类型的数据转换成 string 类型数据,具体数据如下:2021-10-05 09:29:19使用 strftime() 函数将 datetime 类型转换为 string 类型数据,具体示例代码如下:exp_datetime.strftime('%Y-%m-%d %H:%M:%S')以下时间转换:07/28/2014 18:54:55.099000转换:exp_da...