2021年10月 - 黄兵的个人博客

“2021年10月”存档文章有18 篇

Python Web API 错误消息示例

2021/10/19 14:04:18

最近使用 Python Flask 框架编写 API 端点，如果错误发生了，如何向调用 API 的人显示错误消息是一件非常有必要的事情。除了 HTTP 规范中的 1 - 5 开头的状态码，我们还需要向客户显示详细的错误消息，以利于排查错误。下面是通过 Flask API 端点向客户发出错误消息的示例：response = { "code": 2014, "message": '当前 C...

在上一期，主要讲解了：连接网站与解析 HTML上一期只是一个简单的例子，获取了网站的一小部分内容，本期开始讲解需要获取网站的所有文章列表。在开始以前，还是要提醒大家：在网络爬虫的时候，你必须非常谨慎地考虑需要消耗多少网络流量，还要尽力思考能不能让采集目标的服务器负载更低一点。本次示例采集The ScrapingBee Blog博客的文章。在做数据采集以前，对网站经行分析，看看代码结构。需要采集的部...

IPv6 地址最大长度

2021/10/19 10:45:35

下面是一个 IPv6 地址的示例：0000:0000:0000:0000:0000:0000:0000:0000长度为：8 * 4 + 7 = 398 组 4 位数字，:中间有 7 位。但是，如果您有一个IPv4 映射的 IPv6 地址，则后两组可以写在以 10 分隔的基数中.，例如。[::ffff:192.168.100.228]. 完整地写出来：0000:0000:0000:0000:0000...

Necro Python 僵尸网络开始瞄准可视化工具 DVR

2021/10/15 10:19:44

安全研究人员发现了 Necro Python 僵尸网络的迹象，该网络针对 Visual Tools DVR 系统中的漏洞，以在受感染的系统上安装门罗币矿工。Necro Python 于今年 1 月首次发现，也被追踪为 N3Cr0m0rPh、FreakOut、Python.IRCBot，并因试图利用多个已知漏洞而闻名。根据瞻博网络威胁实验室的警告，9 月下旬，僵尸网络在其武器库中添加了一个针对 Vi...

爬虫系列：连接网站与解析 HTML

2021/10/13 15:31:36

上一篇文章讲了：爬虫所带来的道德风险与法律责任这篇文章是爬虫系列第三期，讲解使用 Python 连接到网站，并使用 BeautifulSoup 解析 HTML 页面。在 Python 中我们使用 requests 库来访问目标网站，使用 BeautifulSoup 对获取的内容进行解析。由于这两个库并不是 Python 标准库，因此需要单独安装这两个库：pip install beautifuls...

百度联盟 User-agent 与 IP

2021/10/13 15:11:02

百度联盟作为中国最具实力的联盟体系之一，同台具有四大优势：预算充足，流量全面、合作多元，样式丰富、精准匹配，高额变现、服务专业，运营高效。百度联盟专注于国内的广告市场，分为：信息流广告、沉浸视频广告、开屏广告、小程序广告。百度联盟与国外对标的是 Google AdSense。同时 Google AdSense 也有多种广告样式。爬虫识别与 IP 查询投放百度联盟有一段时间，但是按照官方的文档，一...

SQLAlchemy OR 条件过滤查询

2021/10/9 14:15:39

最近需要使用 SQLAlchemy 的 OR 查询，具体 SQL 查询示例：SELECT * FROM info WHERE user_agent='Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)' OR alias_user_agent='Mozilla/5.0 (compatible; MJ12bot/v1.4.8; ...

Python datetime.strftime() 格式化时间示例

2021/10/5 17:37:53

最近需要将 datetime 类型的数据转换成 string 类型数据，具体数据如下：2021-10-05 09:29:19使用 strftime() 函数将 datetime 类型转换为 string 类型数据，具体示例代码如下：exp_datetime.strftime('%Y-%m-%d %H:%M:%S')以下时间转换：07/28/2014 18:54:55.099000转换：exp_da...

“2021年10月”存档文章有18 篇

搜索文章

文章分类

文章归档