爬虫系列:穿越网页表单与登录窗口进行采集

2022年01月11日 ,作者: 黄兵

上一期我们讲解了数据标准化相关内容,首先对单词出现的频率进行排序,之后对一些大小写进行转换,缩小 2-gram 序列的重复内容。当我们真正迈出网络数据采集基础之门的时候,遇到的第一个问题可能是:“我怎么获取登录窗口背后的信息呢?”今天,网络正在朝着页面交互、社交媒体、用户产生内容的趋势不断地演进。表单和登录窗口是许多网站中不可或缺的组成部分。不过,这些内容还是比较容易处理的。到目前为止,以前的示例...

Javascript ?? 实际使用中的一些总结

2022年01月11日 ,作者: 黄兵

最近在编写 Angular 程序的时候遇到这样一个问题,系统抛出的错误与自己定义抛出的错误不一样,需要根据情况进行判断,自己前端捕捉到的错误代码如下:getAllBlogTags() { this.isLoading$.next(true); this.sub = this.blogService.getAllBlogTags().subscribe(res => { t...

SQLAlchemy 多对多如何设置__bind_key__

2022年01月11日 ,作者: 黄兵

使用 SQLAlchemy 项目大一点都应该知道 __bind_key__ 是干嘛的,在此简要说明一下:从 0.12 开始 Flask-SQLAlchemy 可以轻松连接到多个数据库。为了实现这一点,它预先配置了 SQLAlchemy 以支持多个“绑定”。什么是绑定?在 SQLAlchemy 中,绑定是可以执行 SQL 语句的东西,通常是连接或引擎。在 Flask-SQLAlchemy 中,绑定始...

文章页面增加标签、其他文章

2022年01月10日 ,作者: 黄兵

文章页面增加标签、其他相关文章推荐。

Linux 如何监控服务

2022年01月08日 ,作者: 黄兵

下面的代码展示了如何确定 Linux 服务器上某个服务是否在运行:import subprocess service = "apache2" p = subprocess.Popen(["systemctl", "is-active", service], stdout=subprocess.PIPE) (output, err) = p.communicate() out...

Linux 服务与进程区别

2022年01月08日 ,作者: 黄兵

在 Linux 中,服务只是守护进程的另一个名称,它是在后台运行的客户端/服务器应用程序。服务会持续监听传入的请求并根据给定的请求发送响应。进程只是可以在前台或后台运行的应用程序或脚本。一个服务可以是多个进程,例如httpd(网络服务)或数据库。出于性能原因,将服务拆分为多个进程。快速检查我正在工作的机器显示 6 个 apache2 进程和 8 个 nfsd(NFS 守护程序)进程。但这只是 2 ...

Python min 包含 0 相关问题

2022年01月08日 ,作者: 黄兵

最近在对一个数据进行排序,求最大数和最小数,具体代码如下:def __init__(self, ping_list): # 延迟数据数组 self._ping_list = ping_listdef calc(self): # 平均延迟,保留2位小数 avg_time = round(self.average(), 2) # 丢包率,保留两位小数 get_cou...

43.134.200.17

2022年01月06日 ,作者: 黄兵

43.134.200.17 新加坡 地址存在问题。