关于使用文件作为存储处理结果的一些思考-详细内容

文章内容

2021/1/5 18:03:00,作者: 黄兵

关于使用文件作为存储处理结果的一些思考

最近在使用python写程序，主要是将ASN的数据写入到数据库，数据非常的多，有45w行左右，截图如下：

读取之后，将结果保存到数据库，但是由于数据量太大，中间可能存在中断，所以需要将已经保存到记录放在另外一个文件。

每次读取的时候，检查当前记录是否在已处理文件里面，具体代码如下：

asn_file_path = os.path.join(os.getcwd(), 'files\\IPv4.csv')
init_redis = redis_config.ConnConfig().Conn_Redis()
if os.path.exists(asn_file_path):
    with open(asn_file_path, 'r') as csv_file:
        # 读取csv文件
        csv_reader = csv.reader(csv_file)
        # 读取第一行
        next(csv_reader)
        for row in csv_reader:
            processed_data = self.read_processed_data()
            if row in processed_data:
                # csv文件当前行已经被处理过，继续循环
                continue

逻辑应该是没有问题。

但是当多程序运行的时候，会出现问题。当多线程运行的时候，第一个线程读取之后，第二个线程读取，结果第一个线程还没有写入，第二个读取到同一列数据，导致数据重复。

文章内容

2021/1/5 18:03:00,作 者: 黄兵

关于使用文件作为存储处理结果的一些思考

发表评论

评论列表

搜索文章

文章分类

文章归档

2021/1/5 18:03:00,作者: 黄兵