Python检查字符串是否存在并导出到CSV文件

介绍

在数据处理过程中，我们经常需要检查一个文件中的数据是否存在于另一个文件中。这个任务尤其常见于电子商务领域，其中商品的唯一标识符（SKU）需要被验证是否存在于给定的商品清单中。本文将介绍如何使用Python编程语言，通过比较两个CSV文件，检查SKU是否存在，并将不存在的SKU导出到另一个CSV文件中。

准备工作

在开始之前，我们需要准备以下几项：

两个CSV文件：一个包含要检查的SKU列表，另一个包含所有的SKU清单。
安装所需的Python库：在本示例中，我们将使用csv库来读取和写入CSV文件，以及slugify库来格式化SKU。

实现步骤

步骤 1：导入所需的库

首先，我们需要导入csv库和slugify库。csv库用于读取和写入CSV文件，而slugify库用于格式化SKU。

import csv
from slugify import slugify

步骤 2：定义检查SKU的函数

接下来，我们将定义一个名为check_sku的函数，该函数将接受两个参数：要检查的SKU文件和导出结果的文件。

def check_sku(file2, file3):
skus_to_find = []
# 读取要查找的SKU列表
with open(file2, 'r', encoding='utf-8') as csv_file2:
reader2 = csv.reader(csv_file2)
skus_to_find = [slugify(row[0]) for row in reader2]
# 打开导出结果的文件
with open(file3, 'w', newline='', encoding='utf-8') as csv_file3:
writer3 = csv.writer(csv_file3)
# 打开第一个CSV文件进行SKU检查
with open('1.csv', 'r', encoding='utf-8') as csv_file1:
reader1 = csv.reader(csv_file1)
for row in reader1:
sku = slugify(row[0])  # 假设SKU列在第一列
if sku in skus_to_find:
print("存在:", row[0])
else:
writer3.writerow(row)
print("在2.csv中找不到:", row[0])

在这个函数中，我们首先打开第二个CSV文件（要检查的SKU列表），并将其内容存储在skus_to_find列表中。我们使用slugify函数对SKU进行格式化，以确保在比较时不会因为大小写或特殊字符而导致错误匹配。

接下来，我们打开要写入导出结果的文件，并创建一个csv.writer对象。然后，我们打开第一个CSV文件，逐行读取并检查SKU是否存在于skus_to_find列表中。如果存在，我们打印一条消息表示存在。如果不存在

，我们将该行写入到导出结果的CSV文件中，并打印一条消息表示在第二个CSV文件中找不到该SKU。

步骤 3：调用函数并处理结果

在函数定义后，我们需要指定要检查的SKU文件和导出结果的文件路径。

# 指定文件路径和名称
file2 = '2.csv'
file3 = '3.csv'
# 调用函数进行检查并处理结果
check_sku(file2, file3)

结果

运行完上述代码后，程序将逐行比较第一个CSV文件中的SKU与第二个CSV文件中的SKU。如果SKU存在于第二个文件中，将输出一条消息表示存在。如果SKU不存在于第二个文件中，将将该行写入到导出结果的CSV文件中，并输出一条消息表示在第二个文件中找不到该SKU。

导出的CSV文件将包含第一个CSV文件中不存在于第二个CSV文件的所有行。

总结

本文介绍了如何使用Python编程语言检查一个CSV文件中的SKU是否存在于另一个CSV文件中，并将不存在的SKU导出到另一个CSV文件中。通过使用CSV库和slugify库，我们可以轻松地读取和写入CSV文件，并对SKU进行格式化和比较，以确保准确性。这个技术在许多数据处理任务中都非常有用，尤其是在电子商务领域中。希望本文对您有所帮助！