一、前言
前几天在交流群问了一个、Pandas处理的问题,提问截图如下:
原始数据如下图所示:
下面是他自己写的代码:
with open("relationship.csv", "w", encoding='utf_8_sig') as f:
f.write("Source,Weight\n") #按照人物、对象、发生次数也是权重,写入代码当中
for key, value in au_group.items():
f.write(name + "," + name + "," + str(times) + "\n") #这里面名字被写入二次第二次是标签,然后逗号进行分列,str是写成数字意思
需求澄清:他想把key里面的二个词分别导出CSV,上面的变量名称,一个是source,一个是target,value的值为数字,设置为weight,形成三列。
二、实现过程
后来给了一个代码,可以满足要求,如下图所示:
with open("relationship.csv", "w", encoding='utf_8_sig') as f:
f.write("Source,Tsrget,Weight\n")
for key, value in au_group.items():
f.write(f"{key},{value}\n")
可以顺利地得到预期的结果:
后面还问了一个其他的问题,关于修改缺失值,重复值之后,将新内容进行存储失败的问题,下面是他的原始代码。
后来给了一个解决代码,如下所示:
df[['Author-作者', 'Keyword-关键词']] = df[['Author-作者', 'Keyword-关键词']].applymap(lambda x: re.sub(';+', ',', x).strip(',').split(','))
df.to_csv('result_220928.csv', index=False)
顺利地解决了粉丝的问题。不得不承认,群里的大佬卧虎藏龙的,太强了!
三、总结
这篇文章主要盘点了一个Pandas处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。