爬虫实战 | 揭秘古风系列商品,避免踩坑( 七 )


三、数据处理:

1、连接数据库读入数据

2、处理缺失值,重复值

3、为后续数据分析对数据进行所需处理

爬虫实战 | 揭秘古风系列商品,避免踩坑

数据缺失值图表(本次案例没有缺失值):

爬虫实战 | 揭秘古风系列商品,避免踩坑

四、jieba词频处理及词云展示:

4.1、对标题文本进行分词:

爬虫实战 | 揭秘古风系列商品,避免踩坑