神级程序员用Python对上万首唐诗进行数据分析!此乃神级程序员也
中国是一个历史悠久的强国!他的文化自然也是悠远流长!唐诗我想大家都学过,没人是没有学过的,这些东西小编不希望大家随着科技的更新而被遗忘,希望大家都能谨记!
一个人自学很有可能因为动力不足而中途放弃,可以尝试加入一个或几个适合自己的网络群体(QQ、 微信、 社区等),寻找志同道合的学习伙伴,相互交流、相互促进.如果大家想要学习交流欢迎给我私信,私信关键词: 01.02.
03.04 都会得到不一样的资料!系统坚持到关键词会自动发送。分开发送!01或者02
2.2 万紫千红一片绿——《全唐诗》中的色彩
笔者在这里找了51个古语中常用的颜色的单字(注意是古汉语语境中的颜色称谓),其中以红色系(红、丹、朱、赤、绛等)、黑色系(暗、玄、乌、冥、墨等)、绿色系(绿、碧、翠、苍等)及白色系(白、素、皎、皓等)为主,这些颜色及其对应的字频如下表所示:
以下是TOP200的共现双字词:
下面,笔者选取一些单字进行字向量关联分析,展示如下:
注意,在这里得到的情绪相关字,笔者将收集整理它们,制成情绪词典,用于后面的诗词情绪分类。
为了取得更好的效果,笔者采用最新的NestedLSTM+Conv1D的深度学习模型来做情绪判断,它能较好的提炼文本里的特征和语序信息,记住更长的语义依赖关系,做出较为精确的情绪判断。其网络结构如下所示:
接着,来试试实际的效果:
以“春雨”打头,生成500字的诗词,结果如下:
再看看笔者较为欣赏的2句名句,机器很好的捕捉到了它们之间的相似语义关系,即使词汇不尽相同,但仍能从语义上检索相似诗句。
预处理后是这样的形式:
用Semiotic Squares进行分析的结果如下图所示(点击即可放大显示):
作者:苏格兰折耳喵
侵权请联系小编删除哦!
希望大家都能不忘初心!谢谢阅读!
- IEEE Spectrum公布2017年度流行编程语言:Python排第一
- “我的老公,是从一盘猪蹄里吃出来的”|100个神级恋爱小套路
- P8的程序员在阿里被P10大佬面试,评价:果然有水平!
- 小伙相亲穿特步鞋被拒, 结果反转, 是阿里高级程序员
- 漫威神级角色科普:“苍穹”
- 世界睡眠日数据发布:90后程序员最易失眠
- 面向数据科学的 Anaconda Python 入门 | Linux 中国
- 世界只有两种程序员,一种_____,一种_____
- 我为什么建议用业余时间学学Python?
- 硅谷华人女程序员:在夹缝中求生存 拼命实现自我