机器能直接识别的语言(能让计算机识别的语言是)
用于处理文本数据的Python库
文章插图
用于处理文本数据的Python库
【机器能直接识别的语言(能让计算机识别的语言是)】
基于深度学习的NLP处理库有很多 , 但是都没有下面这个强大的TextBlob简单 , 强大 。
他的功能有:简单 , Pythonic , 文本处理 - 情感分析 , 词性标注 , 名词短语提取 , 翻译等 。
文章插图
TextBlob
立即安装它
$ pip install -U textblob
$ python -m textblob.download_corpora
TextBlob是一个用于处理文本数据的Python(2和3)库 。TextBlob建立在NLTK和pattern基础上 , 并与两者完美搭配 。它为处理常见的自然语言处理(NLP)任务提供了一个简单的API , 例如词性标注 , 短语提取 , 情感分析 , 分类 , 翻译等 。
快速使用:
from textblob import TextBlobtext = '''The titular threat of The Blob has always struck me as the ultimate moviemonster: an insatiably hungry, amoeba-like mass able to penetratevirtually any safeguard, capable of--as a doomed doctor chillinglydescribes it--"assimilating flesh on contact.Snide comparisons to gelatin be damned, it's a concept with the mostdevastating of potential consequences, not unlike the grey goo scenarioproposed by technological theorists fearful ofartificial intelligence run rampant.'''blob = TextBlob(text)blob.tags # [('The', 'DT'), ('titular', 'JJ'),# ('threat', 'NN'), ('of', 'IN'), ...]blob.noun_phrases # WordList(['titular threat', 'blob',# 'ultimate movie monster',# 'amoeba-like mass', ...])for sentence in blob.sentences:print(sentence.sentiment.polarity)# 0.060# -0.341blob.translate(to="es") # 'La amenaza titular de The Blob...'OK!上面的程序就容易的完成了词性标注等强大的自然语言处理功能 。
文章插图
上面的程序就容易的完成了词性标注等强大的自然语言处理功能
- 医疗费|产检费用也能报销!快看看产检有几次,一共能报销多少钱?
- 宝宝|孕妇肚子能不能随便摸?孕妈当心,出现这4种情况尽量少摸肚子
- 西兰花|如果你怀孕了,常吃这5种食物,能清除体内垃圾毒素,胎儿发育好
- 孕妈|怀孕最后一个月,孕妈尽量少做这3件事,可能胎儿出生更顺利些!
- 畸形|怀孕后不能玩手机虽然可能会导致胎宝畸形,但没你想的那么可怕
- 妈妈|孕期有6种情况表明可能怀的是男宝,中三条以上的,迎接小王子吧
- 胎位|怀孕满七个月,四道关卡等在前方,熬过了,胎宝基本就能平安出生
- 产检|孕妇做四维彩超时不能有家属陪同了解原因后,要充分配合医生
- 影视剧|预产期将至,这5件事情可能不会有人特别提醒你,孕妇最好要了解
- 生育年龄|孩子出生时间有讲究,能在这3个时间段出生,他们会自带“福气”