python进行词性分析
表示python的nltk包真的很好用,本来想着自己从字典里面抓数据的,后来师兄建议用nltk包,
Http://www.nltk.org/install.html
按照方法安装了包,接下来
import nltk
nltk.download()
showing info http://nltk.GitHub.com/nltk_data/
Out[2]: TrueC:\Users\artemis_zrj\Desktop\nltk-3.0.0
nltk.download()
text=nltk.Word_tokenize("And now for something completely different")
nltk.pos_tag(text)
Out[5]:
[('And', 'CC'),
('now', 'RB'),
('for', 'IN'),
('something', 'NN'),
('completely', 'RB'),
('different', 'JJ')]
测试了一切正常。
同时介绍一本书,自然语言处理,虽然是讲自然语言处理的,但是同时也介绍了nltk包的各种应用。
输出的是list数组,数组里面的每个单位是tuple(元组)
有一个包是pattern包,http://www.clips.ua.ac.be/pattern
英文包里面提供了一些功能
http://www.clips.ua.ac.be/pages/pattern-en
提供了单数复数的切换
from pattern.en import pluralize, singularize
print pluralize('child')
print singularize('wolves')
比较级的切换
from pattern.en import comparative, superlative
print comparative('bad')
print superlative('bad')
还有动词变化,数字的转换,
相关文章