斯坦福词性标注,Stanford Log-linear Part-Of-Speech Tagger http://nlp.stanford.edu/software/tagger.shtml ,下载地址http://nlp.stanford.edu/software/stanford-postagger-full-2016-10-31.zip 将下载的zip文件解压,进入到解压之后的根目录中,可以看到有sh文件,bat文件等等。通过阅读README.txt文件,可以知道如何使用命令行直接调用执行得到词性标注后的结果,这里介绍很详细,包括了Windows环境、linux环境下的执行命令等等。models文件夹中存放的是各种训练好的模型,包括英文的,中文的,德语的等等。命令行下面的运行,跟Stanford Segmenter类似,这里只介绍如何在eclipse开发环境下使用词性标注。具体见下图 run as —-run configuration—-arguments,传入参数
models/chinese-distsim.tagger data/sample-input-utf8.txt
,运行之后的结果如上图所示。注意,使用的是分词之后的结果,再进行词性标注。
新闻热点
疑难解答