Mac安装使用NLPIR过程中遇到的问题

NLPIR 简介

NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。

NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。

全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。

PyNLPIR 简介

A Python wrapper around the NLPIR/ICTCLAS Chinese segmentation software.

安装 PyNLPIR

系统环境

  • MacBook 10.11
  • Python 3.5
1
pip install pynlpir

使用 PyNLPIR

1
2
3
4
5
6
7
8
9
import pynlpir

pynlpir.open()
s = 'NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统。'
segments = pynlpir.segment(s)
for segment in segments:
print(segment)

pynlpir.close()

执行结果:

1
2
3
4
5
6
7
8
9
10
11
12
13
('NLPIR', 'noun')
('分词', 'verb')
('系统', 'noun')
('前身', 'noun')
('为', 'preposition')
('2000年', 'time word')
('发布', 'verb')
('的', 'particle')
('ICTCLAS', 'noun')
('词法', 'noun')
('分析', 'verb')
('系统', 'noun')
('。', 'punctuation mark')

遇到的问题

RuntimeError: NLPIR function ‘NLPIR_Init’ failed.

解决方法:

  1. 下载NLPIR/ICTCLAS2016分词系统下载包
  2. 解压20160809100745_ICTCLAS2016分词系统下载包.zip
  3. 用20160809100745_ICTCLAS2016分词系统下载包/汉语分词20140928/Data/NLPIR.user替换/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/pynlpir/Data/NLPIR.user

参考

八宝粥 wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!