利用BosonNLP做中文分词

3/8/2017来源:ASP.NET技巧人气:2124

 # -*- coding: utf-8 -*-
from __future__ import PRint_function, unicode_literals
from bosonnlp import BosonNLP
nlp = BosonNLP('your API token')

result = nlp.tag('在伦敦奥运会上将可能有一位沙特阿拉伯的女子')
for d in result:
    print(' '.join(['%s' % it for it in d['Word']]))

命该脚本为segment.py

运行结果:  在 伦敦 奥运会 上 将 可能 有 一 位 沙特阿拉伯 的 女子

your API token 通过注册 BosonNlp得到