Skip to content

Commit da75f82

Browse files
authoredJun 8, 2022
Update README.md
1 parent d581c95 commit da75f82

File tree

1 file changed

+13
-3
lines changed

1 file changed

+13
-3
lines changed
 

‎README.md

+13-3
Original file line numberDiff line numberDiff line change
@@ -213,6 +213,16 @@ pkuseg.train(trainFile, testFile, savedir, train_iter = 20, init_model = None)
213213

214214
- **mixed**: 混合数据集训练的通用模型。随pip包附带的是此模型。
215215

216+
我们还通过领域自适应的方法,利用维基百科的未标注数据实现了几个细领域预训练模型的自动构建以及通用模型的优化,这些模型目前仅可以在release中下载:
217+
218+
- **art**: 在艺术与文化领域上训练的模型。
219+
220+
- **entertainment**: 在娱乐与体育领域上训练的模型。
221+
222+
- **science**: 在科学领域上训练的模型。
223+
224+
- **default_v2**: 使用领域自适应方法得到的优化后的通用模型,相较于默认模型规模更大,但泛化性能更好。
225+
216226

217227

218228
欢迎更多用户可以分享自己训练好的细分领域模型。
@@ -233,12 +243,12 @@ pkuseg.train(trainFile, testFile, savedir, train_iter = 20, init_model = None)
233243
## 论文引用
234244

235245
该代码包主要基于以下科研论文,如使用了本工具,请引用以下论文:
236-
* Ruixuan Luo, Jingjing Xu, Yi Zhang, Xuancheng Ren, Xu Sun. [PKUSEG: A Toolkit for Multi-Domain Chinese Word Segmentation](https://arxiv.org/abs/1906.11455). Arxiv. 2019.
246+
* Ruixuan Luo, Jingjing Xu, Yi Zhang, Zhiyuan Zhang, Xuancheng Ren, Xu Sun. [PKUSEG: A Toolkit for Multi-Domain Chinese Word Segmentation](https://arxiv.org/abs/1906.11455). Arxiv. 2019.
237247

238248
```
239249
240250
@article{pkuseg,
241-
author = {Luo, Ruixuan and Xu, Jingjing and Zhang, Yi and Ren, Xuancheng and Sun, Xu},
251+
author = {Luo, Ruixuan and Xu, Jingjing and Zhang, Yi and Zhang, Zhiyuan and Ren, Xuancheng and Sun, Xu},
242252
journal = {CoRR},
243253
title = {PKUSEG: A Toolkit for Multi-Domain Chinese Word Segmentation.},
244254
url = {https://arxiv.org/abs/1906.11455},
@@ -273,7 +283,7 @@ pkuseg.train(trainFile, testFile, savedir, train_iter = 20, init_model = None)
273283

274284
## 作者
275285

276-
Ruixuan Luo (罗睿轩), Jingjing Xu(许晶晶), Xuancheng Ren(任宣丞), Yi Zhang(张艺), Bingzhen Wei(位冰镇), Xu Sun (孙栩)
286+
Ruixuan Luo (罗睿轩), Jingjing Xu(许晶晶), Xuancheng Ren(任宣丞), Yi Zhang(张艺), Zhiyuan Zhang(张之远), Bingzhen Wei(位冰镇), Xu Sun (孙栩)
277287

278288
北京大学 [语言计算与机器学习研究组](http://lanco.pku.edu.cn/)
279289

0 commit comments

Comments
 (0)
Please sign in to comment.