关于我们

公司介绍

COMPANY PROFILE

分词出现的概率,将概率最大的分词结果作为最终结果。常见的序列标注模型有HMM和CRF。这类分词算法能很好处理歧义和未登录词问题,效果比前一类效果好,但是需要大量的人工标注数据,以及较慢的分词速度。第三类是通过让计算机模拟人对句子的理解,达到识别词的效果,由于汉语语义的复杂性难以将各种语言信息组织成机器能够识别的形式目前这种分词系统还处于试验阶段。即根据观测到的数据(标注好的语料)对模型参数进行训练,在分