宋礼鹏
Professor
Visit:
Paper Publications
基于聚类的语料库分词评价方法研究
  • Journal:
    计算机学报
  • Key Words:
    分层抽样; 相似性因子; 样本聚类; 评价函数;
  • Abstract:
    对大规模汉语文本语料库分词正确率的评价提出了新的见解 ,即在分层抽样基础上对文本样本进行聚类 .通过聚类可提高检验精度或减少样本量 .该方法采用了一种新的样本相似性度量公式 ,该公式综合考虑了样本向量间的距离和样本向量各分量之间的线性相关性 .通过对聚类结果的动态评价 ,调整聚类的类别数和相似性因子 ,提高了聚类的效率和质量 .实验表明该方法在评价大规模语料库分词正确率时取得了很好的效果
  • All the Authors:
    郑家恒
  • First Author:
    songlipeng
  • Volume:
    2004
  • Issue:
    2
  • Page Number:
    192-196
  • ISSN No.:
    0254-4164
  • Translation or Not:
    no
  • CN No.:
    11-1826/TP
  • Date of Publication:
    2004-02-01

Pre One:多蠕虫传播模型分析

Next One:分词评价系统实现

Copyright All Rights Reserved Shandong University Address: No. 27 Shanda South Road, Jinan City, Shandong Province, China: 250100
Information desk: (86) - 0531-88395114
On Duty Telephone: (86) - 0531-88364731 Construction and Maintenance: Information Work Office of Shandong University