为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影理的效果提出一种应用于维吾尔语的停用词抽取方法用词特点的基础上,采用文档频数、词项频和信息熵的方法对大量语料进候选停用词的词性过文本分类实验确用词阈值,结果表该方法进行停用词过滤类的计算复杂度降低,分类准确率。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !