本文以隐马尔科夫模型(HMM)为基础,针对英文文本,提出了一种基于HMM的在非结构化文档的文本域中提取数学表达式的方法。首先,针对传统HMM的结构缺陷,引入模型观察值对模型后一时刻状态的直接依赖性,并对模型的参数学习训练算法进行了改进。在此基础上,设计了具有新型结构的改进型HMM。针对HMM训练效果对初始参数的敏感度较强的问题,引入量子粒子群(QPSO)智能优化算法对初始参数的选择进行优化,并设计了基于QPSO的改进型HMM初始参数优化算法。然后,将改进型HMM应用到非结构化文本数学表达式提取中来,给出了针对非结构化文本的HMM模型状态构建方法,并提出了基于改进型HMM的非结构化文本域数学表达式提取算法。最后,依据13423条标准数学表达式和含有数学表达式的非结构化文本进行了验证实验,实验结果证明了改进型HMM和数学表达式提取算法的有效性和优越性,有着较强的现实应用价值。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !