成果名称:一种科技新闻的增量学习多层次二分类方法
发 明 人:朱全银;潘禄;刘文儒;李翔;周泓;胡荣林;丁瑾;金鹰;邵武杰;唐海波
获批时间:2018/08/10
成果类型:发明授权
专 利 号:CN201510642902.X
成果简介
本发明公开了一种科技新闻的增量学习多层次二分类方法,本发明利用新闻属性中的文章标题、文章内容、关键词,结合向量空间模型下的文本加权方法和文本间相似度计算方法,先对标记新闻文档集中的标记信息和全文信息进行预处理和特征加权,存储计算中间结果,之后从特征信息和全文文本两个层次,使用余弦相似度计算新文本与科技新闻分类和非科技新闻分类间的相似度,以此依据判定新文本的分类,多层次判断方法和增量学习方法提高了对科技词汇的敏感度,二分类方法能够减少与科技新闻无关新闻的文本数量,进而提高文本多分类准确性。本发明用于改善从Web网页中抽取新闻信息的使用价值,提高科技新闻的分类准确率。
联系人:陈帅
电话:0517-83591025
联系地址:江苏省淮安市枚乘东路1号
邮编:223005
电子邮箱:11000080@hyit.edu.cn