Skip to content
当前页面

近义词发现模型

1 功能概述

近义词发现模型可以将包含谐音、错别字等情况的关键词筛选出来,以扩充关键词库,对后续使用该关键词库更加精确地筛选数据有一定的帮助。

2 功能需求

在大量数据中需要筛选出符合条件的文本数据以进行后续的处理,在筛选过程中使用的关键词库未能涵盖所有重要的关键词,会过滤掉包含错别字关键词的文本数据,这部分数据对实际处理是有使用价值的,因此需要对关键词库中的关键词通过近义词发现模型将包含谐音、错别字等情况的关键词筛选出来扩充关键词库。

3 处理流程

近义词发现模型处理流程如下图所示。

3.4 输入输出

输入:用于寻找近义词的原始数据文件。

输出:相似词文件、词共现网络模型文件。

文档中心