Skip to content
当前页面

词频统计

1 功能概述

统计文档中词语的频率信息。

2 功能需求

统计文本中相关词语的频率信息,将词频信息与文本数据进行合并,输出并保存数据。

3 处理流程

4 输入输出

​任务针对功能主要为对输入文本数据进行“词频统计”,该功能需要封装为通用功能,统计对象一般为前期经过处理的文本数据。对于本程序而言,需要对输入数据进行预处理使之达到程序使用条件,并指明读取路径。

在对输入数据进行提取之后,通常需要保存词频信息。与输入数据相对应的,词语频率信息需要输出并保存为指定文档,这里同样需要指定存储路径。

文档中心