Appearance
统计文档中词语的频率信息。
统计文本中相关词语的频率信息,将词频信息与文本数据进行合并,输出并保存数据。
任务针对功能主要为对输入文本数据进行“词频统计”,该功能需要封装为通用功能,统计对象一般为前期经过处理的文本数据。对于本程序而言,需要对输入数据进行预处理使之达到程序使用条件,并指明读取路径。
在对输入数据进行提取之后,通常需要保存词频信息。与输入数据相对应的,词语频率信息需要输出并保存为指定文档,这里同样需要指定存储路径。