Skip to content
当前页面

Word2Vec模型训练

1 功能概述

根据给定的预料库,通过Word2vec 训练模型可以快速有效地将一个词语表达成向量形式,以将中文文本数据转换为机器能够读懂的信息进行处理。

2 功能需求

Word2Vec模型训练所用脚本包含对分词、滤词后的文本数据使用指定字段训练词向量模型的过程。该需求点需要将词向量模型脚本中核心代码转换为函数,并加以封装,方便其他使用者直接调用该处理函数,完成对应数据的处理。

3 模型训练

3.1 处理流程

Word2vec模型训练的处理流程如下图所示。

3.2 输入输出

输入:用于训练word2vec词向量模型的数据文件。

输出:词向量模型文件。

文档中心