
one-hot编码有缺点,词之间没有关联性。
采用词嵌入表示,不同特征用不同的分数进行标注。
t-SNE数据可视化
词嵌入应用于类比
损失函数
Embedding matrix
学习词嵌入
缺点:没有考虑词序,分类器可能会误判。
one-hot编码有缺点,词之间没有关联性。
采用词嵌入表示,不同特征用不同的分数进行标注。
t-SNE数据可视化
词嵌入应用于类比
损失函数
Embedding matrix
学习词嵌入
缺点:没有考虑词序,分类器可能会误判。