词向量与词向量拼接 - 程序员宅基地

【论文笔记】融合标签向量到BERT：对文本分类进行改进

【预训练后中间层向量不再变】【动态（组合各中间层向量的权重随任务变化）获取基于上下文的词向量；...

标签： ELMO

自然语言处理(NLP)-生成模型：ELMO【Deep contextualized word representations】2018

Transformer in NLP（2）【图解 transformer】

图解transformer 前言 2017 年，Google 提出了 Transformer 模型，用 Self Attention 的结构，取代了以往 NLP 任务中的 RNN 网络结构，在 WMT 2014 Englishto-German 和 WMT 2014 English-to-French两个机器翻译任务...

自然语言处理之——文本向量化

标签：自然语言处理人工智能 nlp

一．摘要 ...当前阶段，对文本向量化大部分的研究都是通过词向量化实现的。二．向量化算法word2vec 词袋(Bag of Word)模型是最早的以语言为基本处理单元的文本向量化方法。下面我们将通过示例展示..

高维向量降维（PCA）方法学习——学习笔记

标签：算法机器学习深度学习

最近在处理图像，利用深度学习的方法将图像转换成向量，再对向量进行处理，在利用向量的过程中发现，无论是卷积神经网络还是深度残差网络，提取到的图像特征（每张图片对应一个向量）的维度都是非常高的，这对后期的...

Deep Learning in NLP （一）词向量和语言模型

这篇博客是我看了半年的论文后，自己对 Deep Learning 在 NLP 领域中应用的理解和总结，在此分享。其中必然有局限性，欢迎各种交流，随便拍。　Deep Learning 算法已经在图像和音频领域取得了惊人的成果，但是在 ...

NLP系列——文本向量化

标签： nlp 神经网络

主要介绍word2vec词向量算法和doc2vec文本向量算法。文本表示是自然语言处理中的基础工作，直接影响到整个自然语言处理系统的性能，而文本向量化是文本表示的一种重要方式。文本向量化根据对象的差异分为： word2...

Transformer

标签：自然语言处理

文章目录Self Attention(Transformer)TransformerTransformer整体结构Encoder-Decoder结构self-Attention的计算Q-K-V的计算Attention的计算Multi-Headed-Attention的计算Positional EncodingLayerNorm&...

使用bert 快速进行词嵌入word2vec教程

标签： word2vec 词嵌入 bert

就是将一个词或者一个句子映射到一个高维空间，得到一组向量最近遇到一个任务，需要对特定的语句key 去提取相应的 value：比如从一个身份证 ocr 结果中，输入姓名得到对应人的名字一想到这里，为了能够...

【转载】Deep Learning in NLP （一）词向量和语言模型

虽说现在的精力不在DL上面，不过看到相关的资料还是忍不住收藏。原文地址：http://licstar.net/archives/328

BERT原理介绍

1. 引言 2018年，谷歌提出了一个新的模型BERT(Bidirectional Encoder Representations from Transformers)，刷榜了11项NLP任务，可以说是NLP的一个新的里程碑。它的思想其实跟我们前面介绍的GPT模型非常相似，只是...

【自然语言处理】word2vec/doc2vec基础学习以及简单实践

标签：自然语言处理词向量/word2vec 段向量/doc2vec

文章目录一、前言二、向量化算法word2vec2.1 引言2.2 word2vec原理2.3 词的表示三、神经网络语言模型四、C&W模型五、CBOW模型5.1 CBOW模型结构图5.2 CBOW的输入输出六、Skip-gram模型6.1 Skip-gram模型结构图...

自然语言处理（二）：余弦算法计算词汇相似度

标签： python 深度学习机器学习

词向量可以表示单词间的内在联系，即两个单词的词向量通过计算可以得出其关联程度，词向量相似度计算公式主要有:欧氏距离、余弦相似度、Jaccard距离、编辑距离等几种，本文主要介绍欧式距离与余弦相似度。...

【深度学习】NLP自然语言处理

标签：深度学习自然语言处理机器学习

统计语言模型是所有 NLP的基础，被广泛应用与语音识别、机器翻译、分词、词性标注和信息检索等任务。传统的统计语言模型是表示语言基本单位（一般为句子）的概率分布函数，这个概率分布也是该语言的生成模型。通俗的...

论文笔记（二）

所以接下来我们将在模型里引入权重来反映子树的结构，引入层次嵌入的方法生成向量S。层次嵌入的效率将在后面的文章被实验证明。层次嵌入的图示如下：让我们先来翻译一下图示下的文字，每一个模块中是一个嵌入...

深度学习：词嵌入之word2vec

标签：深度学习 Embedding 词嵌入

word2vec简介深度学习在自然语言处理中第一个应用：训练词嵌入。Google 的 Tomas Mikolov 在《Efficient Estimation of Word Representation in Vector Space》和《Distributed ...

基于神经网络的文本特征提取——从词汇特征表示到文本向量

标签：神经网络人工智能深度学习

理解了基础的神经元模型，神经网络就很好理解了。神经元就像一块乐高积木，而神经网络就是搭的积木。如上图，xxx那一列，我们称为输入层，输出y\hat{y}y那列称为输出层，中间那列称为隐藏层。...

探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

标签：人工智能 LLM 大语言模型

探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

使用BERT生成句向量

之前的文章介绍了BERT的原理、并用BERT做了文本分类与相似度计算，本文将会教大家用BERT来生成句向量，核心逻辑代码参考了hanxiao大神的bert-as-service，我的代码地址如下：代码地址：BERT句向量传统的句向量 ...

ELMo论文解读——原理、结构及应用

标签：自然语言处理词向量 elmo

词向量是自然语言处理任务中非常重要的一个部分，词向量的表征能力很大程度上影响了自然语言处理模型的效果。如论文中所述，词向量需要解决两个问题：（1）词使用的复杂特性，如句法和语法。（2）如何在具体的语境...

【Transformer系列】深入浅出理解Transformer网络模型（综合篇）

标签： transformer 深度学习人工智能

【Transformer系列】深入浅出理解Transformer网络模型（综合篇）

TensorBoard Projector 简易指南

标签：深度学习 tensorflow 词向量

原文发表在 TensorBoard Projector 简易指南 - Alan Lee。 TensorBoard（TB）是一个非常棒的模型可视化工具，早期我也写过一篇文章来详细介绍各个面板。不过士别三日，当刮目相待。现在的 TB 和那时相比变化太多了...

语义检索系统【三】：基于Milvus 搭建召回系统抽取向量进行检索，加速索引

标签： milvus 人工智能自然语言处理

语义检索系统【三】：基于Milvus 搭建召回系统抽取向量进行检索，加速索引

什么是特征向量的级联

举个例子，假设你正在训练一个文本分类模型，你可以使用多个词向量来表示每个单词，然后将这些词向量级联在一起以捕捉更多的语义信息。这可以提高模型在处理复杂文本时的准确性。总之，特征向量级联是一种使用多个...

自然语言处理-词向量技术

标签：自然语言处理人工智能

简单介绍关于自然语言处理中的词向量技术发展及分类。

NLP系列文章（三）——文本向量的表示方法

标签： nlp 自然语言处理深度学习

文本向量的表示方法基于词向量的表示方法有监督文本表示方法基于词向量的表示方法虽然one-hot和TF-IDF的表示方式也成为词向量，但是我们这里讨论的基于词向量的表示方式是围绕分布式词表征进行的。也就是利用Word2...

NLP学习路径（七）：NLP文本向量化

标签： nlp

当前阶段，对文本向量化大部分研究都是通过词向量化实现的。但也有一部分将文章或者句子作为文本处理的基本单元，于是产生了doc2vec和str2vec技术。（2）方法 word2vec(词语)，doc2vec(文章)，str2vec(句子) 2、...

”词向量与词向量拼接“ 的搜索结果

【论文笔记】融合标签向量到BERT：对文本分类进行改进

【预训练后中间层向量不再变】【动态（组合各中间层向量的权重随任务变化）获取基于上下文的词向量；...

Transformer in NLP（2）【图解 transformer】

自然语言处理之——文本向量化

高维向量降维（PCA）方法学习——学习笔记

Deep Learning in NLP （一）词向量和语言模型

NLP系列——文本向量化

Transformer

使用bert 快速进行词嵌入word2vec教程

【转载】Deep Learning in NLP （一）词向量和语言模型

BERT原理介绍

【自然语言处理】word2vec/doc2vec基础学习以及简单实践

自然语言处理（二）：余弦算法计算词汇相似度

【深度学习】NLP自然语言处理

论文笔记（二）

深度学习：词嵌入之word2vec

基于神经网络的文本特征提取——从词汇特征表示到文本向量

探索检索增强生成（RAG）技术的无限可能：Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

使用BERT生成句向量

ELMo论文解读——原理、结构及应用

【Transformer系列】深入浅出理解Transformer网络模型（综合篇）

TensorBoard Projector 简易指南

语义检索系统【三】：基于Milvus 搭建召回系统抽取向量进行检索，加速索引

什么是特征向量的级联

自然语言处理-词向量技术

NLP系列文章（三）——文本向量的表示方法

NLP学习路径（七）：NLP文本向量化

推荐文章