语言模型 - 程序员宅基地

N-Gram语言模型

n-gram是一种统计语言模型，用来根据前(n-1)个item来预测第n个item。在应用层面，这些item可以是音素（语音识别应用）、字符（输入法应用）、词（分词应用）或碱基对（基因信息）。一般来讲，可以从大规模文本或音频...

掩码语言模型(Masked Language Model)mlm

发布小助手发表于：2020-4-15 20:48:40120次点击关注私信发送私信您没有权限发布私信掩码语言模型(Masked Language Model) 深度学习 — > NLP — >Improving Language Understanding by Generative Pre-...

大语言模型学习路线：从入门到实战

标签：人工智能语言模型自然语言处理

本文提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。

人工智能时代：AI提示工程的奥秘 —— 驾驭大语言模型的秘密武器

标签：人工智能语言模型自然语言处理

掌握了提示工程的艺术，你就能更好地与大语言模型沟通，发挥它们的最大效能。这不仅是一项技能，更是一种理解机器智能并能与之和谐共处的方式。让我们在智慧的海洋中乘风破浪，探索更多未知的可能。随着大语言模型的...

私有部署类chatGPT大语言模型的几种方案

标签： chatGPT 大语言模型 GLM-6B

架构，具有 62 亿参数。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答，更多信息请参考我们的。...

语言模型2：二元文法求句子概率代码

在上一篇博客里，简单的介绍了语言模型，其中举了一个例子，这里就用代码来实现实现目标句子出现概率的求值。回顾语料库：研究生物很有意思。他是研究应用。踏实研究生物的。他实验救生物的。他大学时代是...

预训练语言模型综述（二）—— 预训练任务及训练策略

本系列文章是笔者以邱锡鹏老师《Pre-trained Models for Natural Language Processing: A Survey》为主要参考材料所做的关于“预训练（语言）模型综述”的记录，所涉及之素材也包括其他相关综述与未被纳入此综述的...

语言模型和ppl

标签：语言模型 ppl

语言模型的ppl计算公式：

开源大型语言模型(llm)总结

标签：语言模型人工智能自然语言处理

大型语言模型在ChatGPT以后经历了快速的发展。这些发展包括模型规模的增加、领域专精化、语义理解和推理能力的提升、训练效率和速度的提高，以及对偏见的理解和应对等方面。除了以上6个比较好的开源大语言模型外，...

Stanza语言模型下载

下载模型代码 importstanza stanza.download('en') 模型下载地址 http://nlp.stanford.edu/software/stanza/1.0.0/en/default.zip 很多朋友下载连接超时错误：ConnectionError。别放弃，检查好网络继续尝试，你...

【大数据&AI人工智能】AI 何以涌现？复杂适应系统视角的ChatGPT和大语言模型

标签：人工智能

总结来看，现在已经在各个领域大展身手的AI大模型可以被我们看作一个复杂适应系统，这个特殊的系统展现出了一系列复杂系统常见的现象规律，例如涌现现象、规模法则等等。因而，AI大模型有可能成为复杂科学可以大展...

「翻译」BERT 多语言模型

标签： BERT Deep Learning

Update: 2018/12/17 我们对中文使用基于字符的标记化...我们不打算发布更多单语言模型，但我们可能会在未来发布这两种版本的BERT-Large版本： BERT-Base, 多语言 Cased (新版, 推荐): 104种语言, 12-layer, 768-...

10个大型语言模型(LLM)常见面试问题和答案解析

标签：人工智能深度学习大语言模型

今天我们来总结以下大型语言模型面试中常问的问题。

使用KenLM训练n-gram语言模型（中文）

N-gram语言模型构建KenLM工具使用KenLM构建中文语言模型流程 KenLM工具相比于SRILM训练工具包，KenLM的诞生更later，训练速度更快，支持单机大数据集训练，相关链接如下： KenLM开源github KenLM 工具包主页 KenLM...

AI 大型语言模型的最佳应用白皮书手册

标签：人工智能语言模型自然语言处理

大型语言模型是在大量文本数据上训练的人工智能软件。他们使用称为深度学习的高级计算机技术 - 机器学习模型算法来理解和分析大量语言信息，包括语言应用程序名称。这有助于他们创建听起来就像一个人写作或说话的...

ChatGPT: 深入解读OpenAI的语言模型技术

标签： chatgpt 语言模型人工智能

其出色的语言生成能力和实用性使得它成为了业界最受欢迎的语言模型之一。许多企业和开发者都在积极探索如何将ChatGPT应用于各种实际场景中，以改进用户体验、提升自动化程度，并推动人工智能技术的进一步发展。

语言模型概述与应用领域：从自然语言处理到智能助手

标签：自然语言处理人工智能语言模型

作者：禅与计算机程序设计艺术 “语言模型”（Language Model）是用统计的方式对一系列文本的概率进行建模、评估及分析的一类模型。...为了方便理解，这里将语言模型称为“语言模型”，实则它就是利用计算机科

大语言模型为什么这么强？关键步骤是……

标签：语言模型人工智能自然语言处理

研究人员发现，随着语言模型参数量的不断增加，模型完成各个任务的效果也得到不同程度的提升。大语言模型是指模型参数量超过一定规模的语言模型，相比参数量较小的预训练模型（如 BERT、GPT-1、GPT-2 等）！大语言...

接踵而至，昆仑万维天工大语言模型发布

标签：语言模型人工智能 chatgpt

国产ChatGPT再次迎来新成员，4月17日下午，昆仑万维正式发布千亿级大语言模型“天工”，同时宣布即日起启动邀请测试。

【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》

标签：多标签文本分类

论文名称：《基于预训练语言模型的案件要素识别方法》发布期刊：《中文信息学报》期刊信息：CSCD 论文写作分析摘要：本文非常典型。首先网络模型是直接用的一篇英论的；亮点仍然在于应用领域的...

N元语言模型

标签：自然语言处理

语言模型是干嘛的？语言模型可以计算任何句子的概率。例如，“I love you”的概率是多少？用数学语言表述，NN元语言模型(NN-gram model)根据一个词语的前N−1N-1个词语，来计算这个词语的概率。如果我们有了一个2元...

大语言模型和大规模预训练模型的区别

标签：语言模型人工智能自然语言处理

大语言模型大规模预训练模型

ChatGPT基础知识系列之大型语言模型(LLM)初识

标签： chatgpt 语言模型人工智能

ChatGPT本质是一个对话模型，它可以回答日常问题、挑战不正确的前提，甚至会拒绝不适当的请求，在去除偏见和安全性上不同于以往的语言模型。ChatGPT从闲聊、回答日常问题，到文本改写、诗歌小说生成、视频脚本生成，...

自然语言处理中的语言模型预训练方法--ELMO

标签： ELMO

自然语言处理中的语言模型预训练方法--ELMO1.引言2. ELMO3. ELMO 方法4 ELMO使用5. 总结 1.引言在介绍论文之前，我将先简单介绍一些相关背景知识。首先是语言模型（Language Model），语言模型简单来说就是一串词...

【ChatGPT】ChatGPT 为啥...语言模型足够大就会涌现出新能力——谈复杂适应系统视角下的 ChatGPT 与 AI大模型

标签： chatgpt 语言模型人工智能

ChatGPT等AI大模型展现出了各种自然与人工复杂适应系统的普遍特征，例如涌现性（Emergence）、规模法则（Scaling Law）、临界相变、多尺度、层级等。那么，近期火热的AI大模型是否与从90年代发展起来的复杂适应系统...

2023年发布的25个开源大型语言模型总结

标签：开源语言模型人工智能

最后再补充2个刚刚发布的模型，一个是llama-2...开源大型语言模型正在迅速发展，开源社区发布了许多模型。这些模型为开发人员、研究人员和爱好者提供了一个非常大机会，可以在没有专有系统的情况下试验尖端的语言技术。

复旦大学自然语言处理实验室《大规模语言模型·从理论到实践》网络初版发布

标签：自然语言处理语言模型人工智能

为了使得更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大语言模型和理论基础，并开展大语言模型实践，复旦大学自然语言处理实验室张奇教授、桂韬研究员、郑锐博士生以及黄萱菁教授结合之前在...

入门通俗易懂的神经网络语言模型(NNLM)详解

标签：神经网络 NNLM 输入层

文章目录神经网络语言模型(NNLM)输入层（投射层）隐藏层输出层计算复杂度神经网络语言模型(NNLM) 输入层（投射层）一个文本，由N个词语组成，现在呢：想根据前N个词语来预测第N个词语是啥？我们采用的语料库...

11月推荐阅读的12篇大语言模型相关论文

标签：语言模型人工智能自然语言处理

现在已经是12月了，距离2024年只有一个月了，本文总结了11月的一些比较不错的大语言模型相关论文。

RNN应用-基于RNN的语言模型

标签： RNN 语言模型

以下内容来自：https://www.zybuluo.com/hanbingtao/note/541458现在，我们介绍一下基于RNN语言模型。我们首先把词依次输入到循环神经网络中，每输入一个词，循环神经网络就输出截止到目前为止，下一个最可能的词。...

”语言模型“ 的搜索结果

N-Gram语言模型

掩码语言模型(Masked Language Model)mlm

大语言模型学习路线：从入门到实战

人工智能时代：AI提示工程的奥秘 —— 驾驭大语言模型的秘密武器

私有部署类chatGPT大语言模型的几种方案

语言模型2：二元文法求句子概率代码

预训练语言模型综述（二）—— 预训练任务及训练策略

语言模型和ppl

开源大型语言模型(llm)总结

Stanza语言模型下载

【大数据&AI人工智能】AI 何以涌现？复杂适应系统视角的ChatGPT和大语言模型

「翻译」BERT 多语言模型

10个大型语言模型(LLM)常见面试问题和答案解析

使用KenLM训练n-gram语言模型（中文）

AI 大型语言模型的最佳应用白皮书手册

ChatGPT: 深入解读OpenAI的语言模型技术

语言模型概述与应用领域：从自然语言处理到智能助手

大语言模型为什么这么强？关键步骤是……

接踵而至，昆仑万维天工大语言模型发布

【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》

N元语言模型

大语言模型和大规模预训练模型的区别

ChatGPT基础知识系列之大型语言模型(LLM)初识

自然语言处理中的语言模型预训练方法--ELMO

【ChatGPT】ChatGPT 为啥...语言模型足够大就会涌现出新能力——谈复杂适应系统视角下的 ChatGPT 与 AI大模型

2023年发布的25个开源大型语言模型总结

复旦大学自然语言处理实验室《大规模语言模型·从理论到实践》网络初版发布

入门通俗易懂的神经网络语言模型(NNLM)详解

11月推荐阅读的12篇大语言模型相关论文

RNN应用-基于RNN的语言模型

推荐文章