语言模型 - 程序员宅基地

如何创建高效的Prompt和ChatGPT等大语言模型AI对话

标签：人工智能 chatgpt 语言模型

Prompt是一种用于指导大型语言模型生成自然语言文本的文本片段。在使用大型语言模型时，我们需要提供一个Prompt，以指导模型产生符合我们期望的文本结果。Prompt可以是一个单词、一句话、一段话或一个完整的篇章。举...

什么是让ChatGPT爆火的大语言模型(LLM)

标签： chatgpt 语言模型自然语言处理

AI 应用程序正在总结文章、撰写故事和进行长时间对话——而大型语言模型正在承担繁重的工作。大型语言模型或 LLM 是一种深度学习算法，可以根据从海量数据集中获得的知识来识别、总结、翻译、预测和生成文本和其他...

【大语言模型】5分钟了解预训练、微调和上下文学习

标签：人工智能预训练微调

预训练）是语言模型学习的初始阶段。在预训练期间，模型会接触到大量未标记的文本数据，例如书籍、文章和网站。在大量未标记文本数据上训练语言模型。比如说在包含数百万本书、文章和网站的数据集上预训练像 GPT-3 ...

【GPT-3】第1章大型语言模型时代

标签：自然语言处理深度学习 gpt-3

您无需从头开始构建模型来解决您的问题，而是使用针对更一般问题进行训练的模型作为起点，并使用特别策划的数据集在您选择的领域对其进行更具体的训练。它的数据集和模型都比用于 GPT-2 的数据大两个数量级：GPT-3 ...

语言模型(NNLM)

标签：自然语言处理

本文主要是记录神经网络语言模型

NLP-语言模型

标签：自然语言处理语言模型人工智能

后面的p(text)是一个语言模型。保证输出的像人话，有正确的语法。 text：中文、正确的写法、文本、明文 source：英文、错误的写法、语音信号、暗文对应的分别是机器翻译、拼写纠错、语音识别、密码破解 NCM前...

【自然语言处理】【Prompt】语言模型即知识库(Language Models as Knowledge Bases)

标签：自然语言处理语言模型深度学习

语言模型即知识库 Language Models as Knowledge Bases 一、简介预训练语言模型在进行预训练的时候，不但能够学习到语言知识，也能学习到一些世界知识。这些世界知识，可以利用“完形填空”的方式从预训练语言...

训练大语言模型的步骤

标签：语言模型人工智能机器学习

选择适合的模型架构、对于底座大模型，考虑使用Transformer的架构，这种架构在自然语言处理任务中表现出色。根据模型评估的结果和反馈，可以进行迭代和改进，调整模型架构、数据预处理步骤或训练策略，以提高模型的...

大模型从入门到应用——LangChain：模型（Models）-[大型语言模型（LLMs）：基础知识]

标签：人工智能深度学习自然语言处理

[2] LangChain中文网 - LangChain 是一个用于开发由语言模型驱动的应用程序的框架：http://www.cnlangchain.com/》系列文章中，我们将专注于通用的LLM功能，而有关使用特定LLM包装器的详细信息，请参见具体的示例。...

从零开始学NLP（七）语言模型

标签：人工智能自然语言处理算法

一、语言模型基础 1.什么是语言模型语言模型用来判断一句话从语法上是否通顺总结起来的话，语言模型最主要的作用是保证文本的语法结构，得到通顺的语句。语言模型是一种概率统计的方法，已经训练好的语言模型...

自学大语言模型之Bert和GPT的区别

标签：语言模型 bert gpt

GPT：GPT是一种基于Transformer的生成式预训练模型，其目标是通过自回归语言模型预训练来学习生成连贯文本的能力。BERT：BERT是一种基于Transformer的预训练模型，它的目标是通过双向语言模型预训练来学习上下文相关...

一文看懂多模态大型语言模型GPT-4

标签：语言模型人工智能深度学习

GPT-4是OpenAI公司3月推出的新一代人工智能预训练AI模型，是一个多模态大型语言模型，使用了1.5万亿个参数，是GPT-3.5的10倍之多，当然它也是世界上最大的人工智能模型。

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

标签：人工智能自然语言处理大语言模型

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

【深度学习】预训练语言模型-BERT

标签： bert 人工智能深度学习

BERT是一种预训练语言模型（pre-trained language model, PLM），其全称是Bidirectional Encoder Representations from Transformers。

nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet)

标签：自然语言处理 bert 语言模型

本文以QA形式总结对比了nlp中的预训练语言模型，主要包括3大方面、涉及到的模型有：单向特征表示的自回归预训练语言模型，统称为单向模型： ELMO/ULMFiT/SiATL/GPT1.0/GPT2.0；双向特征表示的自编码预训练语言...

大语言模型（LLM）及使用方法

标签：语言模型人工智能深度学习

大语言模型（LLM，Large Language Model）是一种基于深度学习的自然语言处理技术，它使用深度神经网络来学习自然语言的统计规律，以便能够自动地生成、理解和处理自然语言。大语言模型（LLM）是指使用大量文本数据...

「ChatGPT」爆火背后的大语言模型到底是什么？

标签： chatgpt 语言模型人工智能

点击上方关注 “终端研发部”设为“星标”，和你一起掌握更多数据库知识本文首发于我的知乎，终端研发部！...而在这个领域，最为重要的核心技术之一就是大语言模型。而在大语言模型中，ChatGPT就是备受关注...

轻松玩转开源大语言模型bloom（一）

标签：语言模型 python 人工智能

文字生成？知识问答？手把手带你体验人人都能玩的开源大语言模型。

全网最全大型语言模型Prompt工程指南---其一：介绍

标签：语言模型人工智能自然语言处理

本指南涵盖了Prompt的基础知识，提供关于如何使用提示来互动和指导大型语言模型（LLM）的粗略概念。本章节主题包括：基础Prompt；有关大型语言模型的参数设置；标准Prompt；Prompt所包含的元素

什么是语言模型？

简单地说，语言模型就是用来计算一个句子的概率的模型，也就是判断一句话是否是人话的概率？那么如何计算一个句子的概率呢？给定句子（词语序列）它的概率可以表示为：可是这样的方法存在两个致命的缺陷：...

关于最近爆火的chatGPT大型语言模型人工智能介绍

标签：人工智能机器学习语言模型

ChatGPT，一个由OpenAI训练的大型语言模型。被设计为能够理解和回答各种自然语言的问题，包括常见的知识性问题、技术问题、常见的语言问题以及其他各种主题。 chatGPT使用了大规模的神经网络，从海量的文本语料库中...

大语言模型-NLP模型汇总

标签： python

NLP

Kaldi中语言模型

标签：语言模型语音识别

kaldi中语言模型

大型语言模型综述（一）

标签：语言模型人工智能自然语言处理

作为一种主要的语言建模方法，在过去的二十年中，语言建模在语言理解和生成方面得到了广泛的研究，从统计语言模型发展到神经语言模型。最近，通过在大规模语料库上预训练Transformer模型，人们提出了预训练语言模型...

使用langchain打造自己的大型语言模型(LLMs)

标签：语言模型人工智能自然语言处理

今天我们用LangChain对接了大型语言模型(LLMs), 并让LMMs可以针对性的学习用户给定的特定数据，这些数据可以是文本文件，数据库，知识库等结构化或者非结构化的数据。当用户询问的问题超出范围时，机器人不会给出...

语言模型简介

标签：语言模型

语言模型语言模型可以对一段文本的概率进行估计，对信息检索，机器翻译，语音识别等任务有着重要的作用。语言模型分为统计语言模型和神经网络语言模型。下面一次介绍着两类语言模型。统计语言模型要判断一段...

【论文解读系列】Blip-2：引导语言图像预训练具有冻结图像编码器和大型语言模型

标签：语言模型深度学习人工智能

本文提出了BLIP-2，一种通用且高效的预训练策略，它可以从现成的冻结预训练图像编码器和冻结大型语言模型中引导视觉-语言预训练。BLIP-2通过一个轻量级的来弥合模态差距，并在两个阶段进行预训练。第一个阶段从冻结...

【LLM_01】ChatGLM2-6B本地安装与部署（大语言模型）

标签：语言模型人工智能自然语言处理

ChatGLM2-6B是一个开源的、支持中英双语的对话语言模型，基于General Language Model (GLM)架构。自我认知：“介绍一下你的优点”提纲写作：“帮我写一个介绍ChatGLM的博客提纲”文案写作：“写10条热评文案”信息...

预训练语言模型综述（一）—— 预训练语言模型及其历史

标签：预训练语言模型 LM 自然语言处理

语言有哪些基本特征： syntactic or semantic features of the language universal language representations (through large corpus) 特征的表示方法： Distributed Representation 发展史：模型发展简史 Non-...

论文分享 | 大语言模型的 few-shot 或许会改变机器翻译的范式

标签：语言模型机器翻译深度学习

动手点关注干货不迷路近期 NLP 界的大语言模型 (Large LM) 引领了一波研究热潮。有关大语言模型介绍的博文众多、此处推荐一下 Stanford 为此专门设计的一门课程（仅开源了讲义）。Stanford CS324 - Large Language ...

”语言模型“ 的搜索结果

如何创建高效的Prompt和ChatGPT等大语言模型AI对话

什么是让ChatGPT爆火的大语言模型(LLM)

【大语言模型】5分钟了解预训练、微调和上下文学习

【GPT-3】第1章大型语言模型时代

语言模型(NNLM)

NLP-语言模型

【自然语言处理】【Prompt】语言模型即知识库(Language Models as Knowledge Bases)

训练大语言模型的步骤

大模型从入门到应用——LangChain：模型（Models）-[大型语言模型（LLMs）：基础知识]

从零开始学NLP（七）语言模型

自学大语言模型之Bert和GPT的区别

一文看懂多模态大型语言模型GPT-4

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

【深度学习】预训练语言模型-BERT

nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet)

大语言模型（LLM）及使用方法

「ChatGPT」爆火背后的大语言模型到底是什么？

轻松玩转开源大语言模型bloom（一）

全网最全大型语言模型Prompt工程指南---其一：介绍

什么是语言模型？

关于最近爆火的chatGPT大型语言模型人工智能介绍

大语言模型-NLP模型汇总

Kaldi中语言模型

大型语言模型综述（一）

使用langchain打造自己的大型语言模型(LLMs)

语言模型简介

【论文解读系列】Blip-2：引导语言图像预训练具有冻结图像编码器和大型语言模型

【LLM_01】ChatGLM2-6B本地安装与部署（大语言模型）

预训练语言模型综述（一）—— 预训练语言模型及其历史

论文分享 | 大语言模型的 few-shot 或许会改变机器翻译的范式

推荐文章