语言模型 - 程序员宅基地

一文解码语言模型：语言模型的原理、实战与评估

标签：语言模型人工智能自然语言处理

在本文中，我们深入探讨了语言模型的内部工作机制，从基础模型到大规模的变种，并分析了各种评价指标的优缺点。文章通过代码示例、算法细节和最新研究，提供了一份全面而深入的视角，旨在帮助读者更准确地理解和评估...

从语言模型到ChatGPT：大型语言模型的发展和应用

标签：语言模型 chatgpt 人工智能

大模型有一个很重要的涌现能力（Emergent ability）就是In-Context Learning（ICL），也是一种新的范式，指在不进行参数更新的情况下，只在输入中加入几个示例就能让模型进行学习。

大规模语言模型：从理论到实践

标签：语言模型 LLM NLP

大规模语言模型（Large Language Models，LLM），也称大规模语言模型或大型语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标注文本进行训练。自 2018 年以来...

NLP-语言模型

标签：深度学习自然语言处理

语言模型 1、语言模型的概念语言模型(language model)是自然语言处理的重要技术。自然语言处理中最常见的数据就是文本数据。我们可以把一段自然语言文本看作一段离散的时间序列。假设一段长度为TTT的文本中的词依次...

NLP入门——语言结构/语言建模

标签：自然语言处理人工智能 1024程序员节

1. 语素 morphemes词素是最小的有意义的语言单位，不能够进一步划分为更小的单位而不破话或彻底改变其词汇意义或语法意义。语素和词的区别在于，许多语素不能独立存在。而能够单独存在并且有意义的语素叫做；不能...

语言模型（language model）

标签：语言模型人工智能自然语言处理

语言模型是一种用于预测文本序列中下一个词或字符的概率分布的模型。它可以捕获语言结构的某些方面，如语法、句式和上下文信息。传统的语言模型通常使用N-gram方法或隐藏马尔可夫模型，但这些模型往往不能捕捉到长...

大型语言模型 (LLM)全解读.pdf

标签：语言模型

大型语言模型 (LLM)全解读

语言模型（N元语言模型&平滑&语言模型评价指标）

标签：语言模型机器学习人工智能

重现N-gram模型，代码，改进和优化。理解N-gram模型的概念和理解。除此之外，还有一部分有关于PPL的理解和公式的定义。

一文读懂“大语言模型”

标签：语言模型人工智能自然语言处理

深度学习是机器学习的分支，大语言模型是深度学习的分支。机器学习是人工智能（AI）的一个子领域，它的核心是让计算机系统能够通过对数据的学习来提高性能。在机器学习中，我们不是直接编程告诉计算机如何完成任务，...

大型语言模型 (LLM)全解读

标签：语言模型人工智能自然语言处理

大型语言模型是一种深度学习算法，可以执行各种自然语言处理 (NLP) 任务。大型语言模型底层使用多个转换器模型底层转换器是一组神经网络。大型语言模型是使用海量数据集进行训练的超大型深度学习模型。这也是它们...

【AI 人工智能】大型语言模型的实现技术原理与应用

标签：语言模型深度学习人工智能

大型语言模型的实现需要使用多种技术，包括语言数据的处理、模型的构建和训练、模型的部署和应用等。模型的构建是指根据语言数据的特征信息，构建出一组合适的神经网络结构，以实现对语言的建模和处理。语言模型是一...

开源大语言模型(LLM)汇总（持续更新中）

标签：语言模型人工智能深度学习

随着ChatGPT的火爆，越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总，跟踪每天不发的大语言模型和精调语言模型。

大语言模型的最新研究方向综述

标签：语言模型人工智能深度学习

文章梳理了自然语言处理( Natural Language Processing, NLP)领域的大语言模型最新研究方向。

大语言模型研究进展综述

标签：语言模型人工智能自然语言处理

该综述文章系统回顾了大语言模型的最新进展，介绍了重要概念与相关技术，最后总结了大语言模型的若干挑战与未来研究方向：（1）大模型相关的理论和本质；（2）更优的模型架构；（3）更有效的训练方法；（4）更高效的...

本地化部署大语言模型 ChatGLM

标签：语言模型 javascript 人工智能

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）...

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

标签：人工智能深度学习自然语言处理

语言模型（Language Model，LM）（也称统计语言模型）是描述自然语言概率分布的模型，是一个非常基础和重要的自然语言处理任务。利用语言模型，可以计算一个词序列或一句话的概率，也可以在给定上文的条件下对接下来...

NLP领域大语言模型汇总

标签：自然语言处理语言模型人工智能

大语言模型是近年来人工智能领域重要研究方向之一。它们是基于深度学习技术构建的神经网络，可以自动学习和生成自然语言文本，如文章、对话、诗歌、代码等等。本文主要真针对目前比较火热的自然语言大语言模型，进行...

区别探索：掩码语言模型 (MLM) 和因果语言模型 (CLM)的区别

标签：自然语言处理知识图谱人工智能

在屏蔽语言模型下，我们通常屏蔽给定句子中一定比例的单词，并且模型预计会根据该句子中的其他单词来。另外，直观上这是有道理的，因为在学习每个单词的良好输入表示时，您会想知道。的分布，您可以权衡每个其他输入...

ChatGPT 用不了？一文分享国内好用大语言模型合集

标签：语言模型人工智能自然语言处理

当然，不同人的诉求不同，不同模型擅长的领域也有所不同，但是不同的人看法不同。本文提供自己接触过的还不错的国内大模型，仅供参考。欢迎加入我的知识星球，知识星球ID：15165241 一起交流学习。申请时标注来自...

语言模型BERT理解

标签：语言模型 bert 人工智能

bert浅析

2023年排行前五的大规模语言模型(LLM)

标签：语言模型人工智能自然语言处理

在人工智能迅速发展的今天，大型语言模型（LLMs）已经成为人们热议的话题。它们在自然语言处理（NLP）领域取得了巨大的成功，并且已经广泛用于各种应用，从文本生成到问题回答，再到对话式AI。我们看到了许多公司...

自然语言处理实战项目9-大语言模型的训练与文本生成过程，详细步骤介绍

标签：自然语言处理语言模型人工智能

大家好，我是微学AI，今天给大家介绍一下自然语言处理实战项目9-大语言模型的训练与文本生成过程，详细步骤介绍。大语言模型的训练是通过深度学习技术实现的。首先，需要准备一个庞大的文本数据集作为训练样本，这些...

大语言模型之二 GPT发展史简介

标签：语言模型 gpt 人工智能

这个模型是在GPT-3基础上的，是因为GPT-3的非议而提出的，这源于2022年的一篇paper，后面很多大语言模型，不论开源还是闭源都使用到了RLHF（reinforcement learning from human feedback ），这个模型是在GPT-3基础...

【自然语言处理】【大模型】PaLM：基于Pathways的大语言模型

标签：自然语言处理语言模型深度学习

虽然这些模型在数千个自然语言任务上实现了state of the art，但缺点是其需要大量任务相关的训练样本来微调模型。此外，至少有一部分参数需要更新来拟合任务，这增加了模型训练和部署的复杂性。

【ChatGPT】使用大型语言模型 (LLM) 进行特定领域语言（DSL）生成

标签： chatgpt 语言模型人工智能

随着深度学习和自然语言处理技术的快速发展，大型语言模型（LLM）已经在各种任务中取得了显著的成果。这些模型通过学习大量的文本数据，能够理解和生成复杂的自然语言。在这篇文章中，我们将探讨如何使用LLM进行特定...

【AI实战】开源大语言模型LLMs汇总

标签： LLM 大语言模型 llama

开源大语言模型LLM汇总

国内大语言模型对比评测（一）

标签：语言模型人工智能自然语言处理

针对国产大模型的横空出世并不断打磨其性能，这次评测我们将覆盖国内所有开源的大语言模型（如下），也针对大家常用功能的设计了测试问题，用于评测其生成结果的优劣。测试问题统一为中文，用于为国内用户使用大语言...

推演语言模型的大小与计算开销

标签：语言模型人工智能机器学习

2020年，OpenAI提出了在增加模型尺寸与提高模型性能之间的扩展定律，指出人们应该将大部分预算用于扩大模型规模。这篇论文直接推动了增大模型规模的浪潮。然而，在预算和内存有限的情况下，盲目扩大模型规模并不是...

大语言模型浅探一

标签：语言模型人工智能自然语言处理

近来，人工智能异常火热，ChatGPT的出现极大的推动了自然语言处理的发展，在推出仅两个月后，月活跃用户已达1亿，成为历史上增长最快的消费应用。OpenAI一直在研究生成式模型，在2018年6月发布了GPT，在2020年5月...

大语言模型会引发第四次产业革命——智能革命吗？

标签：人工智能 chatgpt

大模型这么好？那【大模型/基础模型/基模型】是什么？那就要从模型参数、模型结构、数据、算力、知识五个维度来解释大模型。...（1）关于语言大模型：模型参数规模的增长，经历了数次10倍级的跨越。

”语言模型“ 的搜索结果

一文解码语言模型：语言模型的原理、实战与评估

从语言模型到ChatGPT：大型语言模型的发展和应用

大规模语言模型：从理论到实践

NLP-语言模型

NLP入门——语言结构/语言建模

语言模型（language model）

大型语言模型 (LLM)全解读.pdf

语言模型（N元语言模型&平滑&语言模型评价指标）

一文读懂“大语言模型”

大型语言模型 (LLM)全解读

【AI 人工智能】大型语言模型的实现技术原理与应用

开源大语言模型(LLM)汇总（持续更新中）

大语言模型的最新研究方向综述

大语言模型研究进展综述

本地化部署大语言模型 ChatGLM

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

NLP领域大语言模型汇总

区别探索：掩码语言模型 (MLM) 和因果语言模型 (CLM)的区别

ChatGPT 用不了？一文分享国内好用大语言模型合集

语言模型BERT理解

2023年排行前五的大规模语言模型(LLM)

自然语言处理实战项目9-大语言模型的训练与文本生成过程，详细步骤介绍

大语言模型之二 GPT发展史简介

【自然语言处理】【大模型】PaLM：基于Pathways的大语言模型

【ChatGPT】使用大型语言模型 (LLM) 进行特定领域语言（DSL）生成

【AI实战】开源大语言模型LLMs汇总

国内大语言模型对比评测（一）

推演语言模型的大小与计算开销

大语言模型浅探一

大语言模型会引发第四次产业革命——智能革命吗？

推荐文章