语言模型 - 程序员宅基地

【AI人工智能】NLP（自然语言处理）和 LLM（大语言模型）详细对比：本文将详细比较这两种技术的特点、优...

大语言模型是一种具有深度学习模型的自然语言处理技术。它基于神经网络，使用大量的文本数据进行训练，从而使其能够在自然语言处理任务上表现出色。大语言模型的目标是构建一个通用的、具有智能的自然语言处理系统，...

【自然语言处理】【大模型】GLM-130B：一个开源双语预训练语言模型

大语言模型(LLMs)，特别是参数超过100B的模型呈现出诱人的scaling laws，其会突然涌现出zero-shot和few-shot能力。具有175B参数的GPT-3率先对100B尺度的LLM进行了研究：在各种基准上，使用32个标注示例可以显著...

FinGPT:开源金融大型语言模型

标签：金融语言模型人工智能

论文链接：https://arxiv.org/pdf/2306.06031v1.pdf大型语言模型(llm)已经显示出在不同领域彻底改变自然语言处理任务的潜力，引发了人们对金融...在本文中，我们提出了一个开源的大型语言模型，FinGPT，用于金融部门。

语音识别——语言模型

标签：语音识别语言模型深度学习

本博客主要是摘写洪青阳教授的《语言识别-原理与应用》的笔记，不足之处还请谅解。语音识别为：根据输入的观察值序列O，找到最可能的词序列W^\hat{W}W^。按照贝叶斯准则，识别任务可做如下转化： W^=argmax⁡W P(W...

大型语言模型与文本摘要

标签：人工智能机器学习语言模型

抽取式摘要是自然语言处理中的一项重要任务，它旨在通过直接提取句子将长文档压缩成更短的版本。最近引入的ChatGPT由于其在广泛的下游任务上的卓越性能而引起了NLP社区的极大兴趣。然而，对事实性和可靠性的担忧阻碍...

大规模语言模型应用实战之系列直播课

标签：深度学习人工智能

本课程主要是分享当前分享当下爆火的【大规模语言模型】背后的原理、发展轨迹、常见使用场景、实际应用技巧与优化方法，由业内技术大牛，行业及实战经验丰富的讲师进行技术分享。 ♥  7月12日起连续5场系列...

【AI人工智能】用于代码生成的大型语言模型 Large Language Models for Code Generation

标签：人工智能

大型语言模型通常采用Transformer等注意力机制架构,能够有效捕获输入序列中长程依赖关系。具体而言,编码器将输入序列映射为上下文表示,解码器则根据上下文和已生成的部分序列预测下一个token。代码生成任务中的输入...

大语言模型：LLM的概念是个啥？

标签：语言模型人工智能自然语言处理

大语言模型（维基：LLM-large language model）是以大尺寸为特征的语言模型。它们的规模是由人工智能加速器实现的，人工智能加速器能够处理大量文本数据，这些数据大部分是从互联网上抓取的。 [1]所构建的人工神经...

【人工智能】LLM 大型语言模型和 Transformer 架构简介

标签：深度学习人工智能机器学习

然而，传统的机器学习模型，例如神经网络，并不能天生理解输入的顺序。...这篇博文将探讨 LLM（大型语言模型）和转换器架构的基本概念，转换器架构是所有带有转换器的语言模型的构建块，包括 GPT。

持续汇总国内顶尖语言模型API

标签：语言模型人工智能自然语言处理

为对语言模型API感兴趣的开发者提供一站式信息汇总，帮助开发者选择最适合自己需求的API。更新时间“2024年2月5日”

自然语言处理从入门到应用——动态词向量（Dynamic Word Embedding）：双向语言模型

标签：人工智能自然语言处理语言模型

对于给定的一段输入文本w1w2⋯wn，双向语言模型从前向（从左到右）和后向（从右到左）两个方向同时建立语言模型。这样做的好处在于，对于文本中任一时刻的词wt，可以同时获得其分别基于左侧上下文信息和右侧...

Langchain+本地大语言模型进行数据库操作的实战代码

标签： AIGC langchain 大语言模型

本文讲解了Langchain+本地大语言模型进行数据库操作的实战代码，希望能对尝试使用开源大语言模型进行SQL操作的同学们有所帮助。文章目录 1. 前言 2. 代码思路剖析 3. 实战代码

大语言模型损失函数详解

标签：深度学习人工智能

大语言模型损失函数详解，以自动编码式语言模型和自动回归式语言模型为例。

从ChatGPT出发：大模型与自然语言模型

标签： chatgpt 人工智能

GPT系列的系统详细介绍

大语言模型之四-LlaMA-2从模型到应用

标签：语言模型 llama 人工智能

最近开源大语言模型LlaMA-2火出圈，从huggingface的开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力评估、安全评估和责任发布...

语言模型（一）—— 统计语言模型n-gram语言模型

标签：人工智能自然语言处理算法

从传统的语言模型到统计语言模型，深入了解n-gram语言模型的原理、计算方法、优缺点等。

国内大语言模型对比评测（三）

标签：语言模型人工智能自然语言处理

针对国产免费使用的大语言模型，我们基于不同方面的问题去测试模型并给出一个基础结果和主观评价。希望通过该工作以帮助各位读者找到满足自己需求的大语言模型，提高大家的工作学习效率。对于大模型生成结果给出一个...

AI大模型探索之路-训练篇3：大语言模型全景解读

标签： AIGC 人工智能语言模型

大规模语言模型（Large Language Models，LLM），也称大语言模型或大型语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，通常使用自监督学习方法通过大量无标注文本进行训练。

语言模型介绍

词袋模型（One-hot）词袋模型：最早的以词为基本处理单元的文本向量化方法，词袋模型通过先构建一个包含语料库中所有词的词典，然后根据词典完成对每个词的向量化，进而完成文本向量化。通过词典将所有的词向量化...

【大模型】开源大型语言模型排行榜：清华大学开放式双语对话语言模型 chatglm-6b 榜上有名

标签：人工智能

1169 分稳居榜首，遥遥领先第二名 koala，他们都是 130 亿参数，而来自清华大学的 chatglm 只有 60 亿参数还仍在前五的序列，相比而言，有强大基础的 llama 就落后许多，已经排到第八位了，stablem 的大模型排名最后...

一网打尽：14种预训练语言模型大汇总

标签：算法大数据自然语言处理

预训练语言模型的无监督训练属性，使其非常容易获取海量训练样本，并且训练好的语言模型包含很多语义语法知识，对于下游任务的效果会有非常明显的提升。本文首先介绍预训练语言模型的里程碑方法，然后进一...

【ChatOCR】OCR+LLM定制化关键信息抽取（附开源大语言模型汇总整理）

标签： ocr paddlepaddle 大语言模型

OCR文字识别与大语言模型的结合，智能抽取感兴趣的关键信息，无需复杂繁琐的OCR提取结果后处理规则，大大提升泛化性。

ESM蛋白质语言模型学习笔记

标签：深度学习

ESM蛋白质语言模型学习笔记二、内容概述三、内容梳理（一）ESM-1b模型（二）MSA Transformer模型（三）ESM-1v模型

构建自己的ChatGPT：从零开始构建个性化语言模型

标签： chatgpt 语言模型人工智能

在本篇博客中，我们将探讨如何构建自己的ChatGPT（Generative Pre-trained Transformer），这是一种个性化语言模型，能够自动生成人类类似的文本内容。我们将逐步介绍了解ChatGPT和自然语言处理基础、构建ChatGPT...

自然语言处理（5）——语言模型

标签：自然语言处理语言模型人工智能

NLP学习笔记（5）——语言模型1. 基本概念1.1 概念导入1.2 划分等价类的方法——n元文法模型（n-gram）1.3 概率计算1.4 语言模型的应用1.4.1 音字转换问题1.4.2 汉语分词问题2. 参数估计2.1 最大似然估计2.2 数据...

预训练语言模型（PLMs）综述

标签：自然语言处理 python 深度学习

预训练语言模型(PLMs)是在大规模语料库上以自监督方式进行预训练的语言模型。在过去的几年中，这些PLM从根本上改变了自然语言处理社区。传统的自监督预训练任务主要涉及。在对这些PLM进行预训练后，可以对下游任务...

大语言模型之六- LLM之企业私有化部署架构

标签：语言模型人工智能自然语言处理

数据安全是每个公司不得不慎重对待的，为了提高生产力，降本增效又不得不接受新技术带来的工具，私有化部署对于公司还是非常有吸引力的。大语言模型这一工具结合公司的数据可以大大提高公司生产率。

国产大语言模型对比评测（二）

标签：语言模型人工智能自然语言处理

针对国产大模型的横空出世并不断打磨其性能，这次评测我们将覆盖国内所有开源的大语言模型（如下），也针对大家常用功能的设计了测试问题，用于评测其生成结果的优劣。测试问题统一为中文，用于为国内用户使用大语言...

【Pytorch神经网络理论篇】 19 循环神经网络训练语言模型：语言模型概述+NLP多项式概述

标签：神经网络学习 python

1 语言模型循环神经网络模型可以对序列片段进行学习，找到样本间的顺序特征。这个特性非常适合运用在语言处理方向。 1.1 语言模型简介语言模型包括文法语言模型和统计语言模型，一般指统计语言模型。 1.1.1 ...

OLLAMA：如何像云端一样运行本地大语言模型

标签：语言模型人工智能自然语言处理

您是否曾发现自己被云端语言模型的网络所缠绕，渴望获得更本地化、更具成本效益的解决方案？那么，您的探索到此结束。欢迎来到 OLLAMA 的世界，这个平台将彻底改变我们与大型语言模型 (LLM) 的交互方式，让我们可以...

”语言模型“ 的搜索结果

【AI人工智能】NLP（自然语言处理）和 LLM（大语言模型）详细对比：本文将详细比较这两种技术的特点、优...

【自然语言处理】【大模型】GLM-130B：一个开源双语预训练语言模型

FinGPT:开源金融大型语言模型

语音识别——语言模型

大型语言模型与文本摘要

大规模语言模型应用实战之系列直播课

【AI人工智能】用于代码生成的大型语言模型 Large Language Models for Code Generation

大语言模型：LLM的概念是个啥？

【人工智能】LLM 大型语言模型和 Transformer 架构简介

持续汇总国内顶尖语言模型API

自然语言处理从入门到应用——动态词向量（Dynamic Word Embedding）：双向语言模型

Langchain+本地大语言模型进行数据库操作的实战代码

大语言模型损失函数详解

从ChatGPT出发：大模型与自然语言模型

大语言模型之四-LlaMA-2从模型到应用

语言模型（一）—— 统计语言模型n-gram语言模型

国内大语言模型对比评测（三）

AI大模型探索之路-训练篇3：大语言模型全景解读

语言模型介绍

【大模型】开源大型语言模型排行榜：清华大学开放式双语对话语言模型 chatglm-6b 榜上有名

一网打尽：14种预训练语言模型大汇总

【ChatOCR】OCR+LLM定制化关键信息抽取（附开源大语言模型汇总整理）

ESM蛋白质语言模型学习笔记

构建自己的ChatGPT：从零开始构建个性化语言模型

自然语言处理（5）——语言模型

预训练语言模型（PLMs）综述

大语言模型之六- LLM之企业私有化部署架构

国产大语言模型对比评测（二）

【Pytorch神经网络理论篇】 19 循环神经网络训练语言模型：语言模型概述+NLP多项式概述

OLLAMA：如何像云端一样运行本地大语言模型

推荐文章