【玩转TableAgent数据智能分析】入门篇-程序员宅基地

技术标签: 算法  database  人工智能  数据结构  

数据分析是什么?数据分析,就是使用大量数据、统计和定量分析、解释和预测以及基于事实的管理来推动决策过程与实现价值增长。现在的企业越来越重视数据分析,渴望从自身积累的海量数据中挖掘出潜在价值,推动业务增长,提高企业效益。

如何进行数据分析?如何玩转数据分析?这是大部分企业在实行数据分析时遇到的最大难关。这时候,很多企业都会考虑借助于数据分析工具,但是市场上数据分析工具多种多样,在选择时要注意选择实用的。作为过来人,我可以推荐一些我自己在工作中常用的,最近上手体验了九章云极DataCanvas公司自主研发的TableAgent数据分析智能体,TableAgent让大模型对个人生产力的赋能,从写纪要、做总结上升到新的台阶,只要会提问,就能成为一个高级的数据分析师,洞察数据奥秘我们一起来看看吧!

 数据分析背景
  • 数字化时代,数据分析的重要性犹如空气般无处不在。商业数据分析是数字化管理、智能决策的基础,同时数据分析又是一个专业性极强的工作,描述性分析、诊断性分析、预测性分析,会让大多数只会用Excel的人望而生畏。
  • 数据分析在各个行业和领域中都发挥着重要的作用

 TableAgent是什么?
  • 2023年7月9日OpenAI发布了震撼全球的Code Interpreter插件,一时间人人都是数据分析师从梦想照进现实。其实早在6月28日九章云极DataCanvas公司就已经率先对外发布了TableGPT,如今Code Interpreter更名为Advanced Data Analysis,而TableGPT也带着一系列的重大升级以TableAgent为名重装上阵,面向社会开放公测。
  • TableAgent是在DataCanvas Alaya九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。
  • 会话式数据分析,所需即所得
  • 私有化部署,数据安全
  • 支持企业级数据分析,大规模、高性能
  • 支持领域微调,专业化
  • 透明化过程,审计监督
 
 TableAgent主要功能
  1. TableAgent 可以为企业提供私有化部署。Code Interpreter 对国内众多企业用户的最大障碍是企业数据因为安全性、合规等种种原因,不能传输到线上的共有服务平台。TableAgent 为企业提供私有化部署,系统部署在企业内部,数据不外流,从根本上解决了安全合规的问题,同时 TableAgent 也可以满足企业级数据的大规模、高性能分析的要求,这也是 Code Interpreter 目前的短板。
  2. 数据分析不同于对话、摘要、写作这一类的语言任务,需要理解数据、理解用户的分析需求,需要能够自动的写代码、调试代码、运行代码,还要理解代码运行生成的数据结果进而从中获得对数据的深刻洞察
  3. 代码生成任务,与一般的写作任务不同,写作可以容忍出现错别字,不会导致内容生成失败,但代码生成任务即便只是变量名错一个字符,都会导致整体无法运行,任务失败。因此基于代码生成来实现开放式数据分析对模型能力是极大的挑战。
  4. 做数据分析的大模型应用多数是基于固定指标体系或者是对现有分析系统接口的调用,这种技术路线的不需要生成代码,但开放性不足,用户的分析需求受限于现有指标体系的设计和分析系统的能力。TableAgent 选择了难度更高的代码生成路线,创造性的提出专家模型组的方法来解决这些难题。
TableAgent体验
  • 体验地址:TableAgent
  • 注册之后的主页面
  • 首先右侧是数据集,提供了一些样例数据集,可以选择,也可以自己上传数据集
  • 接下来,我们选择一个样例数据集,tableagent会根据数据集内容,帮我们设计一些分析场景,场景分析很有意思,比人脑都更全面
  • 贴心的列出表格缩略内容
  • 忍不住了,先体验一下尝鲜了。这种针对于商品营销类的数据分析应用场景是最多的,看看表现如何
  • 数据分析结果一目了然,达到了我们想要的效果
  • 惊喜的是后边,对于代码程序员也是福音
  • 基于数据分析模型,产出实现思路以及代码过程,让整个分析头尾相呼应,简直是太强大了
  • 同时,会贴心的给出分析结论以及扩散的统计维度和分析维度
  • 下面,我们上传自己真实场景的数据内容,格式如下
  • 分析数据准确度以及分享出来的柱状图情况比较明显
  • 分析过程中,函数的应用可以给开发人员提供更好的清晰思路来验证数据分析的结果
  • 多次尝试的过程,更清晰的看到思考过程,让人一目了然
  • 整个数据分析过程,让所有的分析结果以及计算维度和分析过程一目了然,解放了我们的双手和生产力。一次不错的体验!

TableAgent优势亮点
  • TableAgent是在DataCanvas Alaya九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力,私有化部署已经超越市面很多的数据分析模型。
  • TableAgent在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解
总结:
  1. 这个是融合创新应用的新成果。
  2. 九章云极DataCanvas公司自主研发的Alaya九章元识大模型是TableAgent背后的关键技术支撑。在Alaya基础大模型之上微调的Alaya-ZeroX模型组,通过一系列擅长不同能力的模型组合完成复杂的分析任务。不同参数规模的模型同时满足了对生成质量和推理性能的要求。
  3. 本次TableAgent发布带来的另外一个重要能力是专业化微调,不同行业不同企业在数据分析上有专业的语言背景和分析模型的独特需求,通用的分析工具很难满足专业化的要求,对此TableAgent为能够企业提供专业化微调。
  4. TableAgent为此配套设计了T+(Table Family)系统,能够高效的实现定制化的微调工作,同时系统具有自我迭代的能力,系统性的体系支撑更高效的实现数据分析各个环节的升级,让用户在无感知的情况下即可获得不断升级的数据分析体验。
  • DataCanvas Table Family (T+)
  • TableAgent:数据分析智能体
  • TableBench:数据分析能力评测基准
  • TableTuning:数据分析LM微调
  • TableInstruct:数据分析指令集
  • TableLive:自迭代引擎
  • Alaya-ZeroX:数据分析GPT模型组
  • DeepTables & YLearn:结构化数据深度学习、因果学习工具包
  • DataCanvas Table Family (T+) Conceptual Framework
  1. TableAgent未来将进一步融合非结构化数据的分析能力,并与自研的DingoDB多模向量数据库、DataCanvas Alaya九章元识大模型联合创新。未来,将在复杂分析任务、自动化、人机交互、智能体协同等方面进一步升级。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_38679763/article/details/134956186

智能推荐

Cisco AP-Mobility Express基础-程序员宅基地

文章浏览阅读647次。Part I 介绍1.1基本概况Cisco Mobility Express这个名词出现在Cisco “8”系列的AP上,例如现在的AP1852,AP2802,AP3802等都是Mobility Express AP,该类AP也有“胖/瘦”之分,所谓的胖AP,携带的是ME的镜像,而瘦AP,和其他的AP类似,携带的是Lightweight AP的镜像。这类AP也被叫做COS AP(...

html网页布局论文,DIV+CSS在网页布局制作中的应用-程序员宅基地

文章浏览阅读945次。网页设计与制作论文第三篇:DIV+CSS在网页布局制作中的应用摘要:布局对网页的作用类似于设计图对地产开发商的作用,制作商务网页的首要内容是对网页进行布局。常见的布局方式有:表格布局、框架布局、层布局,鉴于以上布局方式均存在一定的缺陷逐渐退出历史潮流。目前流行的布局方式是DIV+CSS来制作页面,DIV主要解决网页中的元素(如文字、图片、表格、音视频等)放置在网页显示位置的问题,而CSS主要解决网..._html和css项目论文

敏捷开发步骤简述_商业价值和工作量 优先级-程序员宅基地

文章浏览阅读1.6w次,点赞2次,收藏25次。1.用户需求分析转化为产品BACKLOG这个部分的内容由PM具体负责,主要的工作内容如下:用户调研、需求分析,确定产品迭代功能,出具产品BACKLOG。决定产品的发布日期与发布内容,给迭代计划预设目标。根据RIO(商业价值/工作量)排序优先级,考虑必要风险。 优先级排序:排序的目的,是弄清楚哪些需求最重要因此可能在最近的一两次迭代中进行开发。参与排序的条目一般足够接近半年的开发工作..._商业价值和工作量 优先级

2021 开发何不换种姿势 LLVM+clang+Meson+ninja_ninja 和clang-程序员宅基地

文章浏览阅读1.7k次。目前常见的C/C++开发多数使用的是gnu+makefile的开发方式,每次开发的时候编译的配置文件写的头疼.而使用cmake虽然可以自动辅助生成makefile文件,并且可移植性也变得更好的,不过也常常逃不掉要经常手动修改的时候自己的cmake文件的命运,那有没有更高效的方法呢?叮叮~LLVM+clang+Menson+ninja 豪华大礼包值得了解一下**LLVM和Clang 原意为 low level virtual machine,不过实际上现在的LLVM从来没有用过虚拟机,用于编译器的链_ninja 和clang

C语言实现的PLC软定时器 上升沿,下降沿判断算法及功能_c语言上升沿和下降沿程序-程序员宅基地

文章浏览阅读7.2k次,点赞18次,收藏21次。一、序言 使用单片机开发开发过程控制中,经常会用到定时,变量上升沿动作,下降沿动作,在业余做了个单独工具处理模块二、C代码组成如下共有.h文件和.c文件组成。2.1 F00200_utils.h代码构成#ifndef __F00200_UTILS_H__#define __F00200_UTILS_H__#include "stm32f10x.h"#define P..._c语言上升沿和下降沿程序

七种常见的逻辑门真值表_各大逻辑门真值表-程序员宅基地

文章浏览阅读6.2w次,点赞47次,收藏289次。(verilog学习笔记一之常见的逻辑门真值表)1、 与门:所有输入为高时,才会有输出高。逻辑函数表示为F=A*B。输入A输入B输出Y0000101001112、 或门:所有输入为低时,才会有输出低。逻辑函数表示为F= A + B。输入A输入B输出Y0000111011..._各大逻辑门真值表

随便推点

学生如何提高专业英文阅读能力 精选-程序员宅基地

文章浏览阅读428次。【 序:此文针对本科生和一、二年级的博士、硕士生,对高年级的博士生和博士后也应该有参考价值。该文的一些背景可以参考我此前关于提高英文写作能力的博文:http://www.sciencenet.cn/m/user_content.aspx?id=349932】 从小到大,我感性思维多一些,不善于读书。85至89年在清华生物系读本科期间,从未读过任何一种英文专业期刊。我受到的与英文阅读_学生如何提高专业英文阅读能力

威胁快报|首爆,新披露Jenkins RCE漏洞成ImposterMiner挖矿***新“跳板”-程序员宅基地

文章浏览阅读160次。简介阿里云安全于近日捕获到一起使用Jenkins RCE漏洞进行***的挖矿事件。除挖矿外,***者还曾植入具有C&C功能的tsunami***,也预留了反弹shell的功能,给用户带来极大安全隐患。由于***者直接复制了Jenkins系列漏洞发现者(Orange.tw)在博客上公布的poc,***payload含有"Orange.tw"字样,可能被误认为是漏洞发现者在进行测试,因此我们..._cve-2019-1003000 jenkins rce 复现

如何使用计算机勾绘汇水面积,汇水面积怎么计算-程序员宅基地

文章浏览阅读853次。雨水汇水面积应按地面、屋面水平投影面积计算。高出屋面的侧墙,应附加其最大受雨面正投影的一半作为有效汇水面积计算。也就是54.6*27计算就好,如果考虑最大受雨面积的话需要给出楼梯间突出屋面的高度。假设高度为3米,计算在计算一个最大受雨面3*(9+4.5)/2就好。也就是,1474.2+20.25=1494.45平方米。汇水面积指的是雨水流向同一山谷地面的受雨面积。跨越河流、山谷修筑道路时,必须建桥..._水库汇水区怎么画

面试知识积累,人工智能技术应用笔记(六,Python工程面试问题-程序员宅基地

文章浏览阅读649次,点赞11次,收藏5次。本篇为《人工智能技术应用》专栏的第六篇。希望以学习笔记的形式和大家一起了解和探索人工智能技术的实际应用。

在哪看oracle归档日志,oracle查看归档日志路径-程序员宅基地

文章浏览阅读2.6k次。oracle查看归档日志路径第一种办法是去默认目录$ORACLE_BASE/flash_recovery_area查看,在oracle10g、oracle11g系列的版本里面[oracle@pldb236 ~]$ ll $ORACLE_BASE/flash_recovery_areatotal 8drwxr-x---. 6 oracle oinstall 4096 Mar 14 18:33 stu..._oracle归档日志文件在哪

Mysql server出现“Mysql server has gone away”的错误的解决方式-程序员宅基地

文章浏览阅读3.7w次,点赞2次,收藏18次。一、最常见的原因分析及解决方法 wait_timeout 和 interactive_timeout在官方的文档中给出了出现“Mysql server has gone away”的错误的分析原因:https://dev.mysql.com/doc/refman/5.7/en/gone-away.html出现该问题的主要原因是:Mysql server服务器超时,并且关闭了与客户端的连接导致的。在这_mysql server has gone away

推荐文章

热门文章

相关标签