Hive - 程序员宅基地

Hive引擎替换为Spark（Hive on Spark）

Hive引擎替换为Spark（Hive on Spark）1、背景2、Hive引擎选择3、三种引擎如何切换引擎？4、hive on spark配置集群模式5、hive on spark参数调优6、结束语 1、背景 Hive on Spark是由Cloudera发起，由Intel、MapR等...

Spark on Hive & Hive on Spark，傻傻分不清楚

标签： hive spark big data

大数据技术与架构点击右侧关注，大数据开发领域最强公众号！暴走大数据点击右侧关注，暴走大数据！上车前需知Spark on hive 与 Hive on Spark 的区别Spark on ...

Hive CLI和Beeline的区别-Hive vs Beeline

标签： hive

Hive CLI和Beeline的区别-Hive vs Beeline Beeline主要是开发来与新服务器进行交互。Hive CLI是基于 Apache Thrift的客户端，而Beeline是基于SQLLine CLI的JDBC客户端。在本文中，我们将详细阐述Hive CLI和...

Hive表描述乱码

标签： hive mysql hadoop

在进行查看hive表字段描述信息的时候发现乱码一，查看当前编码 1.打开mysql查看当前编码 mysql> \s 看到当前编码格式 2.接着输入下面语句查看 mysql> show variables like "char%"; 二、我们修改my.cof...

Hive的内置HASH()函数使用哪种哈希算法

标签：算法 hive 人工智能

内置的HASH()函数使用哪种哈希算法？我理想地是在寻找SHA512/SHA256哈希...HASH函数(从Hive 0.11开始)使用类似于java.util.List#hashCode的算法。其代码如下所示: int hashCode = 0; // Hive HASH uses 0 as the s...

hive 的存储格式

标签： hive

hive的存储格式

HBase与Hive的整合

HBase与Hive的整合 hive与我们的HBase各有千秋，各自有着不同的功能，但是归根接地，hive与hbase的数据最终都是存储在hdfs上面的，一般的我们为了存储磁盘的空间，不会将一份数据存储到多个地方，导致磁盘...

Hive 多数组合并 CONCAT_WS

标签：数据库 sql hive

Hive 多数组合并使用CONCAT_WS和split 完成多个数组合成一个数组

将mysql数据导入到hive

标签： hive mysql sqoop

禁止转载

hive报错——FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask

标签：数据仓库大数据 apache

执行完报错了:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask。需要注意的是，之前的insert语句虽然报错了，但是已经向表里插入数据了，有可能会造成重复的数据。执行这个...

JDBC连接hive的配置说明

标签： hive hadoop

hive先验hive简介thrift协议hive本地运行JDBC访问 hive简介 https://developer.aliyun.com/article/100911 1 特点：一次写入，多次读出；处理海量数据； hdfs存储，mr处理；对实时性要求低； … 2 基本组成用户...

Hive3.1.2整合Spark3.0.0-HiveOnSpark

标签： hadoop mapreduce hdfs

Hive是一个Sql解析引擎，其不具备计算能力，Hive将Sql解析成为物理执行计划，将物理执行计划交由计算引擎执行计算，默认的执行引擎是MapReduce，但MapReduce执行速度慢，随着Spark的崛起，Hive也支持使用Spark作为...

Hive分区修复msck repair

标签： hive hadoop big data

Hive的[MSCK REPAIR TABLE] 命令全量修复分区，目的就是将分区信息更新到元数据库中。该命令通常用于分区表的分区修复。官方解释：（翻译版） Hive将每个表的分区信息保存在metastore中，如果通过hadoop fs -put...

20 | Hive + Spark强强联合：分布式数仓的不二之选

本文总结了Spark与Hive的集成方式，包括Spark with Hive和Hive on Spark。前者通过访问Hive Metastore实现数据加载和处理，提高了数据处理的灵活性和效率；后者则将Spark作为其后端的分布式执行引擎，实现了Hive与...

hive查看库名、表名

标签： hive 数据库 sql

hive 查看库名表名

hive01--hive的安装及配置

在hive内嵌模式与本地模式中，当启动hive cil（hive命令行模式），hive会在后台自动启动hive服务与metastoreserver独立进程。由于执行hiveql时，默认会寻找本地的resourcemanager，因此需要在resourcemanager所在的...

Hive与mysql的区别

标签： mysql hive

Hive采用了类SQL的查询语言HQL，因此很容易将Hive理解为数据库。其实从结构上来看，Hive和数据库除了拥有类似的查询语言，再无类似之处。数据库可以用在OLTP的应用中，但是Hive是为数据仓库而设计的，清楚这一点...

hivesql中 exists 用法

标签：大数据 hivesql hive

sql exists

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.me

标签： hive hadoop mysql

FAILED: HiveException java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 无论是启动hive后，show databases;还是查看数据：select * from test...

Hive增加列，调整列顺序，属性名等操作

标签： 1024程序员节 hive 数据仓库

hive添加字段到指定位置先添加字段到最后位置再移动到指定位置

hive中如何新增字段

标签： hive

1、方法1 alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE; 与alter table 表名 add columns (列名 string COMMENT '新添加的列')； CASCADE会刷历史分区字段 ...2、方法2 （适用于外部...

Hive入门教程| 使用JDBC操作hive的两种方式

标签： linux centos vmware

JDBC操作Hive一、启动hadoop集群二、在hive的安装目录下的bin/目录下启动hiveserver2三、两种JDBC的操作方式一、虚拟机中的hive的beeline端二、Windows本地idea集成开发环境1、创建maven项目并添加依赖到pom.xml文件...

hive springboot mybatis-plus

标签： hive spring boot java

pom文件 <dependency> <...org.apache.hive</groupId> <artifactId>hive-jdbc</artifactId> <version>2.1.1</version> <exclusions> <exc

hive 数字转换字符串_Hive数据类型转换

标签： hive 数字转换字符串

写在前面的话，学《Hive的那些事》序列文章，分享给大家。我会在接下来的时间整理有关Hive的资料，如果对Hive的东西感兴趣，请关注本博客。https://www.iteblog.com/archives/tag/hive的那些事在《Hive内置数据类型...

大数据之Hive：space函数

标签： big data hive 大数据

hive> select space(10) from dual; hive> select length(space(10)) from dual; 10 2、space函数与split函数结合，得到数组； space函数与split函数结合，可以得到空格字符串数组举例： hive>select ...