hive修复所有表-天翼云

hive修复所有表

2023-08-01 08:53:54 阅读次数：365

众所周知 hive是hive ，hdfs是hdfs，mysql是mysql。

但是某种意义上来说hive=hdfs(数据文件)+mysql(元数据)。

所以要牵扯到一个msck repair了。

背景：插入分区表报错，但是又不是全错。举例动态分区，查出了5个分区，结果4个成功，1一个失败！！！难搞是那亿万分之一的网络刚好坏在那一刻？不可能，直接百度

Error: Error while compiling statement: FAILED: Execution Error, return code 40000 from org.apache.hadoop.hive.ql.exec.MoveTask. Exception when loading 1 partitions in table dm_kpi_f_org_detail_t with loadPath=hdfs://s2-cdp-hdfs-cluster/user/hive/warehouse/dwdmdata.db/dm_kpi_f_org_detail_t/.hive-staging_hive_2022-11-06_20-00-26_959_2153487181914795304-11467/-ext-10000 (state=08S01,code=40000)
Closing: 0: jdbc:hive2://cdp-node46102:2181,cdp-node46103:2181,cdp-node46105:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2
hivesql execute failed

hive - return code （数字） from org.apache.hadoop.hive.ql.exec错误系列集合_cg6的博客-CSDN博客

hive修复所有表

深层次原因分析。

我们刚昨晚cdh迁移到hive。假设这个表student 以前有12345 共5个分区，我们把数据迁移过来的时候，没有msck，那么hive的元数据里就没有这5个分区的记录。

现在继续跑sql查出来了23456这5个分区，然后动态分区 insert into，这个时候可能就有问题了。

问题

1、hive还是否需要重建2345这个4个目录？

2、hive是否要删除所有数据，重建所有分区？

本来想混过去，还是想了想，直接实战来测下这个问题。

先附上一个修复所有表的脚本。凑合用吧。也可以直接去mysql库去把所有表拉出来。一个意思

hdfs dfs -ls  /user/hive/warehouse/*.db*|awk -F'/' '{print $5,$6}'> msck.sh
sed -i '/^ $/d' table
sed -i 's/db //' table
sed -i 's/^/msck repair table /g' table 
sed -i 's/$/;/g' table 
sed -i '/__/d' table
sed -i '/stage/d' table 
sed -i '/tmp/d' table 
sed -i '/temp/d' table

最后肯定还有很多表是不存在或者是视图的。不建议beeline -f msck.sh 因为遇到报错就会停止。

直接beeline进入客户端后复制粘贴，报错后会继续执行。

-----------------------------开始实验---------------------------------------

有点累，周五了，周一搞

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

hive修复所有表

hive修复所有表

相关文章

Selenium Webdriver 3.X源码分析之核心代码common

hive执行分区修复语句（MSCK REPAIR TABLE）时报FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.

启动hadoop集群时报错ERROR: Attempting to operate on hdfs namenode as root

Python测试开发初稿

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证 不是银弹

【基础-配置文件】：hadoop配置文件作用概述ing

【002hive基础】hive的库、表与hdfs的组织逻辑

【运维】hive 终端突然不能使用：Hive Schema version does not match metastore‘s schema version

【Hive基础】hive常见操作速查

【Hive 运维】JDBC使用Hive UDF：Hive UDF打通hiveserver2

作者介绍

最新文章

手写归并排序

1到100万以内，如何打印99万个不重复的随机数？

sqoop 的安装与常用抽数操作

给定一个无序数组，里面数都是成双数的，只有一个数是成单数的，求这个数？

给定一个无序数组，里面数都是成双数的，只有一个数是成单数的，求这个数？

【JAVA】-- 验证码的实现

热门文章

58如何调出eclipse左边文件栏

java163-同步方法锁

java156-序列化

java162-同步对象锁

大数据Spark “蘑菇云”行动第93课：Hive中的内置函数、UDF、UDAF实战

大数据Spark “蘑菇云”行动第94课：Hive性能调优之Mapper和Reducer设置、队列设置和并行执行、JVM重用和动态分区、Join调优

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【JAVA】-- 验证码的实现

Vue课程43-事件绑定-通过this访问数据源中的数据

java163-同步方法锁

hive 的数据案例 统计网站的数据信息

hdp 2.6.4 扩容增加数据节点

flink窗口函数之reduceFuction学习

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证不是银弹

hive 的数据案例统计网站的数据信息