天翼云hive知识文档专栏是天翼云为开发者提供的互联网技术内容平台。内容涵盖hive相关内容资讯。开发者在hive专栏是可以快速获取到自己感兴趣的技术内容,与其他开发者们学习交流,共同成长。
Hive面试题
90 网站点击流数据分析案例(工作流调度)
截止今天学习大数据技术的笔记
存储引擎的概念是MySQL 的特点,而且是一种插入式的存储引擎概念。这决定了MySQL数据库中的表可以用不同的方式存倍。用户可以根据自己的需求,选择不同的存储方式、是否进行驶入处理等。
问题描述:yarn开启ACL用户认证之后,日志只有在任务执行的时候能看到,SPARK任务跑完之后,在去看日志报User[yarn] is not authorized to view the logs for container的提示解决方
在项目有读取特殊配置文件的地方(不是 Spring 的 application 配置),项目打包为 jar 后,无法从外部替换默认的配置文件。我自己尝试了 java -cp 的方式,发现没法启动(Spring Boot 打的包很特殊
1.针对没有变话的一张表生成id。(表中数据固定不会增加修改) ROW_NUMBER ()over() 针对所有数据生成自增id,即使所
mysql中的数据,表中列出了数据导入过程中的“脏”数据\t,\n,\r,Null,下面列出了解决思路 id=2 这里的des
Hive 中创建表的三种方式,应用场景说明及练习截图内部表和外部表的区别,练习截图分区表的功能、创建,如何向分区表中加载数据、如何检索分区表中的数据,练习截图一:hive HQL 的表操作:1.1.1创建数据库:1.1.2创建测试表:emp
集群为cdp 7.1.1 hive版本为3.1.1 可以看到是由权限访问hive的metastore的。 这里hive默认是acid
公司集群由cdh换成了cdp。 用spark代码测试 读取hive内的ods数据经过map等算子转化,然后存取到另外一个dw表里。代码都
LanguageManual DML - Apache Hive - Apache Software Foundation Stand
现象 datax执行hdfsreader->mysqlwriter的时候发现 2w+task 然后oom。 首先思考下为啥又2
比如table id int ,name string 我们可以 select * from table where id='
hive里经常需要将字符串转化为date或timestamp 或者转化为日期格式的string 先说一个简单的 cast(xx as d
众所周知 hive是hive ,hdfs是hdfs,mysql是mysql。 但是某种意义上来说hive=hdfs(数据文件)+mysq
之前研究过hive on spark,最后的文件生成个数hive-mapJoin和skewJoin-CSDN博客 现在在cdp了 使用的
hive3.1有update语法,但是目前没用还是采用的非事务表,所以我们用其他的办法来解决hive的update问题 简单的updat
Hive中如何实现层级查询 类似oracle中 connect by prior 实现的效果? - 知乎 大佬写的很详细,有兴趣自己看,
1.编写udf函数 引入pom文件 <dependencies> <dependency> <
2023-06-14 09:13:23
2023-04-25 10:21:36
2023-05-10 06:00:56
2023-06-14 09:05:39
2023-06-14 09:13:14
2023-05-31 08:48:11