天翼云spark知识文档专栏是天翼云为开发者提供的互联网技术内容平台。内容涵盖spark相关内容资讯。开发者在spark专栏是可以快速获取到自己感兴趣的技术内容,与其他开发者们学习交流,共同成长。
1、实验描述 利用Scala语言开发Spark WordCount程序实验时长:45分钟主要步骤:创建spark项目编写wordcoun
1、实验描述 以spark Standalone的运行模式安装Spark集群实验时长: 45分钟主要步骤: 解压安装Spark添
1、实验描述 根据实际业务需求使用spark 完成对Apache格式的日志内容的分析。实验时长: 45分钟主要步骤: 启动spa
之前在Hive on Spark跑TPCx-BB测试时,100g的数据量要跑十几个小时,一看CPU和内存的监控,发现 POWER_TEST阶段(依次执行30个查询)CPU只用了百分之十几,也就是没有把整个集群的性能利
基于CDH 6.3.0 搭建 Hive on Spark 及相关配置和调优 Hive默认使用的计算框架是MapReduce,在我们使用Hive的时候通过写SQL语句,Hive会自动将SQL语句转化成MapReduce作业去执行,但是Map
Client '1c5c0ae6-d56d-47b3-ae5a-d85fd941b14e_0' timed out waiting for connection from the Remote Spark Driver报
前言 Hive on Spark是指使用Spark替代传统MapReduce作为Hive的执行引擎,在HIVE-7292提出。Hive on Spark的效率比on MR要高不少,但是也需要合理调整参数才能最大化性能,本文简单列举一些调优项
大数据spark 蘑菇云行动前传 第1课:大数据时代的黄金语言scala 1 jvm的企业级霸主地位和今日java 2 黄金语言scal
原因: java.lang.NoClassDefFoundError: org/apache/spark/api/java/function/FlatMapFunction
原因:在start后,没有触发spark的流数据动作,任意一个触发DStream的动作即可解决该问题,比如JavaRece
spark streaming启动失败,报错:Cannot run program "python3" 如图: 找不
2023-04-13 09:31:18
2023-04-13 09:31:18
2023-04-23 09:44:23
2023-06-14 09:13:14
2023-06-14 09:13:14
2023-06-20 09:13:20