天翼云大数据知识文档专栏是天翼云为开发者提供的互联网技术内容平台。内容涵盖大数据相关内容资讯。开发者在大数据专栏是可以快速获取到自己感兴趣的技术内容,与其他开发者们学习交流,共同成长。
OWASP物联网安全2018 TOP 10
在上文《[接口测试 - http.client篇] 16 基于http.client之POM实战一下》分享了如何应用POM模式来进行接口测试。
如何测试我们的数据质量?
随着越来越多的企业开启DevOps实践、进行持续集成(CI)和持续交付(CD),对于测试的反馈要求越来越快,以往只关注UI级自动化测试,已经难以满足效率改进的需要,那如何进一步改进测试效率呢?
Hadoop启动报错NoClassDefFoundError: javax/activation/DataSource解决方案
数据不再仅仅是一种竞争优势,它对组织的运营状况 (很多时候甚至是生存)至关重要。 当企业这 样的高管和数据负责人:他们希望使用数据构建适应 能力,以建立一种数据文化,让每个人都有能力应对 甚至最复杂的业务挑战
ETL测试工具和面试常见的问题及答案
Flink大数据实时计算系列-案例初体验:OrderTimeoutWithoutCep
Storm 是一个免费并开源的分布式实时计算系统。利用 Storm 可以很容易做到可靠地处理无限的 数据流,像 Hadoop 批量处理大数据一样,Storm 可以实时处理数据。
elasticsearch 是面向文档存储的,可以是数据库中的一条商品数据,也可以是订单数据... 这些东西都会被序列化成 json 的格式,存储在 es 中.
ElasticSearch - 基于 JavaRestClient 查询文档(match、精确、复合查询,以及排序、分页、高亮)
Patroni不是使用etcd的选举机制,而是利用etcd的原子性写的机制,来决定主库。
ES分布式搜索-索引库操作
Windows操作系统是大小写不敏感的,Linux操作系统是大小写敏感的。
前面学习了reduceFunction 和aggregateFunction 现在来学习processFunction 两者的区别是什么
注意源码注意,reduce就是combine两个value成为一个value,注意类型是一样的, 特性是 流式函数中数据是连绵
需求:每隔10s统计每个url的访问量。 需求分析 1.每隔10s 那么需要开窗 2.每个url 需要key by 3.统计访问量 需要
1.测试flink sql的时候 Exception in thread "main" org.apache.flink
众所周知 hive是hive ,hdfs是hdfs,mysql是mysql。 但是某种意义上来说hive=hdfs(数据文件)+mysq
flink local模式下启动 sink2kafka报错,具体报错如下 提取报错信息 Failed to construct kaf
2023-03-13 09:29:37
2023-03-13 09:32:12
2023-03-07 10:04:03
2023-03-10 10:21:07
2023-03-10 10:21:07
2023-03-13 09:29:37
随时自助获取、弹性伸缩的云服务器资源
便捷、安全、高效的云电脑服务
高品质、低成本的云上存储服务
为云上计算资源提供持久性块存储