【wordcount】flink 代码快速入门-天翼云

【wordcount】flink 代码快速入门

2025-03-11 09:36:17 阅读次数：6

1. 依赖

    <dependencies>
        <!--    对于java版本的flink 使用   -->
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-java</artifactId>
            <version>${flink.version}</version>
            <!--            <scope>provided</scope>-->
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java_2.12</artifactId>
            <version>${flink.version}</version>
            <!--            <scope>provided</scope>-->
        </dependency>

        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients_2.12</artifactId>
            <version>${flink.version}</version>
        </dependency>


        <!--   针对于scala语言使用的     -->
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-scala_2.12</artifactId>
            <version>${flink.version}</version>
            <scope>provided</scope>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-scala_2.12</artifactId>
            <version>${flink.version}</version>
            <scope>provided</scope>
        </dependency>


    </dependencies>

2. 代码

接收来自socket（nc -l 9001）的数据
每两秒进行一次wc聚合

  //env
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //source from socket
        DataStreamSource<String> text = env.socketTextStream("localhost", 9001);

        //trans：
        SingleOutputStreamOperator<Tuple2<String, Integer>> wordCount =
                text.flatMap(new FlatMapFunction<String, String>() {
                    public void flatMap(String line, Collector<String> out) throws Exception {
                        String[] words = line.split(" ");
                        for (String word : words) {
                            out.collect(word);
                        }
                    }
                }).map(new MapFunction<String, Tuple2<String, Integer>>() {
                    public Tuple2<String, Integer> map(String word) throws Exception {
                        return new Tuple2<String, Integer>(word, 1);
                    }
                }).keyBy(new KeySelector<Tuple2<String, Integer>, String>() {
                    public String getKey(Tuple2<String, Integer> tup) throws Exception {
                        return tup.f0;
                    }
                }).timeWindow(Time.seconds(2)  //两秒的窗口
                ).sum(1);

        //使用一个线程执行打印操作
        wordCount.print().setParallelism(1);

        //执行程序
        env.execute("SocketWindowWordCountJava");
 
flink datastream程序有几个组成：

env：创建flink job的运行环境

source：从哪里获取到数据

trans：对数据具体做哪些处理

sink：数据写到什么地方

execute：触发任务的运行

版权声明：本文内容来自第三方投稿或授权转载，原文地址：https://blog.csdn.net/hiliang521/article/details/128554127，作者：roman_日积跬步-终至千里，版权归原作者所有。本网站转在其作品的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系，请发邮件至ctyunbbs@chinatelecom.cn沟通。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

【wordcount】flink 代码快速入门

【wordcount】flink 代码快速入门

1. 依赖

2. 代码

相关文章

基础—SQL—DML（数据操作语言）插入数据

【C语言小游戏--猜数字】

Mybatis-Flex实战

【数据结构】栈和队列--＞理解和实现（赋源码)

TypeScript起航篇·何为TypeScript？

【C++】模板详细讲解（含反向迭代器）

c语言中文件操作

怎么只用语言实现扫雷？

三子棋的实现有这么简单吗？

Java数据结构《二叉排序树的插入删除和查找》

作者介绍

最新文章

基础—SQL—DML（数据操作语言）插入数据

【C语言小游戏--猜数字】

【数据结构】栈和队列--＞理解和实现（赋源码)

TypeScript起航篇·何为TypeScript？

c语言中文件操作

【C++】模板详细讲解（含反向迭代器）

热门文章

Python|斐波那契数列

游戏编程之十一 图像页CPICPAGE介绍

PHP：将list列表转为tree树形数据

数据结构与算法之七 栈

Python编程：Crypto模块RSA非对称加密

Python编程：利用peewee的model_to_dict进行数据迁移

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Java千问09：你真的掌握了Java语言的==吗？我看未必！

详细分析MybatisPlus中 多个like的模糊匹配查询

Java中关于代码块的相关内容

CSS基础之伪元素选择器（如果想知道CSS的伪元素选择器知识点，那么只看这一篇就足够了！）

Promise相关

软件工程师，要么不写代码，要么就写优雅的代码

游戏编程之十一图像页CPICPAGE介绍

数据结构与算法之七栈

详细分析MybatisPlus中多个like的模糊匹配查询