大数据 - 码客汇

2024年Google开发者大会：AI赋能的Web、移动和云开发

2024年Google开发者大会（Google I/O 2024）即将召开，主题为“AI赋能的Web、移动和云开发”。在这次大会上，谷歌将重点展示如何利用人工智能技术提升开发者在Web、移动和云端的工作效率，增强应用程序的功能性与用户体验。AI在Web开发中的应用在Web开发领域，谷歌推出了基于

前端 2024年10月06日 0 点赞 0 评论 29 浏览

基于大数据爬虫+Spark+Python数据可视化大屏的高校岗位招聘推荐和分析与可视化平台(源码+论文+PPT+部署文档教程等)

基于大数据爬虫、Spark、Python的数据可视化大屏的高校岗位招聘推荐和分析与可视化平台，是一个结合了数据采集、数据处理、分析与展示的综合性项目。以下是对此项目的详细介绍与实现示例。一、项目背景随着互联网的快速发展，招聘信息的数量与种类都在迅速增加。尤其对于高校毕业生来说，能够快速、准确地获

后端 2024年10月06日 0 点赞 0 评论 21 浏览

大数据-140 - ClickHouse 集群表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL

ClickHouse 集群表引擎详解 - MergeTree 和 CollapsingMergeTreeClickHouse 是一个开源的列式数据库管理系统，专为在线分析查询而设计。其核心是在高吞吐量和低延迟的场景中提供快速的数据读取性能。本文将着重讲解两种常用的表引擎——MergeTree 和

后端 2024年10月06日 0 点赞 0 评论 20 浏览

大数据-145 Apache Kudu 架构解读 Master Table 分区读写

Apache Kudu 架构解读：Master Table 分区的读写Apache Kudu 是一个开源的列式存储系统，专为大数据分析和实时运算而设计。Kudu 提供了高效的读写性能，尤其是在需要快速随机访问数据的场景中。它的架构允许用户在分布式环境中以一致的方式存储和访问数据。在这篇文章中，我们

后端 2024年10月06日 0 点赞 0 评论 27 浏览

大数据-155 Apache Druid 架构与原理详解数据存储索引服务压缩机制

Apache Druid是一个高性能的实时分析数据存储系统，广泛用于大数据分析和商业智能场景中。其架构设计具有高可扩展性、低延迟的数据查询性能，支持复杂的聚合和维度查询。本文将详细探讨Apache Druid的架构与原理，尤其是其数据存储、索引服务与压缩机制。一、架构概述Apache Druid

后端 2024年10月07日 0 点赞 0 评论 20 浏览

大数据技术之Scala语言，只需一篇文章即可，教你学会什么是Scala，教你如何使用Scala

什么是Scala语言？Scala是一种结合了面向对象编程和函数式编程特性的编程语言。它运行在Java虚拟机（JVM）上，并且与Java高度兼容。这意味着你可以在Scala中使用Java的库和框架，同时也能利用Scala提供的许多强大特性，如类型推断、高阶函数、模式匹配等。Scala的设计理念是让

后端 2024年10月07日 0 点赞 0 评论 17 浏览

大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计

使用Apache Druid进行订单统计的案例实战在现代的数据分析和实时数据处理场景中，Apache Druid作为一个高性能的实时分析数据库，越来越受到欢迎。它的高吞吐量、快速查询能力与灵活的数据建模，非常适合用于时序数据分析。本文将通过一个实际案例，使用Scala和Kafka，结合Apache

后端 2024年10月07日 0 点赞 0 评论 17 浏览

【大数据】HDFS、HBase操作教程（含指令和JAVA API）

大数据：HDFS、HBase操作教程（含指令和JAVA API）在大数据生态系统中，HDFS（Hadoop Distributed File System）与HBase（一个基于Hadoop的分布式列存储数据库）是非常重要的组成部分。本文将介绍HDFS与HBase的基本操作，包括常用指令和Java

后端 2024年10月07日 0 点赞 0 评论 22 浏览

Flink-02 Flink Java 3分钟上手 Stream SingleOutputStreamOpe ExecutionEnvironment DataSet FlatMapFunction

Apache Flink 是一个强大的流处理框架，能够处理实时数据流和批处理数据。在这一篇文章中，我们将以 Java 语言为例，深入讲解如何在 Flink 中使用 ExecutionEnvironment 和 FlatMapFunction 进行数据流处理。我们将逐步完成一个简单的应用，以帮助开发者

后端 2024年10月07日 0 点赞 0 评论 25 浏览

【大数据】Flink CDC 实时同步mysql数据

Flink CDC 实时同步 MySQL 数据Flink CDC（Change Data Capture）是一个用于实时数据流处理的强大工具，可以用于捕捉和同步数据库中的数据变化。在实际业务场景中，实时同步 MySQL 数据是一个常见的需求，特别是在数据分析、报告生成和数据仓库建设等方面。本文将介

后端 2024年10月08日 0 点赞 0 评论 15 浏览

大数据

首页

大数据

列表

默认

浏览次数

发布日期