大数据 - 码客汇

基于大数据爬虫技术的图书推荐系统与可视化平台设计和实现

基于大数据爬虫技术的图书推荐系统与可视化平台设计和实现随着互联网的迅猛发展，图书的种类和数量急剧增加，如何在海量数据中为用户提供个性化的推荐服务成为一个重要课题。本文将探讨基于大数据爬虫技术的图书推荐系统的设计与实现，并通过数据可视化平台展示推荐结果。一、系统设计本系统主要分为数据采集、数据处

后端 2024年10月09日 0 点赞 0 评论 26 浏览

后端基础篇- 社区 IDEA 手动 Maven 创建 SpringBoot 项目、Maven 安装与配置环境变量、IDEA 集成 Maven

后端基础篇：社区 IDEA 手动 Maven 创建 SpringBoot 项目前言在现代的Java开发中，Spring Boot作为一个简化开发的框架，已经被广泛应用。在搭建Spring Boot项目的过程中，Maven作为构建工具的重要性不言而喻。本文将介绍如何在IDEA中手动创建一个Spri

后端 2024年10月08日 0 点赞 0 评论 60 浏览

【postgresql初级使用】事件触发器event trigger，被忽略的table rewrite，组合策略保障重大操作

在PostgreSQL中，事件触发器（Event Triggers）是一种强大的功能，允许你在特定的数据库事件发生时执行一些操作，例如DDL（数据定义语言）命令的执行。事件触发器与普通触发器不同，它们允许你捕获构建、修改或删除数据库对象的操作，适用于对数据库结构的监控和政策执行。在实际应用中，我们

后端 2024年10月08日 0 点赞 0 评论 30 浏览

【大数据】Flink CDC 实时同步mysql数据

Flink CDC 实时同步 MySQL 数据Flink CDC（Change Data Capture）是一个用于实时数据流处理的强大工具，可以用于捕捉和同步数据库中的数据变化。在实际业务场景中，实时同步 MySQL 数据是一个常见的需求，特别是在数据分析、报告生成和数据仓库建设等方面。本文将介

后端 2024年10月08日 0 点赞 0 评论 15 浏览

Flink-02 Flink Java 3分钟上手 Stream SingleOutputStreamOpe ExecutionEnvironment DataSet FlatMapFunction

Apache Flink 是一个强大的流处理框架，能够处理实时数据流和批处理数据。在这一篇文章中，我们将以 Java 语言为例，深入讲解如何在 Flink 中使用 ExecutionEnvironment 和 FlatMapFunction 进行数据流处理。我们将逐步完成一个简单的应用，以帮助开发者

后端 2024年10月07日 0 点赞 0 评论 25 浏览

【大数据】HDFS、HBase操作教程（含指令和JAVA API）

大数据：HDFS、HBase操作教程（含指令和JAVA API）在大数据生态系统中，HDFS（Hadoop Distributed File System）与HBase（一个基于Hadoop的分布式列存储数据库）是非常重要的组成部分。本文将介绍HDFS与HBase的基本操作，包括常用指令和Java

后端 2024年10月07日 0 点赞 0 评论 22 浏览

大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计

使用Apache Druid进行订单统计的案例实战在现代的数据分析和实时数据处理场景中，Apache Druid作为一个高性能的实时分析数据库，越来越受到欢迎。它的高吞吐量、快速查询能力与灵活的数据建模，非常适合用于时序数据分析。本文将通过一个实际案例，使用Scala和Kafka，结合Apache

后端 2024年10月07日 0 点赞 0 评论 17 浏览

大数据技术之Scala语言，只需一篇文章即可，教你学会什么是Scala，教你如何使用Scala

什么是Scala语言？Scala是一种结合了面向对象编程和函数式编程特性的编程语言。它运行在Java虚拟机（JVM）上，并且与Java高度兼容。这意味着你可以在Scala中使用Java的库和框架，同时也能利用Scala提供的许多强大特性，如类型推断、高阶函数、模式匹配等。Scala的设计理念是让

后端 2024年10月07日 0 点赞 0 评论 17 浏览

大数据-155 Apache Druid 架构与原理详解数据存储索引服务压缩机制

Apache Druid是一个高性能的实时分析数据存储系统，广泛用于大数据分析和商业智能场景中。其架构设计具有高可扩展性、低延迟的数据查询性能，支持复杂的聚合和维度查询。本文将详细探讨Apache Druid的架构与原理，尤其是其数据存储、索引服务与压缩机制。一、架构概述Apache Druid

后端 2024年10月07日 0 点赞 0 评论 19 浏览

大数据-145 Apache Kudu 架构解读 Master Table 分区读写

Apache Kudu 架构解读：Master Table 分区的读写Apache Kudu 是一个开源的列式存储系统，专为大数据分析和实时运算而设计。Kudu 提供了高效的读写性能，尤其是在需要快速随机访问数据的场景中。它的架构允许用户在分布式环境中以一致的方式存储和访问数据。在这篇文章中，我们

后端 2024年10月06日 0 点赞 0 评论 27 浏览

大数据

首页

大数据

列表

默认

浏览次数

发布日期