其他知识_其他学习笔记

其他相关内容

Spark内存调优，你会吗？
一、概述Spark 作为一个基于内存的分布式计算引擎，其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：5459 次
Spark 静态内存管理详解
一.内容简介spark从1.6开始引入了动态内存管理模式，即执行内存和存储内存之间可以互相抢占。spark提供两种内存分配模式：静....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：1595 次
比Spark快100倍的GPU加速SQL引擎！BlazingSQL开源了
BlazingSQL 是基于英伟达 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎，可以为各种 ETL 大数据集提供 SQL 接口，并且完全运行....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：6398 次
大数据计算框架Spark之任务调度
Spark有几种资源调度设施。每个Spark Application(SparkContext实例)独立地运行在一组executor进程内。cluster manager为应....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：7511 次
从源码解密Spark内存管理
内存不过是计算机分级存储系统中的靠近cpu的一个存储介质。 spark运行起来内存里都存的啥? 如何管理里面所存的东西? ....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：7498 次
从源码解密Spark内存管理
内存不过是计算机分级存储系统中的靠近cpu的一个存储介质1.spark运行起来内存里都存的啥?2.如何管理里面所存的东西?3.spark....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：6878 次
Spark核心技术原理透视一（Spark运行原理）
在大数据领域，只有深挖数据科学领域，走在学术前沿，才能在底层算法和模型方面走在前面，从而占据领先地位。Spark的这种学....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：7527 次
一篇文章看懂 Spark RDD
1 简介Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。它产生于 UC Berkeley AMP Lab，继承了 MapReduce ....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：6818 次
SparkSQL访问Hive遇到的问题及解决方法
需要先将hadoop的core-site.xml，hive的hive-site.xml拷贝到project中测试代码报错查看源码解决方法将$HIVE_HOME/lib....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：4262 次
大数据之谜Spark基础篇，核心RDD特征分析讲解
RDD特征概要总结：a、RDD是Spark提供的核心抽象，全称为Resillient Distributed Dataset，即弹性分布式数据集。b、RDD在抽象....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：5034 次
Spark streaming中持久保存的RDD/有状态的内存
在面向流处理的分布式计算中，经常会有这种需求，希望需要处理的某个数据集能够不随着流式数据的流逝而消失。以spark stream....

发布时间：2022-04-05 17:13 分类：Spark 阅读量：5460 次
Spark学习之RDD简单算子
collect返回RDD的所有元素scala> var input=sc.parallelize(Array(-1,0,1,2,2)) input: org.apache.spark.rdd.RDD[Int]....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：4965 次
Apache Hive VS Spark：不同目的，同样成功
Hive和Spark凭借其在处理大规模数据方面的优势大获成功，换句话说，它们是做大数据分析的。本文重点阐述这两种产品的发展史....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：3346 次
Spark入门：Spark Streaming 概览
概览Spark Streaming是Spark API的一个可横向扩容，高吞吐量，容错的实时数据流处理引擎，Spark能够从Kafka、Flume、Kinesi....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：5524 次
为什么Spark在数据科学界这么红？
今天是2019年，要是有谁说有十年大数据工作经验，我是不信的。因为 Spark 正式应用才多少年?看过下面文章的你，应该就知道了....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：8473 次
如何在万亿级别规模的数据量上使用 Spark？
一、前言Spark 作为大数据计算引擎，凭借其快速、稳定、简易等特点，快速的占领了大数据计算的领域。本文主要为作者在搭建使....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：2744 次
使用Spark Streaming SQL进行PV/UV统计
1.背景介绍PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析，例如广告主可以通过PV值预估投放....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：7620 次
美团是如何应用Spark处理大数据的？
前言美团最初的数据处理以Hive SQL为主，底层计算引擎为MapReduce，部分相对复杂的业务会由工程师编写MapReduce程序实现。随....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：388 次
还不收藏？Spark动态内存管理源码解析！
一、Spark内存管理模式Spark有两种内存管理模式，静态内存管理(Static MemoryManager)和动态（统一）内存管理（Unified Memo....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：951 次
PySpark源码解析，教你用Python调用高效Scala接口，搞定大规模数据分析
相较于Scala语言而言，Python具有其独有的优势及广泛应用性，因此Spark也推出了PySpark，在框架上提供了利用Python语言的接....

发布时间：2022-04-05 17:12 分类：Spark 阅读量：5453 次

首页
上一页
1
2
3
4
5
6
7
....
53
54
下一页

其他知识_其他学习笔记

IT最新文章