编程那点事 编程那点事编程那点事

技术文章

易用性:标准化SQL支持以及更合理的API

易用性:标准化SQL支持以及更合理的API

标准化SQL支持以及更合理的APISpark最引以为豪的几个特点就是简单、直观、表达性好。Spark 2.0为了继续加强这几个特点,做了两件事情:1、提供标准化的SQL支持;2、统一了Dataframe和Dataset两套API。在标准化SQL支...

赞(0) Vben 阅读(2372)
Hive搭建

Hive搭建

仅仅在spark1上搭建下载安装HIVE下载hive,下载bin版本,不要下载src版本将下载的hive包解压缩到/usr/local文件夹下修改夹名字为hive配置环境变量下载安装mysql安装mysql serveryum install -y mysql...

赞(0) Vben 阅读(2939)
Windows客户端内网穿透工具frp设置开机自启动

Windows客户端内网穿透工具frp设置开机自启动

通过前面的2篇教程Windows服务器端内网穿透工具frps安装及使用教程Windows客户端内网穿透工具frpc安装及使用教程我们已经可以通过阿里云服务器远程到非公网的电脑了,如果自启动的话那就更完美了。1、设置frps自启动...

赞(0) Vben 阅读(9414)
Windows客户端内网穿透工具frpc安装及使用教程

Windows客户端内网穿透工具frpc安装及使用教程

之前我们讲了frp在windows服务器下的配置,本课程我们讲下客户端frpc的配置,c就是client了。我们之前已经完成了frp的下载,不会下载的看我们之前的文章:Windows服务器端内网穿透工具frps安装及使用教程首先,我们...

赞(0) Vben 阅读(67422)
前言

前言

TeamViewer现在是越来越严格,本来是想买他的服务的,但是感觉太贵了,每年要1000多。而且最近我的TeamViewer打开一直提示:未就绪,请检查你的连接,我估计是ip是被封了。于是找到了frp,1000多我可以买个阿里云服...

赞(0) Vben 阅读(2484)
maven项目找不到war包下的类:程序包不存在

maven项目找不到war包下的类:程序包不存在

整体的项目结构是这样的,A项目是一个web项目,B项目也是一个web项目,B依赖于A项目,我们在maven编译的时候也报错:xxx程序包不存在但是我们又能进到所谓的不存在的程序包里面。是因为有些IDE没法很智能的做到,直...

赞(0) Vben 阅读(5771)
Hadoop集群搭建

Hadoop集群搭建

Hadoop集群搭建安装hadoop下载hadoop将下载的hadoop包解压缩到/usr/local文件夹下配置hadoop环境变量配置hadoopcd hadoop/etc/hadoop/修改core-site.xml<property>   <name>fs.default....

赞(0) Vben 阅读(2117)
CentOS集群搭建

CentOS集群搭建

CentOS设置163的yum源的过程cd /etc/yum.repos.d/ rm -rf * cp /usr/local/CentOS6-Base-163.repo . # 自己的repo文件移动到/etc/yum.repos.d/目录中:cp /usr/local/Cen...

赞(0) Vben 阅读(2883)
Hive On Spark使用

Hive On Spark使用

create table students(name string, age int); load data local inpath '/usr/local/spark-study/resources/students.txt' into table stud...

赞(0) Vben 阅读(3038)
Hive On Spark环境搭建

Hive On Spark环境搭建

下载hive解压到/usr/loca/进入conf目录,mv hive-default.xml.template hive-site.xml,修改hive-site.xml<property>   <name>javax.jdo.option.ConnectionURL</name>   &l...

赞(0) Vben 阅读(3115)
HiveOnSpark背景

HiveOnSpark背景

Hive是目前大数据领域,事实上的SQL标准。其底层默认是基于MapReduce实现的,但是由于MapReduce速度实在比较慢,因此这两年,陆续出来了新的SQL查询引擎。包括Spark SQL,Hive On Tez,Hive On Spark等。Spark SQL与...

赞(0) Vben 阅读(2716)
SparkSQL工作原理剖析

SparkSQL工作原理剖析

工作原理SqlParseAnalyserOptimizerSparkPlan性能优化设置Shuffle过程中的并行度:spark.sql.shuffle.partitions(SQLContext.setConf())在Hive数据仓库建设过程中,合理设置数据类型,比如能设置为INT的,就不要设...

赞(0) Vben 阅读(2442)
内置函数

内置函数

Spark 1.5.x版本引入的内置函数在Spark 1.5.x版本,增加了一系列内置函数到DataFrame API中,并且实现了code-generation的优化。与普通的函数不同,DataFrame的函数并不会执行后立即返回一个结果值,而是返回一个Col...

赞(0) Vben 阅读(2993)
JDBC数据源

JDBC数据源

Spark SQL支持使用JDBC从关系型数据库(比如MySQL)中读取数据。读取的数据,依然由DataFrame表示,可以很方便地使用Spark Core提供的各种算子进行处理。这里有一个经验之谈,实际上用Spark SQL处理JDBC中的数据是非...

赞(0) Vben 阅读(2340)

编程那点事 更专业 更方便

登录

找回密码

注册