安装Nginx
# wget http://nginx.org/download/nginx-1.8.0.tar.gz
# wget http://prdownloads.sourceforge.net/libpng/zlib-1.2.8.tar.gz
# wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.37.tar.gz
# tar zxvf zlib-1.2.8.tar.gz
# tar zxv...
**windows环境介绍:**
myeclipse 10
jdk1.6
tomcat 6.0.35
一、安装Zookeeper
1.通过链接下载对应的包 http://www.apache.org/dist/zookeeper/
2.Zookeeper下载后解压即可,见下图
3.进入到conf里面,会看到zoo_sample.cfg...
scala介绍
hadoop(java)
hive(java)
hbase(java)
kafka(scala)
spark(scala)
scala安装

:Unit = {
println("init")
}
def main(args: Array[String]): Unit = {
val property = init()...
apply 和 unapply 方法
apply方法一般被称为注入方法一般用于伴生对象初始化的操作,apply方法的参数列表不需要和构造函数的参数列表统一
unapply方法常被称为提取方法可以用unapply方法提取相同操作的对象,unapply方法会返回一个Option,其内部生成一个Some对象...
隐式转换
作用:能够丰富现有类库的功能,对类的方法进行增强
隐式转换函数
以implicit关键字声明并带有单个参数的函数
比如1 to 10其实是调用的1.to(10)这个方法
但是在Int类中并没有to这个方法

官方提供的restful接口
但是总是报错
根据提供的接口,我传递的参数有jobid和时间,

在线等,有人遇到...



像这种有问题的block块大家一般是怎么处理的,有办法可以修复吗?
Hadoop如何统计每日提交的任务总数,map,reduce数量
Hadoop经典的wordcount, 如何只输入单词频率出现最高的单词呢? 能否给个思路呀
一、打开海牛部落(https://www.hainiubl.com), 点击右上角“登录”按钮进入(图1)页面。点击(图1)页面中的“使用微信登录”按钮进入微信二维码登录页面(图2),手机微信扫描登录。扫描后进入(图3)填写新用户注册信息,注册成功后可直接登录。


[scala基础2](http://hainiubl.com/topics/208)
[scala基础3](http://hainiubl.com/topics/209)
[scala基础4](http://hainiubl.com/topics/210)
[scala基础5](http://hainiubl.com/topics/211)
org.apache.hadoop.hive.metastore.HiveMetaException: Failed to get schema version.
Underlying cause: java.sql.SQLException : Access denied for user 'root'@'H001' (using password: YES)
SQL Error code: 1045
Use --verbose for detailed stacktrace.
***...
> load data local inpath '/opt/hive/student.txt' into table db_hivetest.student;
Loading data to table db_hivetest.student
Failed with exception org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /root/hive/warehouse/db_hivetest.db/...
现在有个需求就是 有张表,表的字段 有时候会增加 或者减少, 用大数据的话 采用什么方式合理。我想过用HBASE,但是考虑到后续需要对这些数据进行数据分析,HBASE在数据分析这块儿 又没有什么优势。所以有些顾虑,不知道朋友有什么好的方法没 。有知道的朋友还请指点下...
用java写spark的聚合函数格式是什么啊,scala中这样写没错,java就不行了

假如我做一笔交易,返回前端受理成功,后台继续执行。
标注的地方是已使用过配额空间的大小?


日志如下:
```
17/12/25 09:09:15 INFO Client: Requesting a new application from cluster with 8 NodeManagers
17/12/25 09:09:15 INFO Client: Verifying our application has not requested more than the maximum memory capability of the cluster (192512 M...
最近与朋友(ETL从业)聊天,发现个小白问题:发现他们做的数据清洗和存储 和数据开发的流程一样, 而数据开发后面 涉及到的分析挖掘和数据应用 理解的是应用层, 不理解的是数据开发与ETL的区别和联系, ETL工程师如果转,转开发还是转应用好。
冷热备份的具体操作流程是什么。
备份、恢复的操作流程。越详细越好。求大神指教。小白再次谢过。
Dataset<Row> data = spark.read().format("jdbc")
.option("driver", "com.mysql.jdbc.Driver")
.option("url", url)
.option("dbtable", table)
.option("user", "root")
.option("password", "root").load();
data.createOrRepla...
JavaPairRDD<String, Integer> pairdd=maprdd.mapToPair(line->{
String arr[] = line.split(",");
return new Tuple2<String,Integer>(arr[0],Integer.parseInt(arr[1]));
}).reduceByKey((x,y)->{
return x+y;
}).filter(我要过滤...