关于 “” 的搜索结果, 共 2411 条






在哪里能下载到 HDFS 审计日志数据集? by 小龙 小龙

https://hainiubl.com/topics/37074? 2019-10-12 ⋅ 2895 ⋅ 0 ⋅ 1
请问在哪里能够找到关于HDFS-audit的数据集?求教各位大神。

flink TableApi 的 select 中的语句与 Sql 语句的有什么区别吗? by 滴磨成觞 滴磨成觞

https://hainiubl.com/topics/37075? 2019-10-12 ⋅ 2697 ⋅ 0 ⋅ 1
Orders.filter().groudBy().select(id.count as md, ((delflag = false).?(1,0)).sum as mo),像这种select中的语句有什么规则没,和Sql语句很不一样

spark Streaming 做增量学习怎么做? by 李伟 李伟

https://hainiubl.com/topics/37076? 2019-10-15 ⋅ 2542 ⋅ 0 ⋅ 1
spark2.3.0在集群上链接mongdb报错没有找到com.mongodb.spark.rdd.partitioner.MongoPartion

cdh 的 hbase2.0 怎么使用 hbck2 修复工具? by 镜花水月 镜花水月

https://hainiubl.com/topics/37077? 2019-10-15 ⋅ 3641 ⋅ 0 ⋅ 1
我的hbase版本为Version 2.1.0-cdh6.3.0迁移数据的时候遇到了点问题,想修复元数据,结果发现HBCK2不支持hbase2.1.0,每次使用命令就打版本不支持显示,请问大神们有什么好的解决方案

hadoop 外部浏览器访问 50070 正常可以访问 8088 不可以!但是用 vm 浏览器就可以,请问为什么? by 张凌天 张凌天

https://hainiubl.com/topics/37078? 2019-10-16 ⋅ 2699 ⋅ 0 ⋅ 1
外部浏览器正常可以访问50070,vm里的也可以访问8088,但是外部浏览器访问不了8088问什么?可以访问50070说明设置的host没有问题了!vm可以访问8088也说明没有问题,但是外部浏览器访问不了8088为什么

sql 除了连接,聚合,窗口函数还有什么高阶的操作?或者说运用基本操作能得到一些高级技巧? by 海纳百川 海纳百川

https://hainiubl.com/topics/37080? 2019-10-17 ⋅ 2449 ⋅ 0 ⋅ 1
sql除了连接,聚合,窗口函数还有什么高阶的操作?或者说运用基本操作能得到一些高级技巧?

MySQL workbenchce8.0 怎么创建数据库数据表? by 雾走黄昏 雾走黄昏

https://hainiubl.com/topics/37081? 2019-10-18 ⋅ 3054 ⋅ 0 ⋅ 1
mysql workbenchce8.0怎么创建数据库数据表?

为什么 SparkContext 被设计成不能被序列化? by 慧有未来 慧有未来

https://hainiubl.com/topics/37082? 2019-10-18 ⋅ 2395 ⋅ 0 ⋅ 1
很好奇是出于怎样的考虑,让 SparkContext 被设计成 transient?

SQL-on-Hadoop 技术与数据库技术的差异在哪里? by 卢本伟牛X 卢本伟牛X

https://hainiubl.com/topics/37083? 2019-10-21 ⋅ 5887 ⋅ 0 ⋅ 1
SQL-on-Hadoop技术与数据库技术的差异在哪里?

hdfs2.x 源码剖析里为什么会提交两次? by 寒冰雪域 寒冰雪域

https://hainiubl.com/topics/37085? 2019-10-22 ⋅ 2619 ⋅ 0 ⋅ 1
第六页最下边,他说'获取存储这个数据块副本的所有数据节点的位置信息',这不是说明数据块已经完全复制好了,才会返回给客户端?而接下来第六页最下边'会提交上一个数据块',第七页又会'提交新写入hdfs文件的所有数据块',这么提交两次有意义吗?

HDFS 存储数据占用多少硬盘空间? by 晓月星稀 晓月星稀

https://hainiubl.com/topics/37087? 2019-10-23 ⋅ 3620 ⋅ 0 ⋅ 2
按照HDFS默认的三副本机制,HDFS存储1TB数据是不是占用4T硬盘空间?

Python 怎么创建高维数组最高效? by 卢本伟牛X 卢本伟牛X

https://hainiubl.com/topics/37088? 2019-10-24 ⋅ 2477 ⋅ 0 ⋅ 1
我想要创建一个3^225,元素初始值为浮点,随机取值[-1,1]。怎么样创建最高效呢?可以使用numpy

Java 成员变量有没有用 public 修饰的情景? by 张凌天 张凌天

https://hainiubl.com/topics/37089? 2019-10-24 ⋅ 2470 ⋅ 0 ⋅ 1
对于Java封装的概念我是很清楚了,这个不用再向我解释。我只是想知道成员变量(非静态)真的没有用public修饰的情景吗?比如我仅仅想写一个单纯的struct。

Python 中 asyncio 与 gevent 有什么区别? by 海纳百川 海纳百川

https://hainiubl.com/topics/37090? 2019-10-25 ⋅ 3961 ⋅ 0 ⋅ 1
asycio与gevent都支持异步IO,感觉功能都差不多。这俩库有啥区别啊

多个线程读写 zookeeper 节点上数据过程中,读操作需要加锁么? by 良子 良子

https://hainiubl.com/topics/37091? 2019-10-25 ⋅ 2351 ⋅ 0 ⋅ 1
考虑多个线程读的期间可能会有这个节点上的数据更新的情况,即多个线程调用zookeeper的getData接口,同时存在线程调用setData接口(setData是加锁的)。此时setData是否有必要加锁?或者说zookeeper的读会不会被写打断,从而导致读到的数据,一部分来自修改之前,一部分...

请问通过 jdbc 精确查询 MySQL 数据库怎么写? by 星期八 星期八

https://hainiubl.com/topics/37092? 2019-10-25 ⋅ 2290 ⋅ 0 ⋅ 1
请问通过jdbc精确查询mysql数据库怎么写?

多个线程读写 zookeeper 节点上数据过程中,读操作需要加锁么? by 夜莺 夜莺

https://hainiubl.com/topics/37095? 2019-10-28 ⋅ 2400 ⋅ 0 ⋅ 1
考虑多个线程读的期间可能会有这个节点上的数据更新的情况,即多个线程调用zookeeper的getData接口,同时存在线程调用setData接口(setData是加锁的)。此时setData是否有必要加锁?或者说zookeeper的读会不会被写打断,从而导致读到的数据,一部分来自修改之前,一部分...

请问通过 jdbc 精确查询 MySQL 数据库怎么写? by 秋意浓 秋意浓

https://hainiubl.com/topics/37096? 2019-10-28 ⋅ 2344 ⋅ 0 ⋅ 1
请问通过jdbc精确查询mysql数据库怎么写?

hadoop streaming,但是当-file 指定路径的 mapper.py,就报错?是什么原因? by 十年 十年

https://hainiubl.com/topics/37097? 2019-10-29 ⋅ 3399 ⋅ 0 ⋅ 1
报错格式为Unrecognized option: -file ...,mapper.py本身没有问题,可能是哪方面的问题?

用 java 怎么写 multi-threaded client server chat? by 听说 听说

https://hainiubl.com/topics/37098? 2019-10-29 ⋅ 2715 ⋅ 0 ⋅ 1
用java 怎么写 multi-threaded client server chat?

如何理解 hadoop 中数据块的概念? by 海纳百川 海纳百川

https://hainiubl.com/topics/37099? 2019-10-30 ⋅ 2638 ⋅ 0 ⋅ 1
如何理解hadoop中数据块的概念?

MySQL 中,order by 语句和 select 语句哪个先执行? by 张凌天 张凌天

https://hainiubl.com/topics/37100? 2019-10-30 ⋅ 3409 ⋅ 0 ⋅ 1
网上查找资料,包括自己练习中都发现有时order by先执行,有时确实select?有点疑惑,特此求教。

Python 如何操作.dll 文件? by 冰雹 冰雹

https://hainiubl.com/topics/37101? 2019-10-31 ⋅ 2548 ⋅ 0 ⋅ 1
Windows的接囗函数都被封装在.dll文件中,那么Python如何系统调用呢?

pyspark 自定义 transform 如何导出成 PMML? by 星期八 星期八

https://hainiubl.com/topics/37103? 2019-11-01 ⋅ 3100 ⋅ 0 ⋅ 1
看了一下类似于OneHotEncoder之类的pyspark自带transform,是继承了JavaMLWriteable和JavaMLReadable,并在里面使用了self._new_java_obj去拿已经写好的Java对象,是否有其他的方法,导出成pmml

ZooKeeper 是不是 Hadoop 体系实现 HA 的命门所在? by 滴磨成觞 滴磨成觞

https://hainiubl.com/topics/37104? 2019-11-01 ⋅ 2268 ⋅ 0 ⋅ 1
虽然ZooKeeper可以支撑Hadoop体系实现HA,但是ZooKeeper本身是HA的吗?如果被攻击或者出问题的是Zookeeper呢?那么它所支撑的HDFS、YARN、HBASE等岂不都会轰然倒塌吗?