· 搜索结果 | 海汼部落 | IT学习->实战为王

zouziyan

第 9297 位会员 ⋅ 2024-03-21 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

123nn

第 9309 位会员 ⋅ 2024-03-23 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

Xhy

牛人

第 8067 位会员 ⋅ 2023-10-31 ⋅ 2 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

黄钟吕

第 9062 位会员 ⋅ 2024-02-29 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 2 条回帖 ⋅ 篇文章

DER | 请一句话介绍你自己，大部分情况下会在你的头像和名字旁边显示，字数要大...

第 4719 位会员 ⋅ 2021-09-27 ⋅ 126 关注者 ⋅ 57 篇话题 ⋅ 1 条回帖 ⋅ 篇文章

请问我哪俩个地方出问题了？ by 生亦何欢

https://hainiubl.com/topics/36018? 2019-01-14 ⋅ 2796 ⋅ 0 ⋅ 1

为什么会显示_init_里面缺少一个位置参数Battery ![file](http://hainiubl.com/uploads/images/201901/14/3301/shBwsN2BtG.png)

Error: module 'wave' has no attribute 'open'如何如何解决？ by 生亦何欢

https://hainiubl.com/topics/36019? 2019-01-14 ⋅ 4319 ⋅ 0 ⋅ 1

python 3.7 .0 AttributeError: module 'wave' has no attribute 'open'

Pycharm 中 tensorflow 无法运行？ by 生亦何欢

https://hainiubl.com/topics/36020? 2019-01-14 ⋅ 3077 ⋅ 0 ⋅ 1

正在调试BERT开放的Python代码。但是“import tensorflow”部分一直报错（用pip或pip3安装同样报错），其他模块都能运行。想请教一下，在BERT算法中，如何能让tensorflow顺利运行，或者不能运行的原因可能是什么？

python 爬虫，使用 scrappy-Redis 框架中 RedisCrawlSpider 怎么登陆？ by 卢本伟牛X

https://hainiubl.com/topics/36021? 2019-01-14 ⋅ 2814 ⋅ 0 ⋅ 1

使用RedisCrawlSpider爬网站想先登陆，需要怎么做，改写那些函数，之后怎么办？

python pivot_table 后，如何计算某一列长度？ by 十年

https://hainiubl.com/topics/36022? 2019-01-14 ⋅ 2918 ⋅ 0 ⋅ 1

pivot_test_data=pd.read_csv('pivot_test_data.csv') pivot_test=pd.pivot_table( pivot_test_data, index='uid', values='donetime', aggfunc=len, fill_value=0, margins=True ) print(len(pivot_test['uid'])) 在这一步报错，key error。此外，我想...

spark-phoenix 一直出现一个 bug? by 卢本伟牛X

https://hainiubl.com/topics/36024? 2019-01-17 ⋅ 7977 ⋅ 0 ⋅ 2

18/09/19 21:24:06 INFO ConnectionQueryServicesImpl: HConnection established. Stacktrace for informational purposes: hconnection-0x2d38edfd java.lang.Thread.getStackTrace(Thread.java:1559) org.apache.phoenix.util.LogUtil.getCallerStackTrace(LogUtil...

scan 查出来的 row 是 rowkey 吗？ by 张凌天

https://hainiubl.com/topics/36025? 2019-01-17 ⋅ 2538 ⋅ 0 ⋅ 1

从hbase中用scan查出来的row，用get查不到数据。请大神们帮忙查看一下主键是否有加密？ ![file](http://hainiubl.com/uploads/images/201901/17/3300/OANV5anSVv.png)

spark 读取 MongoDB，进行计算，MongoDB 游标超时如何解决？ by 生亦何欢

https://hainiubl.com/topics/36026? 2019-01-17 ⋅ 4017 ⋅ 0 ⋅ 1

最近在单机情况下，发现spark在读取MongoDB进行计算的时候，MongoDB游标老是超时。网上看了下解决方案。 1.设置MongoDB的游标超时时间，但是貌似时间设置过长，会导致oom的情况发生。 2.读取MongoDB之后马上cache rdd，然后action存入本地内存。但是发现还是会执...

求 spark 大神帮忙看下，用 scala 操作 dataframe 转 rdd 的时候，row 对象的取值问题？ by 十年

https://hainiubl.com/topics/36027? 2019-01-17 ⋅ 3311 ⋅ 0 ⋅ 1

![file](http://hainiubl.com/uploads/images/201901/17/3329/XoUEFyVtUV.png) 我的dataframe约束是上面这样子的。 dataFrame.rdd.map(row => (row.getAs[Struct]("properties"), row.getAs[String]("userId"))).foreach(println) 上面的代码我可以取第一层的...

Hive 为什么不支持日期格式？ by 听说

https://hainiubl.com/topics/36028? 2019-01-17 ⋅ 2624 ⋅ 0 ⋅ 1

今天做Oracle存储过程迁移到Hadoop上，我看到存储过程里面有个条件是XXX=to_date(yyyy,'yyyymmdd')，于是转换成hadoop应该是类型匹配，XXX是个date类型的，但是我使用的Hadoop自定义函数'${TXNDATE}',但是这是一个字符串类型的，我需要将这个转换成YYYYMMDD的日期格式，...

sparksqlselect.join.group 是会对应生成什么样的 rdd.再划分 stage 的？ by 天行者

https://hainiubl.com/topics/36029? 2019-01-17 ⋅ 2388 ⋅ 0 ⋅ 1

如题

Spark 里 RDD 数据怎么拿到 hashmap 中呢？ by 卢本伟牛X

https://hainiubl.com/topics/36033? 2019-01-23 ⋅ 3101 ⋅ 0 ⋅ 0

val sc = new SparkContext(conf) val rdd01 = sc.textFile("G:/input/a.txt") val rdd02 = rdd01.map(x=>(x.split("\t")(0),x.split("\t")(1).trim.toInt)) var map2 = new mutable.HashMap[String,Int]() rdd02.foreach(println(_)) rdd02.foreach(x=>...

如何通过 python 连接到远程服务器的 sparksql,求指导，各位大佬，？ by 生亦何欢

https://hainiubl.com/topics/36034? 2019-01-23 ⋅ 2778 ⋅ 0 ⋅ 1

如何通过python连接到远程服务器的sparksql,求指导，各位大佬，？

大数据工程师的日常工作内容是干嘛？ by 十年

https://hainiubl.com/topics/36035? 2019-01-23 ⋅ 2457 ⋅ 0 ⋅ 1

现在在做Java开发，利用下班时间在自学大数据。想了解下大数据工程师的日常工作内容，好有所针对的学。目前Hadooop权威指南看了四遍，hive权威指南看了三遍了，内容好多，怕走弯路，希望在做大数据的工程师们说一下

如何理解 fine-grained 和 coarse-grained？ by 张凌天

https://hainiubl.com/topics/36036? 2019-01-23 ⋅ 3876 ⋅ 0 ⋅ 1

最近在看UCBerkeley的几年前的一篇讲RDD的论文。文中提到了coarse-grained update和fine-grained update。图像分析中似乎也有fine-grained classification。对这两个形容词，或者说这两个形容词定义的操作应该怎么理解？

Spark submit 参数调优是否有一定标准或者规律？ by 听说

https://hainiubl.com/topics/36037? 2019-01-23 ⋅ 2568 ⋅ 0 ⋅ 1

看了很多文章，但是大多数都只是告诉你这四个参数是什么作用。唯有16年的Spark Summit大会上Top 5 Mistakes When Writing Apache Spark Applications演讲专题提到了一种计算方法（固定executor-cores为5，每太理解为什么他说超过5 hdfs 的thoughout会降低）并手把手的...

请问批量操作多台服务器的脚步在哪里下载呢？ by o329O

https://hainiubl.com/topics/36038? 2019-01-23 ⋅ 2590 ⋅ 0 ⋅ 1

[Hadoop 系列教程（二）：批量操作多台服务器](http://www.hainiubl.com/topics/80)

ambari 快速批量部署方案？ by 韦晓阳

https://hainiubl.com/topics/36041? 2019-02-11 ⋅ 3261 ⋅ 0 ⋅ 1

业务是基于工业精密制造业，后面随着项目的增多，需要对ambari平台快速批量的部署，研究了docker，都说docker存数据不太靠谱，集群是伪分布式，服务器资源占用率高，，，怎么优化，有没有其他更好的方案？

IDEA 远程调试 Hadoop 压缩与解压缩时客户端无法连接主机? by 卢本伟牛X

https://hainiubl.com/topics/36045? 2019-02-15 ⋅ 2705 ⋅ 0 ⋅ 1

跟着教程想实现通过IDEA远程调试压缩与解压缩。代码编写完成后导出jar文件到共享目录下，在该目录下本地运行正常。但是通过配置远程调试进行执行时，IDEA一直无法连接到服务器，linux端已经处于监听状态。求大神指教。 linux端已经处于监听状态： ![file](http://ha...

海量车联网 GPS 数据应该如何存储，才能实现高写入，低延时，以及快速查询的需求？ by 卢本伟牛X

https://hainiubl.com/topics/36046? 2019-02-15 ⋅ 3019 ⋅ 0 ⋅ 1

Hbase，GPS，海量数据

如何连续执行两段 MapReduce？ by 生亦何欢

https://hainiubl.com/topics/36048? 2019-02-15 ⋅ 2744 ⋅ 0 ⋅ 1

MapReduce采用stream方式，如何使得第一次的输出不打印到文件中直接传递到下一个Mapreduce程序中作为输入

在 Linux 虚拟机上搭建 hadoop 怎么弄啊？ by 听说

https://hainiubl.com/topics/36049? 2019-02-15 ⋅ 2385 ⋅ 0 ⋅ 1

如题

spark 的 shuffle 算子一定会产生宽依赖吗？ by 卢本伟牛X

https://hainiubl.com/topics/36051? 2019-02-20 ⋅ 3284 ⋅ 0 ⋅ 1

今天朋友抛出一个很有意思的结论： shuffle 不一定产生宽依赖，但是宽依赖一定是由 shuffle 产生的。我想了好久，有没有这种情况，在极端情况下，就算使用了 shuffle 算子，父子 rdd 的 partition 依然是一对一的关系，这样实际就没有形成宽依赖虽然使用了 shuff...

Hbase 如何使用不同的 zookeeper 的不同端口？ by 天行者

https://hainiubl.com/topics/36052? 2019-02-20 ⋅ 2865 ⋅ 0 ⋅ 1

为了了解 Hbase，搭建了个单机上多 zookeeper 实例，但是配置 Hbase 时，如何配置 zookeeper 的不同 clientPort？

spark 提交任务？ by 生亦何欢

https://hainiubl.com/topics/36053? 2019-02-20 ⋅ 2462 ⋅ 0 ⋅ 1

spark jar必须设置了master是local才可以消费到数据，指定yarn就没有处理的数据是为啥

连接 hbase 的问题？ by 听说

https://hainiubl.com/topics/36054? 2019-02-20 ⋅ 2410 ⋅ 0 ⋅ 1

求解决，我java连接hbase时出现不能找到地址。如图 ![file](http://hainiubl.com/uploads/images/201902/20/3330/j6exCrvy1s.png)

hadoop2.9.1 测试单机模式时报错，不懂怎么解？ by 张凌天

https://hainiubl.com/topics/36055? 2019-02-20 ⋅ 2393 ⋅ 0 ⋅ 1

我测试单机模式时，input和output文件夹都创建好了，然后把etc/hadoop文件夹下的xml拷贝到了input里，然后执行了如图的命令，但报错了，哪位大佬能教教我？ ![file](http://hainiubl.com/uploads/images/201902/20/3300/XCPSkGN4Af.png)

hive 里面两种 sql 写法的区别? by 十年

https://hainiubl.com/topics/36056? 2019-02-20 ⋅ 2606 ⋅ 0 ⋅ 1

hive里面select * from table与from table select * 这两种写法有什么区别呢？

想输出 ASCII 的图形，用变量 i 里面的数字所指定的图案，怎么办？ by 螺旋的邂逅

https://hainiubl.com/topics/36061? 2019-02-28 ⋅ 3140 ⋅ 0 ⋅ 1

![file](http://hainiubl.com/uploads/images/201902/28/3453/qYin8J5RgM.png) 我写的代码是不对的，不知道怎么修改

大数据启动 ambari 失败？ by 卢本伟牛X

https://hainiubl.com/topics/36072? 2019-03-07 ⋅ 2328 ⋅ 0 ⋅ 1

今天在做大数据平台的时候启动ambari-Server时候遇到了这个error，我分为两个节点，一个master一个slave1，同样的步骤，我在master节点启动时遇错，在slave1节点成功启动，找了两天不知道问题在哪，两台机器的MySQL和JAVA -version都是正确且成功显示的，平台是先电大数...

关于 “” 的搜索结果, 共 2411 条