· 搜索结果 | 海汼部落 | IT学习->实战为王

zouziyan

第 9297 位会员 ⋅ 2024-03-21 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

123nn

第 9309 位会员 ⋅ 2024-03-23 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

Xhy

牛人

第 8067 位会员 ⋅ 2023-10-31 ⋅ 2 关注者 ⋅ 0 篇话题 ⋅ 0 条回帖 ⋅ 篇文章

黄钟吕

第 9062 位会员 ⋅ 2024-02-29 ⋅ 0 关注者 ⋅ 0 篇话题 ⋅ 2 条回帖 ⋅ 篇文章

DER | 请一句话介绍你自己，大部分情况下会在你的头像和名字旁边显示，字数要大...

第 4719 位会员 ⋅ 2021-09-27 ⋅ 126 关注者 ⋅ 57 篇话题 ⋅ 1 条回帖 ⋅ 篇文章

请问一下 mvn clean package 报错怎么解决？ by 如风

https://hainiubl.com/topics/36220? 2019-03-18 ⋅ 4991 ⋅ 0 ⋅ 3

![file](http://hainiubl.com/uploads/images/201903/18/3438/PFEj1coLbK.png)

利用 CDH5.16.1 添加 hue 时提示 hue server 启动不起来？请大神解决 by 好好学习

https://hainiubl.com/topics/36221? 2019-03-20 ⋅ 4776 ⋅ 0 ⋅ 2

![file](http://hainiubl.com/uploads/images/201903/20/1773/fxq04IVqVS.png) ![file](http://hainiubl.com/uploads/images/201903/20/1773/OgF2yHbaAx.png) log显示 File "/www/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/hue/build/env/lib/python2.7/s...

Notepad++ 中如何对 hadoop 文件进行修改保存？ by 如风

https://hainiubl.com/topics/36222? 2019-03-21 ⋅ 2938 ⋅ 0 ⋅ 1

编辑了一个权限777的文本，但每次点击保存之后，原来的文本没有变，只多了一个“？？？？？？？”修改后的文件。![file](http://hainiubl.com/uploads/images/201903/21/3438/QRZoZ2N1GD.png)

关于 zookeeper 在 hadoop 运用中的一个疑问？ by 如风

https://hainiubl.com/topics/36225? 2019-03-22 ⋅ 2776 ⋅ 0 ⋅ 1

因为zookeeper的一个作用是防止hadoop因为一个datanode挂掉而导致整个集群不能正常使用的问题，在海牛视频里面看到zookeeper集群是由nn1，nn2，s1，三个虚拟机组成的集群。而在hdfs环境搭建时，由nn1和nn2担任namenode的角色，所以有个小疑问，如果nn1的namenode节点挂...

Hadoop 默认 map 数是 2，块大小 128M，当文件为 512M 是会有几个 map，有几个 map 并行？ by 七里芬芳

https://hainiubl.com/topics/36235? 2019-03-25 ⋅ 2576 ⋅ 0 ⋅ 1

Hadoop默认map数是2，块大小128M，当文件为 512M是会有几个map，有几个map并行？

hadoop 环境搭建及开发的 jdk 版本问题？ by 七里芬芳

https://hainiubl.com/topics/36236? 2019-03-25 ⋅ 2493 ⋅ 0 ⋅ 1

各位大神好，我最近在自己的虚拟机上搭建hadoop环境，使用的hadoop版本是3.0alpha版本，要求jdk1.8，我在我的pc虚拟机中安装了jdk1.8。而我之前java项目开发，用的版本是1.7，这个低版本会对后续的hadoop有影响吗？

cloudera manager 的 server 提示 cloudera-scm-server dead but pid file exists？请大神解决 by 好好学习

https://hainiubl.com/topics/36237? 2019-03-25 ⋅ 7073 ⋅ 0 ⋅ 3

上周五CDH集群运行好好的，各个组件运行良好，今天周一早晨来之后发现挂掉了，启动cm的server一会儿后就挂掉，提示cloudera-scm-server dead but pid file exists，通过cloudera-scm-server.log日志提示： ERROR ParcelUpdateService:com.cloudera.parcel.components...

python 怎么设置 cuda 的随机数种子 curand？ by 七里芬芳

https://hainiubl.com/topics/36238? 2019-03-26 ⋅ 3252 ⋅ 0 ⋅ 1

比如用tensorflow之类的深度学习库时，都会用到cuda来初始化tensor，如果不设置curand，每次运行初始化的结果都会不同，所以这里要怎么写？

hadoop streaming 中 reduce 程序如何将结果保存在一个文件中输出？ by 七里芬芳

https://hainiubl.com/topics/36239? 2019-03-26 ⋅ 2709 ⋅ 0 ⋅ 1

想问一下，我写了mapper程序，然后reduce"cat"这样子写，这样得到的结果分布在很多文件夹中（因为程序就是在不同的零碎文件中查找目标string出现的次数），每个文件中保存了各自文件中string出现的次数，但是我的目标是把所有文件中string出现的次数相加放到一个文件输...

Hadoop 下 reduce 处理量最大是 1G 如果 order by 全局排序的文件超过 1G，系统如何处理？ by 七里芬芳

https://hainiubl.com/topics/36240? 2019-03-26 ⋅ 3071 ⋅ 0 ⋅ 1

Hadoop下reduce处理量最大是1G如果order by 全局排序的文件超过1G，系统如何处理？

关系数据修改后如何刷新 Hadoop 平台数据? by 七里芬芳

https://hainiubl.com/topics/36241? 2019-03-26 ⋅ 3153 ⋅ 0 ⋅ 1

大家把关系数据库海量数据增量抽到Hadoop平台是存储在哪里（比如hdfs hive HBASE等）?关系数据修改后如何刷新Hadoop平台数据的？

大的文件拆分后，怎样用 Hadoop 进行高效的处理这些小文件？以及怎样让各个节点尽可能的负载均衡？ by 七里芬芳

https://hainiubl.com/topics/36242? 2019-03-26 ⋅ 2662 ⋅ 0 ⋅ 1

大的文件拆分后，怎样用Hadoop进行高效的处理这些小文件？以及怎样让各个节点尽可能的负载均衡？

spark 开发词频统计应用，最后数据保存到 Hadoop 下的 data 文件里？ by 七里芬芳

https://hainiubl.com/topics/36243? 2019-03-26 ⋅ 2856 ⋅ 0 ⋅ 1

spark开发词频统计应用，最后数据保存到Hadoop下的data文件里，用Hadoop查看保存的data文件里面有好几个文档，数据究竟在哪个文档里

Spark 是一种内存计算引擎，为什么他还要依赖 HDFS 这种文件系统呢？ by 七里芬芳

https://hainiubl.com/topics/36244? 2019-03-27 ⋅ 3030 ⋅ 0 ⋅ 1

Spark是一种内存计算引擎，为什么他还要依赖HDFS这种文件系统呢？

spark 如何实现一个快速的 RDD 中所有的元素相互计算？ by 七里芬芳

https://hainiubl.com/topics/36245? 2019-03-27 ⋅ 3307 ⋅ 0 ⋅ 1

在spark集群中需要实现每个元素与其他元素进行计算，比如 rdd = sc.parallelize(Array('a', 'b', 'c', 'd'))，那么需要相互计算的元素对为 (a, b), (a, c), (a, d), (b, c), (b, d), (c, d) 我知道可以先进行cartesian，然后filter一下，但是对于数据量特别大的...

如何解决 Spark 大规模数据运行情况下，速度越来越慢的情况？ by 七里芬芳

https://hainiubl.com/topics/36246? 2019-03-27 ⋅ 4739 ⋅ 0 ⋅ 1

![file](http://hainiubl.com/uploads/images/201903/27/3491/mfNezYCJoG.png) 现在问题是分批利用集群处理数据：按照理论来说，同一个任务流程，每批的处理时间应该相同，但是现在问题是，第1批是时间很快，大概5分钟能处理完，运行一段时间后，到第30多批后，运...

SparkStreaming 消费 kafka 数据，怎样解决大量初始化数据的问题？ by 七里芬芳

https://hainiubl.com/topics/36247? 2019-03-27 ⋅ 3064 ⋅ 0 ⋅ 1

目前遇到一个问题，SparkStreaming消费Kafka数据的时候，当有大量初始化数据，并且这些数据涉及大量任务，那么这初始化的大量任务的执行会阻塞实时从Kafka发送过来的任务（因为当前任务的执行优化的还不够快，所以当初始化发送好几万的任务的时候造成非常明显的阻塞），...

Kafka-spark-kafka-spark 架构有什么优势吗，为何两次使用 kafka？ by 七里芬芳

https://hainiubl.com/topics/36250? 2019-03-29 ⋅ 4872 ⋅ 0 ⋅ 1

看到一篇文章说，直接kafka到spark到mysql出现了数据重复的问题，然后在spark后再加一个kafka，解决了数据重复问题，为什么呢？？ ![file](http://hainiubl.com/uploads/images/201903/29/3491/sEcvf4h4cm.png)

python 怎么去获取 Kafka 的 topic？ by 刘世兴

https://hainiubl.com/topics/36251? 2019-03-29 ⋅ 5611 ⋅ 0 ⋅ 1

python2.7怎么获取Kafka的topic？

kafka 消费异常消息后后面的消息都处理不了了吗? by 许宁

https://hainiubl.com/topics/36252? 2019-03-29 ⋅ 6571 ⋅ 0 ⋅ 1

1.kafka其中一条消息异常，导致后面无法消费，这种情况怎么处理，可否像其他消息一样乱序重试，已查阅kafka无重试队列这个概念。 2.kafka消息丢失是怎么回事，acks设置为-1还会有消息丢失吗，问题点在哪里？ 3.既要有大吞吐量，又要可靠性，这种情况用哪个消息队...

kafka spring 如何发送的消息，他自己管理 zookeeper 吗？ by 七里芬芳

https://hainiubl.com/topics/36253? 2019-03-29 ⋅ 4361 ⋅ 0 ⋅ 1

我想发送消息给kafka，现在用的是spring for kafka框架,在代码里我是用KafkaTemplate发送给kafka的，配置里写的是kafka.bootstrap-servers=192.168.130.73:9092当然可以在多加，我知道zookeeper是默认来管理kafka节点的，我现在不太明白kafkatemplate发送的时候他是自动...

kafka 的本地 Producer 如何向远程 Kafka 服务器读入数据？ by y514637059

https://hainiubl.com/topics/36254? 2019-03-29 ⋅ 5243 ⋅ 0 ⋅ 1

producer和 kafka集群不在同一个局域网内，怎么通过这个producer向这个卡卡集群写入数据

CDH 集群环境安全问题如何解决？ by 好好学习

https://hainiubl.com/topics/36255? 2019-03-29 ⋅ 6128 ⋅ 1 ⋅ 1

最近公司搭建了CDH生产环境，考虑到数据安全， 1、具体应该做哪方面的工作？ 2、有没有类似的文档可以提供呢？ 3、启用kerberos认证会不会后面操作代码比较麻烦？ 4、基于sentry的角色权限控制加入后代码操作是不是比较麻烦？ 5、在CDH平台中如何设置hdfs的静态、...

有没有大佬知道，pygame 中 get_busy () 函数怎样才会返回一个 1？ by 刘明

https://hainiubl.com/topics/36256? 2019-03-29 ⋅ 5499 ⋅ 0 ⋅ 1

不管我音乐有没有开始播放，这函数返回值都是0，按理来说，不应该是音乐播放过程中，返回1，音乐放完了，就返回0，这么理解不对吗？

pygame 的图片为什么加载不出来？ by 小强飞飞飞

https://hainiubl.com/topics/36258? 2019-03-29 ⋅ 5859 ⋅ 0 ⋅ 1

代码如下： # Unit aaa: Pygame Hello Wall Ball Game version 1 import pygame, sys pygame.init() size = width, height = 600, 400 speed = [1, 1] BLACK = 0, 0, 0 screen = pygame.display.set_mode(size) pygame.d...

pygame1.9.4 往后没有 movie 模块了，怎么实现添加视频？ by 不疯何以成佛

https://hainiubl.com/topics/36259? 2019-03-29 ⋅ 4827 ⋅ 0 ⋅ 0

原来的代码可以实现，但是单位电脑安不了，64位1.9.3就没有movie模块，win32的1.9.3就有，而最新的1.9.4或1.9.5都没有，怎么解决，大神们没有在游戏里添加酷炫的视频吗，，不想转化成图片逐帧，

Python 的 for in 循环能嵌套使用？ by 星际旅行

https://hainiubl.com/topics/36260? 2019-03-29 ⋅ 5413 ⋅ 0 ⋅ 1

Python的for in循环能嵌套使用？

Pandas 读取 Excel 中指定单元格后再取 dataFrame 怎么做? by 张文海

https://hainiubl.com/topics/36261? 2019-03-29 ⋅ 6877 ⋅ 0 ⋅ 1

如题，我想要从Excel表中先获取B2单元格的日期，再读取下面的数据。我目前先读取一次DataFrame获取全表内容指定返回日期然后再skiprows=5提取下面的DataFrame 有没有什么方法，先提取一次全表的DataFrame，读取日期后，再忽略掉这个DataFrame的前四行，并且...

yarn 提交任务之后一直处于 pending 状态怎么解决？ by 如风

https://hainiubl.com/topics/36263? 2019-04-02 ⋅ 11378 ⋅ 0 ⋅ 1

![file](http://hainiubl.com/uploads/images/201904/02/3438/ABQk9LI8xx.png) ![file](http://hainiubl.com/uploads/images/201904/02/3438/jndjAoMEi3.png) Tracking UI 处于UNASSIGNED状态 ![file](http://hainiubl.com/uploads/images/201904/02/3438/vijbwWrpMy...

spring boot 集成阿里云的 kafka 消息服务，无法读取 jks 文件？ by 夜雨微风

https://hainiubl.com/topics/36265? 2019-04-03 ⋅ 5375 ⋅ 0 ⋅ 1

spring boot集成阿里云的kafka消息服务。由于阿里云的服务是使用了ssl的，所以配置kafka的时候引入了jks证书文件。在IDE中调试运行一切正常。但是当打成jar包后，无论将jks文件放到任何地方，都读取不到（报文件不存在错误）。第一次遇到这种问题，请大神不吝赐教。

关于 “” 的搜索结果, 共 2411 条