现状: 在kafka定义了一个主题 topic_log (只有一个分区) storm去消费这个主题
现有10个工程先后的向topic_log添加数据 (工程A先向topic_log发布消息 工程B后发布)
storm在处理数据的时候就会先处理工程A然后再处理工程B 这样会导致 storm处理工程B的时间延迟的很厉害的
要求 storm处理的时候能够 比较均衡的处理工程A和工程B的数据 从而让每个工程的数据处理时间不会太大的延迟 应该怎样做呢?
现状: 在kafka定义了一个主题 topic_log (只有一个分区) storm去消费这个主题
现有10个工程先后的向topic_log添加数据 (工程A先向topic_log发布消息 工程B后发布)
storm在处理数据的时候就会先处理工程A然后再处理工程B 这样会导致 storm处理工程B的时间延迟的很厉害的
要求 storm处理的时候能够 比较均衡的处理工程A和工程B的数据 从而让每个工程的数据处理时间不会太大的延迟 应该怎样做呢?
为啥不用两个strom去处理 一个处理a 一个处理b
@青牛 谢谢老师 ,资源是一定的 不能起两个storm 我用 多主题多分区 在一个spout里面订阅多个主题 循环这些主题的分区 取出每个分区的部分数据这样一定程度上解决吧
@shishuai19910217 可以 提高效率的方法一般都是增加消费者 但是增加的逻辑和处理数据的逻辑自己控制好就可以了