- 主题:为什么没人学 scala ?
全站审核中,暂不能查看本文内容...
pyspark 会更慢一点
【 在 qlogic 的大作中提到: 】
: spark数据处理的领域,scala仍然是首选语言
: 虽然现在pyspark也用的比较多了
:
--
FROM 58.48.44.*
pyspark 涉及 java 虚拟机和 python 进程之间的调度和通信开销
【 在 eventvwr 的大作中提到: 】
: 为啥会慢?driver慢一些,对一个job来说几乎可以忽略吧
--
FROM 171.113.168.*
就是在 worker 上的开销。
【 在 eventvwr 的大作中提到: 】
: 这个开销只会在driver上吧,具体任务执行节点会有这个开销吗?
--
FROM 171.113.168.*