Spark-RDD转换算子总结(二)
# Value 类型 # sample(withReplacement, fraction, seed) 作用:以指定的随机种子随机抽样出数量为 fraction 的数据,withReplacement 表示是抽出的数据是否放回,true 为有放回的抽样,false 为无放回的抽样,seed 用于指定随机数生成器种子 需求:创建一个 RDD(1-10),从中选择放回和不放回抽样 代码 package com.yaindream.bigdata.sparkimport org.apache.spark.{SparkConf,...
more...