Source Code of com.linkedin.camus.etl.kafka.mapred.EtlSplit

package com.linkedin.camus.etl.kafka.mapred;


import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;


import org.apache.hadoop.io.Writable;
import org.apache.hadoop.mapreduce.InputSplit;


import com.linkedin.camus.etl.kafka.common.EtlRequest;
import com.linkedin.camus.workallocater.CamusRequest;


public class EtlSplit extends InputSplit implements Writable {
  private List<CamusRequest> requests = new ArrayList<CamusRequest>();
  private long length = 0;
  private String currentTopic = "";


  @Override
  public void readFields(DataInput in) throws IOException {
    int size = in.readInt();
    for (int i = 0; i < size; i++) {
      CamusRequest r = new EtlRequest();
      r.readFields(in);
      requests.add(r);
      length += r.estimateDataSize();
    }
  }


  @Override
  public void write(DataOutput out) throws IOException {
    out.writeInt(requests.size());
    for (CamusRequest r : requests)
      r.write(out);
  }


  @Override
  public long getLength() throws IOException {
    return length;
  }


  public int getNumRequests() {
    return requests.size();
  }


  @Override
  public String[] getLocations() throws IOException {
    return new String[] {};
  }


  public void addRequest(CamusRequest request) {
    requests.add(request);
    length += request.estimateDataSize();
  }


  public CamusRequest popRequest() {
    if (requests.size() > 0){
      for (int i = 0; i < requests.size(); i++) {
        // return all request for each topic before returning another topic
        if (requests.get(i).getTopic().equals(currentTopic))
          return requests.remove(i);
      }
      CamusRequest cr = requests.remove(requests.size() - 1);
      currentTopic = cr.getTopic();
      return cr;
    }
    else
      return null;
  }
}
Source Code of com.linkedin.camus.etl.kafka.mapred.EtlSplit

Related Classes of com.linkedin.camus.etl.kafka.mapred.EtlSplit