Páginas

domingo, 14 de septiembre de 2014

R: Tercer proyecto de Coursera "Correlation"

El tercero consistía en una funcion para crean un listado con las correlaciones entre dos variables en cada archivo de un directorio, con un umbral de casos completos.

corr <- function(directory, threshold = 0) {
 
  file_list = list.files(directory)
  found = FALSE
 
  for (file in file_list){
    current_file = read.csv(paste(directory,"/", file, sep =""))
    observed_cases = sum(complete.cases(current_file))
    if (observed_cases >= threshold) {
      found = TRUE
      data_frame = na.omit(current_file)
      if (!exists("cor_vector")){
        cor_vector = cor(data_frame$sulfate, data_frame$nitrate)
      }else{
        temp_vector = cor(data_frame$sulfate, data_frame$nitrate)
        cor_vector = c(cor_vector, temp_vector)
        rm(temp_vector)
      }
 
    }
   
  }
  if(found==TRUE){cor_vector = cor_vector[-1]}
 
}

No hay comentarios:

Publicar un comentario