El tercero consistía en una funcion para crean un listado con las correlaciones entre dos variables en cada archivo de un directorio, con un umbral de casos completos.
corr <- function(directory, threshold = 0) {
file_list = list.files(directory)
found = FALSE
for (file in file_list){
current_file = read.csv(paste(directory,"/", file, sep =""))
observed_cases = sum(complete.cases(current_file))
if (observed_cases >= threshold) {
found = TRUE
data_frame = na.omit(current_file)
if (!exists("cor_vector")){
cor_vector = cor(data_frame$sulfate, data_frame$nitrate)
}else{
temp_vector = cor(data_frame$sulfate, data_frame$nitrate)
cor_vector = c(cor_vector, temp_vector)
rm(temp_vector)
}
}
}
if(found==TRUE){cor_vector = cor_vector[-1]}
}
No hay comentarios:
Publicar un comentario