#........................................................................... # Simulacion de una muestra artificial de 6 variables y 100 observaciones. # Sirve para la practica de la asignatura de Estadistica Descriptiva y # Analisis de Datos de 1º de Diplomatura en Estadistica. #........................................................................... # Limpio el entorno de variables anteriores: rm(list = ls()) # Fijo el tamaño de la muestra: n <- 100 #--------------------------------------------------------------------------- # Simulo n valores de dos normales con medias y varianzas aleatorias: # Una de las variables está relacionada linealmente con la otra. pre1 <- 100 pre2 <- 20 m1 <- round(pre1*runif(1)) s1 <- round(pre2*runif(1)) pend <- (pre2*runif(1)) intercept <- (pre1*runif(1)) x4 <- rnorm(n,m1,s1) # Simulo un 10% de outliers: kk <- sample(1:n, n*(10/100), replace = T) x4[kk]<- rnorm(length(kk),m1+30,10) x5 <- pend*x4 + intercept + rnorm(n,0,(4*s1)) #--------------------------------------------------------------------------- # Simulo n valores de una exponencial con media L aleatoria: L <- round(20*runif(1)) x6 <- rexp(n,(1/L)) #--------------------------------------------------------------------------- # Simulo n valores de tres variables categoricas. # Con dos categorias: kk <- rep(1:2,c(3,4)) x1 <- sample(kk,n,replace=T) # table(x1)/n # Con cuatro categorias: kk <- rep(1:4,c(3,2,5,1)) x2 <- sample(kk,n,replace=T) # table(x2)/n # Con cinco categorias: kk <- rep(1:5,c(3,4,5,6,2)) x3 <- sample(kk,n,replace=T) # table(x3)/n # Alternativas ............. # x <- runif(n) #x1 <- NULL # x1[x<0.5]<-1 # x1[x>=0.5]<-2 # .......................... # x2 <- rpois(n,3) # x2[x2>=4] <- 4 # x2[x2==0] <- 1 # .......................... #--------------------------------------------------------------------------- # Lo pongo todo en una sola matriz para grabar despues los datos: m <- cbind(x1,x2,x3,x4,x5,x6) # El fichero de salida se llama "datos.txt". # El formato de salida esta en ASCII: write(t(m),"c:\\cursocIII\\datos.txt", ncolumns=6) # NOTA: Los decimales van con punto. Para leer los datos con SPSS # o Statgraphics hay que cambiar los puntos de los decimales # por comas.