Les messages d'erreur dans le post original sont dues au fait que d_i$a
et d_i$b
sont des vecteurs de 1 000 éléments et 10 est un scalaire. Par conséquent, R compare le premier élément d_i$a
et le premier élément d_i$b
avec 10.
Pour résoudre le message d'erreur nous avons besoin de comparer un vecteur de longueur 1 à l'scalaire 10. Cela nécessite la restructuration du code pour générer des nombres aléatoires, un à un. À partir de la description dans le post original, il est difficile de savoir si ce comportement est intentionnel.
Je vais simplifier le problème en éliminant la série de 10 répétitions pour illustrer comment créer un bloc de données avec des nombres aléatoires jusqu'à ce qu'une ligne a la fois a
et b
avec des valeurs supérieures à 10.
Tout d'abord, nous avons mis une graine pour faire la réponse reproductible, puis initialiser certains objets. Par la mise en a
et b
0 nous assurer que le while()
la boucle sera exécutée au moins une fois.
set.seed(950141238) # for reproducibility
results <- list()
a <- 0 # initialize a to a number < 10
b <- 0 # initialize b to a number < 10
i <- 1 # set a counter
Après avoir initialisé a
et b
le while()
boucle évalue à TRUE
génère deux nombres aléatoires, assigne une valeur de l'index, et les écrit comme un bloc de données à la results
liste. La logique de la while()
boucle indique que, si a
est inférieure ou égale à 10 ou b
est inférieur ou égal à 10, la boucle continue de l'itération. Il s'arrête quand les deux a
et b
sont plus grands que 10.
while(a <= 10 | b <= 10){
a <- rnorm(1,10,1) # generate 1 random number with mean of 10 and sd of 1
b <- rnorm(1,10,1) # ditto
results[[i]] <- data.frame(index = i,a,b)
i <- i + 1 # increment i
}
La boucle s'arrête l'exécution, après le neuvième itération comme on peut le voir par l'impression des données qui en résultent image, après que nous combinons les lignes individuelles avec do.call()
et rbind()
.
df <- do.call(rbind,results)
df
...et la sortie:
> df
index a b
1 1 8.682442 8.846653
2 2 9.204682 8.501692
3 3 8.886819 10.488972
4 4 11.264142 8.952981
5 5 9.900112 10.918042
6 6 9.185120 10.625667
7 7 9.620793 10.316724
8 8 11.718397 9.256835
9 9 10.034793 11.634023
>
Notez que la dernière ligne du bloc de données présente des valeurs supérieures à 10 pour les deux a
et b
.
Plusieurs répétitions de la boucle while
Répéter le processus 10 fois comme cela se fait dans le post original, de terminer l'opération en for()
boucle, et ajouter une deuxième liste, combined_results
pour enregistrer les résultats de chaque itération.
set.seed(950141238) # for reproducibility
combined_results <- list()
for(iteration in 1:10){
results <- list()
a <- 0 # initialize a to a number < 10
b <- 0 # initialize b to a number < 10
i <- 1 # set a counter
while((a < 10) | (b < 10)){
a <- rnorm(1,10,1) # generate 1 random number with mean of 10 and sd of 1
b <- rnorm(1,10,1) # ditto
results[[i]] <- data.frame(iteration,index = i,a,b)
i <- i + 1 # increment i
}
combined_results[[iteration]] <- do.call(rbind,results)
}
df <- do.call(rbind,combined_results)
df[df$iteration < 5,]
...et la sortie pour les 4 premières itérations de la boucle externe:
> df[df$iteration < 5,]
iteration index a b
1 1 1 8.682442 8.846653
2 1 2 9.204682 8.501692
3 1 3 8.886819 10.488972
4 1 4 11.264142 8.952981
5 1 5 9.900112 10.918042
6 1 6 9.185120 10.625667
7 1 7 9.620793 10.316724
8 1 8 11.718397 9.256835
9 1 9 10.034793 11.634023
10 2 1 11.634331 9.746453
11 2 2 9.195410 7.665265
12 2 3 11.323344 8.279968
13 2 4 9.617224 11.792142
14 2 5 9.360307 11.166162
15 2 6 7.963320 11.325801
16 2 7 8.022093 8.568503
17 2 8 10.440788 9.026129
18 2 9 10.841408 10.033346
19 3 1 11.618665 10.179793
20 4 1 10.975061 9.503309
21 4 2 10.209288 12.409656
>
De nouveau, nous constatons que la dernière ligne de chaque itération (9, 18, 19, et 21) ont des valeurs supérieures à 10 pour les deux a
et b
.
Notez que cette approche ne parvient pas à profiter de vectorisé opérations dans R, ce qui signifie qu'au lieu de générer de 1000 nombres aléatoires à chaque appel à rnorm()
le code basé sur une while()
génère un seul nombre aléatoire par appel à rnorm()
. Depuis rnorm()
est une exploitation intensive des ressources de la fonction, le code qui minimise le nombre de fois rnorm()
exécute est souhaitable.