Sélectionnez les colonnes qui a une valeur spécifique dans les données.table

0

La question

Exemple Minimal:

dt <- data.table(a=c(1,2,3),b=c(4,5,6))

Qui ressemble à ça:

>  dt
   a b
1: 1 4
2: 2 5
3: 3 6

Supposons que je veuille l'indice de la colonne où il y a un 6 la valeur, dans ce jouet exemple, il est facile puisque nous savons que la colonne:

> dt[,.(b)]
   b
1: 4
2: 5
3: 6

Maintenant, si ce dt a plusieurs milliers de colonnes et nous ne savons pas d'où l' 6 des mensonges.

J'ai essayé ceci:

> dt[,.SD==6]
         a     b
[1,] FALSE FALSE
[2,] FALSE FALSE
[3,] FALSE  TRUE

et ceci:

> dt[,lapply(.SD,`==`,6)]
       a     b
1: FALSE FALSE
2: FALSE FALSE
3: FALSE  TRUE

et aussi que:

> dt[,lapply(.SD,function(x) any(x==6))]
       a    b
1: FALSE TRUE

Mais je ne peux pas obtenir de la colonne d'origine de retour:

   b
1: 4
2: 5
3: 6
data.table r
2021-11-23 09:48:09
2

La meilleure réponse

1
dt[, colSums(dt == 6) > 0, with = FALSE]
#    b
# 1: 4
# 2: 5
# 3: 6
2021-11-23 09:59:49
1

Heureusement qu'il y a une solution plus élégante, mais en attendant:

dt[,sapply(dt, function(x) any(x == 6)), with=F]
   b
1: 4
2: 5
3: 6

Voici un rapide test, puisque les données.le tableau est souvent utilisé pour la vitesse:

enter image description here

n=1000000
dt = data.table(V1 = round(runif(n) * 100), V2 = round(runif(n) * 100) ,V3 = round(runif(n) * 100), V4 = round(runif(n) * 100), V5 = round(runif(n) * 100), V6 = round(runif(n) * 100))

bench = microbenchmark::microbenchmark(
    user438383 = dt[,sapply(dt, function(x) any(x == 6)), with=F],
    Wimpel = dt[, colSums(dt == 6) > 0, with = FALSE],
    times = 10000
    )
2021-11-23 10:44:14

Dans d'autres langues

Cette page est dans d'autres langues

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................