Comment puis-je utiliser value_counts() seulement pour certaines valeurs?

Question 1

Je veux extraire la façon dont de nombreux commentaires élogieux de la part de la marque sont dans un jeu de données qui comprend des examens de milliers de produits. J'ai utilisé ce code et j'ai eu une table, y compris percentaje de positif et non des critiques positives. Comment puis-je obtenir seulement le pourcentage de critiques positives par la marque? Je ne veux le "Vrai" résultats dans positive_review. Merci!

df_reviews_ok.groupby("brand")["positive_review"].value_counts(normalize=True).mul(100).round(2)
brand                   positive_review
Belkin                  False               70.00
                        True                30.00
Bowers & Wilkins        False               67.65
                        True                32.35
Corsair                 False               75.22
                        True                24.78
Definitive Technology   False               68.29
                        True                31.71
Dell                    False               60.87
                        True                39.13
DreamWave               False              100.00
House of Marley         False              100.00
JBL                     False               58.43
                        True                41.57
Kicker                  True                66.67
                        False               33.33
Lenovo                  False               76.92
                        True                23.08
Logitech                False               75.75
                        True                24.25
MEE audio               False               53.80
                        True                46.20
Microsoft               False               67.86
                        True                32.14
Midland                 False               72.09
                        True                27.91
Motorola                False               72.92
                        True                27.08
Netgear                 False               72.30
                        True                27.70
Pny                     False               68.78
                        True                31.22
Power Acoustik          False              100.00
SVS                     False              100.00
Samsung                 False               61.94
                        True                38.06
Sanus                   False               75.93
                        True                24.07
Sdi Technologies, Inc.  False               55.63
                        True                44.37
Siriusxm                False               73.33
                        True                26.67
Sling Media             False               67.16
                        True                32.84
Sony                    False               55.40
                        True                44.60
Toshiba                 False               56.52
                        True                43.48
Ultimate Ears           False               70.21
                        True                29.79
Verizon Wireless        False               75.86
                        True                24.14
WD                      False               58.33
                        True                41.67
Yamaha                  False               61.15
                        True                38.85
Name: positive_review, dtype: float64

Question 2

À l'aide de la suite de jouet DataFrame à titre d'exemple:

df = pd.DataFrame({
    'brand': list('AAAABBBB'),
    'positive': [True, True, False, False, True, True, True, False]
})

Si vous souhaitez obtenir le pourcentage de critiques positives pour chacune de ces marques par rapport au nombre total de commentaires par marque puis essayez:

df.groupby('brand')['positive'].mean()

Le résultat est comme prévu:

brand
A    0.50
B    0.75
Name: positive, dtype: float64

Question 3

Vous pouvez unstack la sortie et la tranche de la Vraie

(df.groupby('brand')
   ['positive_review'].value_counts(normalize=True)
   .mul(100).round(2)
   .unstack(fill_value=0)
   [True]
 )

Question 4

Comment sur l'utilisation de .reset_index() après l'instruction, puis à l'aide d'une condition.

rudolfovic · Answer 1 · 2021-11-22T17:40:05

À l'aide de la suite de jouet DataFrame à titre d'exemple:

df = pd.DataFrame({
    'brand': list('AAAABBBB'),
    'positive': [True, True, False, False, True, True, True, False]
})

Si vous souhaitez obtenir le pourcentage de critiques positives pour chacune de ces marques par rapport au nombre total de commentaires par marque puis essayez:

df.groupby('brand')['positive'].mean()

Le résultat est comme prévu:

brand
A    0.50
B    0.75
Name: positive, dtype: float64

mozway · Answer 2 · 2021-11-22T17:32:19

Vous pouvez unstack la sortie et la tranche de la Vraie

(df.groupby('brand')
   ['positive_review'].value_counts(normalize=True)
   .mul(100).round(2)
   .unstack(fill_value=0)
   [True]
 )

Jeremy Caney · Answer 3 · 2021-11-22T17:39:50

-1

Comment sur l'utilisation de .reset_index() après l'instruction, puis à l'aide d'une condition.

Jeremy Caney

2021-11-22 17:39:50

Qui pourrait être utile. Pouvez-vous donner une explication plus détaillée et, éventuellement, certains plus contextuelle de code pour les futurs lecteurs peuvent suivre vos conseils?

Jeremy Caney

Comment puis-je utiliser value_counts() seulement pour certaines valeurs?

La question

La meilleure réponse

Dans d'autres langues

Cette page est dans d'autres langues

Populaires dans cette catégorie

Questions populaires dans cette catégorie