J'ai trois dossiers comme ceci
[('a1', ['b1', 'c1', 'd1', 'e1']), ('a2', ['b1', 'c2', 'd2', 'e1']),('a3', ['b1', 'c2', 'd1', 'e2'])]
contenant l'id de la clé en tant que liste de valeurs pour chaque clé.
- Je veux obtenir le nombre total de valeurs dans la liste pour chaque clé dans pyspark.
- Comment je peux obtenir la liste des amis en commun entre toute paire de démons dans pyspark.