J'ai deux pandas dataframes comme suit:
df1
site | lien |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
site | lien |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Donc je veux aller à travers df2 et trouver les instances de liens à partir de df2 en df1. Voici mon code:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Quand j'ai l'impression boolean_findings, je suis de tout faux, ce qui je sais ne peut pas être vrai parce que je vais voir des matchs localement sur mes fichiers excel:
boolean_findings |
---|
Faux |
Faux |
... |
Faux |
Ce que je veux savoir, c'est pourquoi le lien hypertexte chaîne de texte n'est pas compensée avec son équivalent sur la première df, et que puis-je faire pour correspondre à la sites.
TypeError: replace() takes no keyword arguments
. Quand j'enlève leregex=True
il ne fait pas d'erreur, mais il ne remplace pas non plus. Je pense que je vais regarder dans lere
module de régler cette question, mais merci de me mettre sur le droit chemin!