Maintenant, j'ai deux données, le nom et le texte, et je veux calculer le nombre d'occurrences de chaque nom dans nom dans l'année en cours dans le texte, qui est, pour générer des données de résultat. Comment atteindre cet objectif? J'ai essayé lapply et grepl, mais les deux ont échoué. Merci beaucoup!
name=data.table(year=c(2018,2019,2020),
name0=list(c("A","B","C"),c("B","C"),c("D","E","F")))
text=data.table(year=c(2018,2018,2019,2019,2020),
text0=list(c("DEF","BG","CG"),c("ART","CWW"),c("DLK","BU","FO"),
c("A45","11B","C23"),c("EIU","CM")))
result=data.table(year=c(2018,2018,2018,2019,2019,2020,2020,2020),
name0=c("A","B","C","B","C","D","E","F"),
count=c(1,1,2,2,1,0,1,0))
text
sont plus de 100 millions de dollars, afin de R les rapports d'Erreur: mémoire épuisée (limite atteinte?). Savez-vous comment résoudre ce problème?