Articles of dplyr

Trouver des éléments dupliqués avec dplyr

J’ai essayé d’utiliser le code présenté ici pour trouver TOUS les éléments dupliqués avec dplyr comme ceci: library(dplyr) mtcars %>% mutate(cyl.dup = cyl[duplicated(cyl) | duplicated(cyl, from.last = TRUE)]) Comment convertir le code présenté ici pour trouver TOUS les éléments dupliqués avec dplyr? Mon code ci-dessus lance simplement une erreur? Ou mieux encore, existe-t-il une autre […]

R dplyr: renommer les variables en utilisant des fonctions de chaîne

(Question quelque peu connexe: entrez les nouveaux noms de colonnes sous forme de chaîne dans la fonction de renommage de dplyr ) Au milieu d’une chaîne de caractères dplyr ( %>% ), je voudrais remplacer plusieurs noms de colonnes par des fonctions de leurs anciens noms (en utilisant tolower ou gsub , etc.) library(tidyr); library(dplyr) […]

évaluation standard dans dplyr: résumé_ sur la variable donnée en tant que chaîne de caractères

Je veux faire référence à un nom de colonne inconnu dans un summarise . Les fonctions d’évaluation standard introduites dans dplyr 0.3 permettent de référencer des noms de colonne à l’aide de variables, mais cela ne semble pas fonctionner lorsque vous appelez une fonction de base R, par exemple dans un summarise . library(dplyr) key […]

Problèmes de dplyr lors de l’utilisation de group_by (plusieurs variables)

Je veux commencer à utiliser dplyr à la place de ddply mais je ne peux pas comprendre comment cela fonctionne (j’ai lu la documentation). Par exemple, pourquoi lorsque j’essaie de muter (), quelque chose la fonction “group_by” ne fonctionne pas comme prévu? En regardant mtcars: bibliothèque (voiture) Disons que je fais un data.frame qui est […]

Définissez certaines valeurs sur NA avec dplyr

J’essaie de trouver un moyen simple de faire quelque chose comme ça avec dplyr (dataset = dat, variable = x): day$x[dat$x<0]=NA Devrait être simple mais c’est le mieux que je puisse faire pour le moment. Y a-t-il un moyen plus facile? dat = dat %>% mutate(x=ifelse(x<0,NA,x))

dplyr mutent les calculs de rangs ou les fonctions personnalisées

J’essaie de muter une nouvelle variable à partir du calcul de la ligne, disons rowSums comme ci-dessous iris %>% mutate_(sumVar = iris %>% select(Sepal.Length:Petal.Width) %>% rowSums) le résultat est que “sumVar” est tronqué à sa première valeur (10.2): Source: local data frame [150 x 6] Groups: Sepal.Length Sepal.Width Petal.Length Petal.Width Species sumVar 1 5.1 3.5 […]

R dplyr: Supprime plusieurs colonnes

J’ai un cadre de données et une liste de colonnes dans ce cadre de données que j’aimerais supprimer. Utilisons le jeu de données iris comme exemple. Je voudrais supprimer Sepal.Length et Sepal.Width et utiliser uniquement les colonnes restantes. Comment puis-je le faire en utilisant select ou select_ du package dplyr ? Voici ce que j’ai […]

dplyr muter / remplacer sur un sous-ensemble de lignes

Je suis en train d’essayer un workflow basé sur dplyr (plutôt que d’utiliser principalement data.table, auquel je suis habitué), et j’ai rencontré un problème que je ne trouve pas de solution dplyr équivalente à . Je suis souvent confronté au scénario dans lequel je dois mettre à jour / remplacer de manière conditionnelle plusieurs colonnes […]

dplyr :: sélectionner une colonne et la produire comme vecteur

dplyr::select résultat un data.frame, y a-t-il un moyen de le rendre si le résultat est une colonne? Actuellement, je dois faire un pas supplémentaire ( res <- res$y ) pour le convertir en vecteur à partir de data.frame, voir cet exemple: #dummy data df <- data.frame(x = 1:10, y = LETTERS[1:10], stringsAsFactors = FALSE) #dplyr […]

dplyr: sélectionne les noms de colonnes contenant des espaces blancs

df <- structure(list(`aa` = 1:3, `ab` = 2:4), .Names = c("aa", "ab" ), row.names = c(NA, -3L), class = "data.frame") et les données ressemblent aaab 1 1 2 2 2 3 3 3 4 Appel suivant pour sélectionner select(df, ‘a a’) donne Error in abs(ind[ind < 0]) : non-numeric argument to mathematical function Comment puis-je […]