Articles of r faq

Supprimer les lignes avec toutes ou certaines NA (valeurs manquantes) dans data.frame

Je voudrais supprimer les lignes dans ce bloc de données qui: a) contenir des NA dans toutes les colonnes. Voici mon exemple de trame de données. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 […]

Quelles sont les différences entre “=” et “<-" dans R?

Quelles sont les différences entre les opérateurs d’affectation = et <- dans R? Je sais que les opérateurs sont légèrement différents, comme le montre cet exemple x <- y <- 5 x = y = 5 x = y <- 5 x <- y = 5 # Error in (x <- y) = 5 : […]

Comment joindre (fusionner) des trames de données (interne, externe, gauche, droite)?

Étant donné deux trames de données: df1 = data.frame(CustomerId = c(1:6), Product = c(rep(“Toaster”, 3), rep(“Radio”, 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep(“Alabama”, 2), rep(“Ohio”, 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6 Radio df2 # CustomerId […]

Fonctions de regroupement (tapply, by, aggregate) et la famille * apply

Chaque fois que je veux faire quelque chose “map” py dans R, j’essaie généralement d’utiliser une fonction dans la famille apply . Cependant, je n’ai jamais bien compris les différences entre eux – comment { sapply , lapply , etc.} appliquer la fonction à l’entrée input / lapply , à quoi la sortie ressemblera, ou […]

Supprimer les colonnes de bloc de données par nom

J’ai un certain nombre de colonnes que je voudrais supprimer d’un bloc de données. Je sais que nous pouvons les supprimer individuellement en utilisant quelque chose comme: df$x <- NULL Mais j’espérais le faire avec moins de commandes. De plus, je sais que je pourrais supprimer des colonnes en utilisant l’indexation entière comme ceci: df […]

Comment sortinger un dataframe par plusieurs colonnes?

Je veux sortinger un fichier de données par plusieurs colonnes. Par exemple, avec le data.frame ci-dessous je voudrais sortinger par colonne z (décroissant) puis par colonne b (croissant): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x = c("A", "D", "A", "C"), y = c(8, 3, 9, […]