Erreur: le contenu XML ne semble pas être XML | R 3.1.0

J’essaie d’obtenir ce fichier XML, mais je suis incapable de le faire. J’ai vérifié les autres solutions dans le même sujet, mais je ne pouvais pas comprendre. Je suis un débutant R

> library(XML) > fileURL  doc <- xmlTreeParse(fileURL,useInternal=TRUE) 

Erreur: le contenu XML ne semble pas être XML: ‘ https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml ‘

Peux-tu aider s’il te plait?

Retirez le s de https

 library(XML) fileURL<-"https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml" doc <- xmlTreeParse(sub("s", "", fileURL), useInternal = TRUE) class(doc) ## [1] "XMLInternalDocument" "XMLAbstractDocument" 

Vous pouvez utiliser RCurl pour récupérer le contenu, puis XML semble pouvoir le gérer

 library(XML) library(RCurl) fileURL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml" xData <- getURL(fileURL) doc <- xmlParse(xData) 

xmlTreeParse ne supporte pas https.

Vous pouvez charger les données avec getURL (à partir de RCurl ), puis les parsingr.

La réponse est à http://www.omegahat.net/RCurl/installed/RCurl/html/getURL.html . Le point clé consiste à utiliser ssl.verifyPeer = FALSE avec getURL si une erreur de certificate est affichée.

 library (RCurl) library (XML) curlVersion()$features curlVersion()$protocol ##These should show ssl and https. I can see these on windows 8.1 at least. ##It may differ on other OSes. temp <- getURL("https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml", ssl.verifyPeer=FALSE) DFX <- xmlTreeParse(temp,useInternal = TRUE) 

Si les fonctionnalités ssl ou https ne sont pas affichées par les fonctions libcurl, cochez Rcurl avec les HTTP .