Tutoriels de programmation - page 8

 

Graphique à barres du programme R


Graphique à barres du programme R

Bonjour à tous et bienvenue dans une autre leçon vidéo sur le langage de programmation R. Dans le didacticiel d'aujourd'hui, nous allons apprendre à créer un graphique à barres simple à l'aide de R.

Pour commencer, définissons un vecteur appelé "voitures" avec six valeurs. Nous pouvons accomplir cela en créant une variable nommée "voitures" et en lui attribuant les valeurs 2, 4, 7, 5, 10 et 12. Ce vecteur représente les points de données que nous voulons visualiser dans notre graphique à barres.

Passons maintenant à la création du graphique à barres réel. Nous utiliserons la fonction "barplot()", spécialement conçue pour créer des graphiques à barres dans R. En tant que paramètre d'entrée, nous transmettons le vecteur "voitures" à la fonction.

Lorsque nous exécutons le code, un graphique à barres sera généré sur le côté droit de l'écran, affichant les six valeurs de notre vecteur "voitures" sous forme de barres individuelles.

J'espère que vous avez trouvé ce court didacticiel vidéo sur la création d'un graphique à barres simple dans le langage de programmation R utile et informatif. Si vous avez des questions, n'hésitez pas à les laisser dans la section des commentaires. Restez à l'écoute pour la prochaine vidéo, où nous approfondirons des sujets plus passionnants.

R Program Bar Graph
R Program Bar Graph
  • 2017.05.13
  • www.youtube.com
Create a simple bar graph using the R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://w...
 

Programme R de régression linéaire Faire des prédictions


Programme R de régression linéaire Faire des prédictions

Bonjour à tous et bienvenue dans ce tutoriel vidéo sur le langage de programmation R.

Dans ce didacticiel, nous allons nous plonger dans l'analyse des données et nous concentrer sur la réalisation de prédictions à l'aide du modèle de régression linéaire. La régression linéaire est un outil puissant pour modéliser la relation entre une variable dépendante scalaire (Y) et une ou plusieurs variables indépendantes (X) sous la forme d'une équation linéaire.

Pour commencer, sélectionnons un ensemble de données approprié pour notre prédiction. R fournit de nombreux ensembles de données intégrés, accessibles en tapant data() et en explorant les options disponibles. Pour ce didacticiel, nous utiliserons l'ensemble de données "femmes", qui contient les valeurs moyennes de taille et de poids des femmes américaines. Nous pouvons examiner le jeu de données en tapant View(women) et observer sa structure avec 15 lignes et 2 colonnes : taille et poids.

Notre objectif est de prédire le poids d'une femme en fonction de sa taille. Pour ce faire, nous utiliserons le modèle linéaire. Nous commençons par créer une variable appelée "linear_model" et lui attribuons le résultat de la fonction lm(). Cette fonction nécessite la spécification de la variable dépendante (Y) et de la variable indépendante (X). Dans ce cas, le poids sera la variable dépendante (Y) et la taille sera la variable indépendante (X), comme indiqué par la syntaxe poids ~ hauteur. De plus, nous devons spécifier l'ensemble de données à l'aide du paramètre de données, que nous définissons comme "femmes".

Après avoir défini notre modèle linéaire, nous pouvons examiner ses coefficients. Ces coefficients correspondent à la pente (M) et à l'ordonnée à l'origine (B) dans l'équation Y = MX + B. Dans notre cas, les coefficients sont -87,52 et 3,45, respectivement. Ainsi, notre poids prédit (Y) peut être calculé en multipliant la hauteur (X) par la pente (3,45) et en ajoutant l'ordonnée à l'origine (-87,52).

Pour tester notre prédiction, utilisons une valeur de hauteur de 59 pouces. En multipliant cela par la pente (3,45) et en ajoutant l'ordonnée à l'origine (-87,52), nous obtenons un poids prédit de 116,03, ce qui est proche de la valeur attendue de 117.

Maintenant, visualisons les données et la ligne de régression linéaire. Nous pouvons tracer l'ensemble de données à l'aide de la fonction plot(), en spécifiant les valeurs Y et X, et l'ensemble de données comme paramètre de données. En appelant la fonction abline() avec notre modèle linéaire, nous pouvons superposer la droite de régression sur le tracé.

En conclusion, nous avons exploré le processus de réalisation de prédictions à l'aide du modèle de régression linéaire dans R. Il est important de noter que l'ensemble de données utilisé dans ce didacticiel est relativement petit, composé de seulement 15 lignes. Dans les scénarios du monde réel, des ensembles de données plus volumineux sont généralement utilisés pour des prévisions plus précises. Néanmoins, la démonstration permet de comprendre le processus de régression linéaire.

Merci d'avoir regardé ce tutoriel vidéo. Si vous avez des questions, n'hésitez pas à les laisser dans la section des commentaires. Restez à l'écoute pour la prochaine vidéo!

Linear Regression R Program Make Predictions
Linear Regression R Program Make Predictions
  • 2017.05.11
  • www.youtube.com
Use Linear regression Model on R program data set to make predictions.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutori...
 

Comment installer les packages R


Comment installer les packages R

Bonjour à tous et bienvenue sur cette vidéo. Aujourd'hui, je souhaite discuter du processus d'installation de packages dans R.

En particulier, je montrerai comment installer le package ggplot2, qui est largement utilisé pour la visualisation de données. Pour commencer, j'ai remarqué que le package ggplot2 n'est actuellement pas disponible dans ma bibliothèque. Lorsque j'essaie de l'importer à l'aide de la bibliothèque (ggplot2), un message d'erreur apparaît indiquant qu'il n'y a pas de package appelé ggplot2.

Pour résoudre ce problème, je dois installer le package ggplot2. Heureusement, l'installation de packages dans R est simple. Nous pouvons utiliser la fonction install.packages() suivie du nom du package entre guillemets. Dans ce cas, je vais exécuter la commande install.packages("ggplot2") et appuyer sur Entrée.

Le processus d'installation commence et R commence à télécharger les fichiers et les données nécessaires pour le package ggplot2 à partir du Comprehensive R Archive Network (CRAN). Il est important d'avoir une connexion internet durant cette étape.

Le package ggplot2 est réputé pour sa capacité à créer des graphiques visuellement attrayants et personnalisables. Il exploite la grammaire des graphiques pour construire des tracés en couches, offrant une grande flexibilité dans la visualisation des données.

Une fois l'installation terminée, nous pouvons procéder au chargement du package ggplot2 dans notre environnement. Pour ce faire, nous utilisons la fonction library() et passons "ggplot2" comme argument. Lors de l'exécution de la bibliothèque (ggplot2), nous ne rencontrons plus le message d'erreur précédent, indiquant que le package a été installé et chargé avec succès.

Merci d'avoir regardé ce didacticiel vidéo sur l'installation de packages dans R. Si vous avez des questions, n'hésitez pas à les laisser dans la section des commentaires. N'oubliez pas d'aimer cette vidéo, de vous abonner à la chaîne pour plus de contenu et de rester à l'écoute pour la prochaine leçon vidéo.

How To Install R Packages
How To Install R Packages
  • 2017.05.11
  • www.youtube.com
Install R packages using instal.packages("[package_name_here]") commandPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Couleur du graphique à barres du programme R


Couleur du graphique à barres du programme R

Bonjour à tous et bienvenue dans ce didacticiel vidéo sur le langage de programmation R. Dans cette session, nous utiliserons RStudio pour créer un graphique à barres visuellement attrayant en utilisant le langage de programmation R.

Pour commencer, ouvrons RStudio et configurons notre environnement. Nous avons déjà un objectif précis en tête, qui est de créer un graphique à barres. Mais cette fois, nous allons nous concentrer sur le rendre plus esthétique.

Maintenant, définissons un vecteur appelé "voitures" avec sept valeurs. Nous pouvons y parvenir en créant une variable nommée "voitures" et en lui attribuant un vecteur contenant sept éléments. Utilisons les valeurs 3, 5, 8, 6, 11, 12 et 4.

Ensuite, nous utiliserons la fonction "barplot()", comme nous l'avons fait auparavant, pour créer le graphique à barres. Cependant, cette fois, nous allons ajouter quelques paramètres supplémentaires pour améliorer l'apparence du graphique.

Tout d'abord, ajoutons un titre au graphique. Nous allons utiliser le paramètre "principal" et le définir sur "Voitures" pour donner à notre graphique à barres un titre descriptif.

De plus, nous voulons étiqueter l'axe des ordonnées, indiquant que les valeurs représentent le poids des voitures. Nous pouvons accomplir cela en spécifiant le paramètre "ylab" et en le réglant sur "Weight".

De plus, nous devons étiqueter l'axe des x pour indiquer que chaque barre représente un type de voiture différent. Nous allons utiliser le paramètre "xlab" et le définir sur "Type".

Enfin, pour ajouter un attrait visuel, utilisons différentes couleurs pour les barres. Nous allons définir le paramètre "col" sur "rainbow(7)" pour créer un arc-en-ciel de sept couleurs distinctes.

Une fois que nous avons exécuté le code, le graphique à barres apparaîtra sur le côté droit de l'écran. Il s'intitulera "Voitures" et affichera les valeurs de poids sur l'axe des ordonnées et les différents types de voitures sur l'axe des abscisses. Les barres elles-mêmes seront colorées à l'aide d'une palette arc-en-ciel vibrante.

J'espère que vous avez trouvé ce didacticiel vidéo utile et agréable. Si vous avez des questions, n'hésitez pas à les poser. N'oubliez pas de laisser vos commentaires ci-dessous, et je ferai de mon mieux pour y répondre. Restez à l'écoute pour des tutoriels plus passionnants dans la prochaine vidéo.

R Program Bar Chart Color
R Program Bar Chart Color
  • 2017.05.13
  • www.youtube.com
Create a Bar chart with color, title, and labels in the R programming language.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programmi...
 

Exemple d'histogramme de programmation R


Exemple d'histogramme de programmation R

Bonjour à tous et bienvenue dans ce tutoriel sur le langage de programmation R. Dans cette vidéo, nous allons explorer comment créer un histogramme simple à l'aide de R. Allons-y !

Pour commencer, nous allons définir un vecteur appelé "suv's" avec sept éléments. Nous pouvons y parvenir en créant une variable nommée "suv's" et en lui attribuant un vecteur contenant les valeurs 5, 5, 5, 5, 8, 8, 19, 45 et 100.

Maintenant que nous avons configuré le vecteur de notre suv, nous pouvons procéder à la création d'un histogramme. Cela peut être fait en utilisant la fonction "hist()". Nous allons passer le vecteur "suv" comme paramètre à la fonction.

Lors de l'exécution du code, un histogramme s'affichera sur le côté droit de l'écran. L'axe des y représente la fréquence, tandis que l'axe des x représente la plage de valeurs. Dans ce cas, nous pouvons observer que la plage de 0 à 20 a une fréquence de 5, indiquant qu'il y a cinq occurrences de valeurs dans cette plage. De même, les plages de 40 à 60 et de 80 à 100 ont des fréquences de 3 et 1, respectivement.

J'espère que vous avez trouvé ce didacticiel vidéo instructif et simple. La création d'un histogramme à l'aide de R est un moyen utile de visualiser la distribution des données. Si vous avez des questions ou des commentaires, n'hésitez pas à les laisser ci-dessous. Restez à l'écoute pour des tutoriels plus passionnants dans la prochaine vidéo.

R Programming Histogram Example
R Programming Histogram Example
  • 2017.05.13
  • www.youtube.com
Simple Histogram program in RPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-programming-fo...
 

Sous-ensemble de programmation R


Sous-ensemble de programmation R

Salut les gars, et bienvenue dans cette vidéo sur le langage de programmation R. Dans ce didacticiel, nous allons explorer le sous-ensemble, qui consiste à extraire un sous-ensemble spécifique de données. Commençons!

Supposons que nous ayons un vecteur appelé "X" contenant les valeurs 12, 13, 56, 4, 5 et 89. Nous imprimerons ce vecteur sur la console pour vérifier son contenu.

Maintenant, disons que nous voulons extraire un sous-ensemble de données où les valeurs sont supérieures à 10. Nous pouvons y parvenir en utilisant l'expression "X > 10". Cela nous donnera un sous-ensemble de données où toutes les valeurs sont supérieures à 10.

Ensuite, supposons que nous voulions changer ces valeurs sélectionnées en 4. Nous pouvons simplement attribuer la valeur 4 au sous-ensemble que nous avons obtenu précédemment en utilisant l'expression "X[X > 10] <- 4". Cela remplacera toutes les valeurs supérieures à 10 dans "X" par 4.

En imprimant le "X" modifié, nous pouvons observer que les valeurs supérieures à 10 ont bien été changées en 4.

Maintenant, travaillons avec quelques données externes. Nous avons un fichier CSV situé sur le bureau et nous voulons le lire dans un bloc de données appelé "ensemble de données". À l'aide de la fonction "read.csv()", nous spécifions le chemin et le nom du fichier pour importer les données CSV. En imprimant le "jeu de données", nous pouvons voir les dimensions (153 lignes et 6 colonnes) et identifier les valeurs manquantes étiquetées "NA".

Passons à autre chose, explorons diverses manipulations avec ces données. Nous pouvons extraire les deux premières lignes du jeu de données en utilisant la fonction "head()", en spécifiant "dataset" et le nombre de lignes que nous voulons (2). Alternativement, nous pouvons utiliser l'indexation par lignes et colonnes avec "dataset[1:2, ]" ou "dataset[c(1, 2), ]". Toutes ces méthodes fournissent le même résultat de récupération des deux premières lignes.

Pour déterminer le nombre de lignes dans l'ensemble de données, nous pouvons utiliser la fonction "nrow ()" et passer le "ensemble de données" en argument. Cela nous donne le nombre de lignes, qui est de 153.

Supposons que nous voulions extraire les deux dernières lignes du jeu de données. Nous pouvons accomplir cela en utilisant la fonction "tail()" avec "dataset" et en spécifiant le nombre de lignes (2). Les deux dernières lignes sont renvoyées.

Maintenant, trouvons la valeur de la colonne "ozone" dans la 47e ligne. Nous pouvons y accéder directement en utilisant l'indexation, comme "dataset[47, 'ozone']" ou "dataset[47, 1]". Cela récupère la valeur 21.

Alternativement, nous pouvons utiliser le nom de la colonne au lieu de l'index de la colonne. Par exemple, "dataset[47, 'ozone']" renverra également 21.

Supposons que nous voulions trouver des valeurs manquantes dans la colonne "ozone". Nous pouvons créer un sous-ensemble de l'ensemble de données à l'aide de la fonction "subset()". Le sous-ensemble sera composé de lignes où la colonne "ozone" a des valeurs "NA". En imprimant le sous-ensemble, nous pouvons voir que la colonne "ozone" ne contient que des valeurs "NA".

Pour déterminer le nombre de valeurs manquantes dans la colonne "ozone", nous pouvons utiliser la fonction "nrow()" sur le sous-ensemble, ce qui nous donne la réponse 37.

Dans le cas où nous voulons supprimer les valeurs manquantes de l'ensemble de données, nous pouvons utiliser la fonction "na.omit()" et passer le "ensemble de données" comme argument. Cela renvoie un ensemble de données dont les valeurs manquantes ont été supprimées.

Une autre façon d'y parvenir est d'utiliser la fonction "complete.cases()" avec "dataset" comme argument. Il fournit le même résultat de suppression des lignes avec des valeurs "NA".

Passons maintenant à la recherche de la valeur maximale de la colonne "ozone" au mois de mai. Nous pouvons créer un sous-ensemble de l'ensemble de données à l'aide de la fonction "subset()". Au sein de la fonction de sous-ensemble, nous spécifions les conditions : le mois doit être égal à 5 (représentant mai) et la colonne "ozone" ne doit pas contenir de valeurs manquantes. En imprimant le sous-ensemble, nous pouvons voir les données filtrées.

Pour obtenir la valeur maximale de ce sous-ensemble sans l'inspecter visuellement, nous pouvons utiliser la fonction "apply()". En appliquant la fonction "max()" aux colonnes du sous-ensemble, on récupère la valeur maximale. Dans ce cas, nous l'appliquons à la colonne "ozone". La valeur maximale d'ozone en mai est de 115.

En conclusion, nous avons couvert diverses techniques de sous-ensembles dans R, notamment l'extraction de sous-ensembles en fonction de conditions, l'accès à des éléments spécifiques à l'aide de l'indexation, la gestion des valeurs manquantes et la réalisation de calculs sur des sous-ensembles. J'espère que vous avez trouvé ce tutoriel utile. Si vous avez des questions ou des commentaires, n'hésitez pas à les laisser ci-dessous. N'oubliez pas de vous abonner pour plus de tutoriels de programmation R. Merci d'avoir regardé, et je vous verrai dans la prochaine vidéo !

R Programming Subset
R Programming Subset
  • 2017.05.30
  • www.youtube.com
Get subsets of matrices and data framesPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-prog...
 

Sous-ensemble de programme R2


Sous-ensemble de programme R2

Hé les gars, bienvenue dans cette vidéo sur le langage de programmation R. Dans ce didacticiel, nous allons trouver la moyenne de la longueur des sépales pour l'espèce 'virginica' dans l'ensemble de données 'iris'. Commençons par explorer les ensembles de données prédéfinis dans R. Pour afficher les ensembles de données disponibles, nous utilisons la fonction 'data()' sans aucun argument. Cela affiche une liste d'ensembles de données fournis dans R. Pour notre analyse, nous travaillerons avec l'ensemble de données "iris".

Chargeons le jeu de données 'iris' en tapant 'data(iris)'. Cela charge l'ensemble de données complet, qui se compose de 150 lignes et de cinq colonnes : longueur des sépales, largeur des sépales, longueur des pétales, largeur des pétales et espèce. Pour extraire un sous-ensemble contenant uniquement l'espèce 'virginica', nous créons une nouvelle variable appelée 'iris_subset'. En utilisant l'opération de sous-ensemble, nous spécifions que nous voulons toutes les lignes où l'espèce est égale à 'virginica'. Puisque nous voulons également toutes les colonnes, nous omettons la spécification de la colonne.

En imprimant le 'iris_subset', nous pouvons observer que nous avons maintenant un sous-ensemble de l'ensemble de données 'iris' contenant uniquement l'espèce 'virginica'. Ensuite, nous nous intéressons au calcul de la moyenne de la longueur des sépales pour ce sous-ensemble. Pour nous concentrer sur la colonne de longueur des sépales, nous modifions le 'iris_subset' pour inclure uniquement la colonne de longueur des sépales.

Maintenant, convertissons le 'iris_subset' en une matrice. Nous attribuons la matrice convertie à une nouvelle variable appelée 'iris_subset_matrix' en utilisant la fonction 'as.matrix()'. En le convertissant en matrice, nous pouvons appliquer des opérations mathématiques sur des colonnes spécifiques. Le 'iris_subset_matrix' ressemble au sous-ensemble d'origine mais est maintenant un objet matrice.

Pour calculer la moyenne de la longueur des sépales, nous utilisons la fonction 'mean()' sur la colonne de longueur des sépales de 'iris_subset_matrix'. Cela nous donne une valeur moyenne de 6,588 pour la longueur des sépales de l'espèce 'virginica'.

Il convient de mentionner qu'il existe d'autres moyens d'effectuer des sous-ensembles à l'aide de la fonction 'subset()'. Cependant, dans ce didacticiel, nous avons démontré une approche alternative pour manipuler les données dans R en extrayant des sous-ensembles, en les convertissant en matrices et en effectuant des calculs. Ces techniques offrent une flexibilité dans l'analyse des données.

Merci d'avoir regardé! Si vous avez des questions ou des commentaires, veuillez les laisser ci-dessous. N'oubliez pas d'aimer la vidéo et de vous abonner à notre chaîne pour plus de tutoriels de programmation R. Restez à l'écoute pour la prochaine vidéo!

R Program Subset2
R Program Subset2
  • 2017.06.07
  • www.youtube.com
Get the mean of Sepal.Length for species virginica in the iris dataset.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Lecture de la programmation JSON R


Lecture de la programmation JSON R

Hé les gars, bienvenue dans ce tutoriel sur le langage de programmation R. Dans cette vidéo, nous verrons comment extraire des informations de JSON (JavaScript Object Notation). Pour le démontrer, j'ai l'API GitHub en arrière-plan, qui affiche des informations sur tous mes référentiels. Vous pouvez voir mon nom d'utilisateur GitHub en surbrillance, ainsi qu'une liste de référentiels, y compris "awesome-tensorflow" que j'ai dérivé d'un autre référentiel.

Pour extraire et travailler avec ces données, nous utiliserons la bibliothèque 'jsonlite' dans R. Commençons par récupérer les données du JSON. Nous allons créer une variable appelée 'json_data' et utiliser la fonction 'fromJSON()' pour récupérer les données d'une URL spécifique. Je vais copier l'URL de l'API GitHub et la transmettre comme argument à la fonction 'fromJSON()'.

Lors de l'exécution de ce code, nous obtenons une trame de données. Pour confirmer la classe de 'json_data', nous utilisons la fonction 'class()', qui révèle qu'il s'agit bien d'une trame de données.

Explorons maintenant le contenu de la variable 'json_data'. Nous pouvons utiliser la fonction 'names()' pour récupérer les noms des attributs dans la trame de données. En tapant 'names(json_data)', on obtient une liste d'attributs, dont 'name', qui représente le nom de chaque dépôt.

Pour extraire les noms de tous mes dépôts, nous pouvons accéder directement à l'attribut 'name' en utilisant la syntaxe 'json_data$name'. Cela révèle les noms de tous mes dépôts, totalisant environ 30.

Considérons ensuite le scénario de conversion d'une trame de données, telle que l'ensemble de données "iris", au format JavaScript Object Notation (JSON). Pour ce faire, nous pouvons utiliser la fonction 'toJSON()'. Par exemple, créons une variable appelée 'my_json' et appliquons la fonction 'toJSON()' au jeu de données 'iris'. De plus, nous pouvons inclure le paramètre 'pretty' pour nous assurer que le JSON résultant est formaté de manière visuellement agréable.

En imprimant 'my_json', nous pouvons observer que le JSON est soigneusement formaté avec une indentation appropriée. Il affiche les attributs 'longueur des sépales', 'largeur des sépales', 'longueur des pétales', 'largeur des pétales' et 'espèce' ainsi que leurs valeurs correspondantes, telles que '6.3', '4.8', '1.8' et ' virginie'.

Si nous supprimons le paramètre 'pretty' et générons à nouveau le JSON, il devient moins lisible et est tronqué en raison de sa longueur. Ainsi, l'utilisation du paramètre 'pretty' est recommandée pour une meilleure visualisation.

Voyons maintenant comment reconvertir le JSON en une trame de données. Pour ce faire, nous pouvons utiliser la fonction 'fromJSON()' et fournir la variable 'my_json' comme paramètre. L'exécution de ce code renvoie la trame de données d'origine, inversant ainsi le processus de conversion.

Merci d'avoir regardé! Si vous avez des commentaires ou des questions, n'hésitez pas à les laisser ci-dessous. Vos commentaires sont très appréciés. N'oubliez pas de vous abonner à notre chaîne pour plus de tutoriels de programmation R. Restez à l'écoute pour la prochaine vidéo!

Reading JSON R Programming
Reading JSON R Programming
  • 2017.06.20
  • www.youtube.com
Read in Javascript Object Notation (JSON) from git API using the R Programming Language.Git API: https://api.github.com/users/randerson112358/reposGet the co...
 

Lire le fichier CSV dans R


Lire le fichier CSV dans R

Salut les gars, bienvenue dans ce tutoriel vidéo sur le langage de programmation R. Dans ce didacticiel, je vais vous montrer comment ouvrir un fichier CSV à l'aide de R. Pour commencer, j'ai déjà ouvert la documentation d'aide R sur le côté droit de l'écran. Nous pouvons voir qu'il existe une fonction appelée 'read.csv()' que nous pouvons utiliser pour cette tâche. Par défaut, cette fonction suppose que le fichier a des en-têtes et que les valeurs sont séparées par des virgules.

Créons une variable appelée 'my_data' pour stocker les données du fichier CSV. Nous utiliserons la fonction 'read.csv()' pour lire le fichier. Nous pouvons spécifier le chemin du fichier comme argument de la fonction. Pour obtenir le chemin du fichier, j'ai un fichier CSV contenant les données de la maison, que j'ai obtenu sur le site Web de Kaggle. Je clique avec le bouton droit sur le fichier, je vais dans "Propriétés" et je copie l'emplacement du fichier. De retour à RStudio, je vais coller le chemin du fichier entre guillemets.

Maintenant, nous devons inclure le nom du fichier dans le chemin du fichier. Je vais ajouter une barre oblique après le chemin du fichier et coller le nom du fichier. Il est important de noter que puisque j'utilise une machine Windows, le chemin du fichier contient des barres obliques inverses. Cependant, R nécessite des barres obliques ou des barres obliques inversées échappées. Si nous exécutons le code maintenant, nous rencontrerons une erreur due aux barres obliques inverses. Pour résoudre ce problème, nous inverserons manuellement les barres obliques.

Appuyons sur ENTER pour exécuter le code. En conséquence, nous obtenons un bloc de données nommé 'my_data' avec 1 460 observations ou lignes et 81 caractéristiques ou colonnes. Nous pouvons le confirmer en utilisant les fonctions 'nrow()' et 'ncol()' avec 'my_data'.

Pour examiner les données, nous pouvons soit double-cliquer sur la variable 'my_data' dans le volet Environnement, soit utiliser la commande 'my_data' dans la console. Cependant, l'affichage de l'ensemble du bloc de données dans la console peut ne pas être très lisible. Par conséquent, je recommande de double-cliquer sur 'my_data' pour afficher un tableau bien formaté.

C'est tout pour ce tutoriel, les gars! Merci d'avoir regardé. J'espère que vous l'avez trouvé utile. Si vous avez des questions ou des commentaires, n'hésitez pas à les laisser ci-dessous. N'oubliez pas de vous abonner à notre chaîne pour plus de tutoriels de programmation R. Restez à l'écoute pour la prochaine vidéo!

Read CSV File In R
Read CSV File In R
  • 2017.07.08
  • www.youtube.com
Read a .CSV file in R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-p...
 

Régression linéaire multiple dans R


Régression linéaire multiple dans R

Hé les gars, bienvenue dans cette vidéo sur le langage de programmation R. Aujourd'hui, je veux discuter de la régression linéaire multiple et montrer comment l'implémenter dans RStudio. Pour commencer, nous avons besoin d'un ensemble de données pour l'analyse. J'ai déjà un fichier CSV appelé "real_estate.csv", que j'ai obtenu en ligne. Vous pouvez trouver le lien pour télécharger cet ensemble de données dans la description ci-dessous.

Commençons par créer une variable appelée 'my_data' et utilisons la fonction 'read.csv()' pour lire le fichier CSV dans RStudio. Nous devons spécifier l'emplacement et le nom du fichier. Pour obtenir l'emplacement, je clique avec le bouton droit sur le fichier et je clique sur "Propriétés" pour copier l'emplacement du fichier. Après avoir collé l'emplacement, je le mettrai entre guillemets. De plus, j'inclurai le nom du fichier après une barre oblique et m'assurerai d'inverser les barres obliques pour correspondre au format requis pour les machines Windows. L'exécution de ce code crée le bloc de données 'my_data', qui contient 781 lignes et 8 colonnes.

Examinons maintenant de plus près le bloc de données. Nous avons plusieurs colonnes, y compris « MLS » (numéro de service d'annonces multiples), « Emplacement », « Prix », « Chambres », « Salle de bains », « Taille » (taille de la maison en pieds carrés), « Prix/pied carré », et 'Statut' (type de vente). Afin de démontrer la régression linéaire multiple, nous ne travaillerons qu'avec des colonnes numériques et exclurons "Emplacement" et "Statut".

Pour créer un nouvel ensemble de données, j'attribuerai "my_data" à une nouvelle variable appelée "my_data2" et sélectionnerai les colonnes 1, 3, 4, 5, 6 et 7. Ce nouvel ensemble de données contient 781 lignes et 6 colonnes.

Passons maintenant à la création de notre modèle linéaire. Je vais créer une variable appelée 'lin_mod' et la définir égale à la fonction 'lm()', qui signifie modèle linéaire. Nous souhaitons prédire le "Prix" en fonction de caractéristiques telles que "MLS", "Chambres", "Salle de bain", "Taille" et "Prix/pied carré". En spécifiant 'Prix' comme variable dépendante et en incluant les autres caractéristiques, nous pouvons construire notre modèle linéaire en utilisant l'ensemble de données 'my_data2'.

Pour obtenir un résumé de notre modèle linéaire, j'utiliserai la fonction 'summary()' sur 'lin_mod.' Le résumé fournit des informations sur les résidus, les coefficients et les valeurs de p. La signification des variables peut être déterminée visuellement à l'aide d'étoiles, où trois étoiles indiquent une signification élevée.

Maintenant que nous avons notre modèle linéaire, essayons de faire une prédiction. Je vais créer une variable appelée "prix" et la définir égale au coefficient d'interception moins 7,34, plus les coefficients des variables multipliés par leurs valeurs respectives à partir de la dernière ligne du tableau. Par exemple, nous allons multiplier la valeur 'MLS' par son coefficient et l'ajouter à l'équation. De même, nous inclurons "Chambres", "Salle de bains", "Taille" et "Prix/pied carré" dans l'équation de prédiction.

Imprimons le prix prévu et comparons-le au prix réel de la dernière ligne de l'ensemble de données. Le prix prévu devrait être d'environ 1 100 000 $. Après avoir exécuté le code, nous obtenons un prix prévu de 1 023 000 $, soit environ 77 000 $ de moins que le prix réel. Bien que la différence soit importante, ce n'est peut-être pas une préoccupation majeure pour les acheteurs qui envisagent une maison d'un million de dollars.

J'espère que vous avez trouvé cette vidéo instructive et agréable. Si vous avez des questions ou des commentaires, veuillez les laisser ci-dessous. N'oubliez pas d'aimer cette vidéo et de rester à l'écoute pour plus de tutoriels. Merci d'avoir regardé, et je vous verrai dans le prochain.

Multiple Linear Regression In R
Multiple Linear Regression In R
  • 2017.07.10
  • www.youtube.com
Multiple Linear Regression In R prediction.Get the Code: https://github.com/randerson112358/R-Programs/blob/master/MultLinReg.RGet the Dataset:https://wiki.c...