Tutoriais de programação - página 8

 

Gráfico de Barras do Programa R


Gráfico de Barras do Programa R

Olá a todos, sejam bem-vindos a mais uma videoaula sobre a linguagem de programação R. No tutorial de hoje, aprenderemos como criar um gráfico de barras simples usando R.

Para começar, vamos definir um vetor chamado "carros" com seis valores. Podemos fazer isso criando uma variável chamada "cars" e atribuindo a ela os valores 2, 4, 7, 5, 10 e 12. Esse vetor representa os pontos de dados que queremos visualizar em nosso gráfico de barras.

Agora, vamos criar o gráfico de barras real. Utilizaremos a função "barplot()", que é projetada especificamente para criar gráficos de barras em R. Como parâmetro de entrada, passamos o vetor "cars" para a função.

Ao executarmos o código, um gráfico de barras será gerado no lado direito da tela, exibindo os seis valores do nosso vetor "carros" como barras individuais.

Espero que você tenha achado este breve tutorial em vídeo sobre como criar um gráfico de barras simples na linguagem de programação R útil e informativo. Se você tiver alguma dúvida, sinta-se à vontade para deixá-la na seção de comentários. Fique ligado no próximo vídeo, onde vamos nos aprofundar em tópicos mais interessantes.

R Program Bar Graph
R Program Bar Graph
  • 2017.05.13
  • www.youtube.com
Create a simple bar graph using the R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://w...
 

Programa R de regressão linear faz previsões


Programa R de regressão linear faz previsões

Olá a todos, sejam bem-vindos a este tutorial em vídeo sobre a linguagem de programação R.

Neste tutorial, vamos nos aprofundar na análise de dados e nos concentrar em fazer previsões usando o modelo de regressão linear. A regressão linear é uma ferramenta poderosa para modelar a relação entre uma variável dependente escalar (Y) e uma ou mais variáveis independentes (X) na forma de uma equação de linha reta.

Para começar, vamos selecionar um conjunto de dados adequado para nossa previsão. R fornece vários conjuntos de dados integrados, que podem ser acessados digitando data() e explorando as opções disponíveis. Para este tutorial, usaremos o conjunto de dados "women", que contém valores médios de altura e peso para mulheres americanas. Podemos examinar o dataset digitando View(women) e observar sua estrutura com 15 linhas e 2 colunas: altura e peso.

Nosso objetivo é prever o peso de uma mulher com base em sua altura. Para isso, utilizaremos o modelo linear. Começamos criando uma variável chamada "linear_model" e atribuindo a ela o resultado da função lm(). Esta função requer a especificação da variável dependente (Y) e da variável independente (X). Nesse caso, o peso será a variável dependente (Y) e a altura será a variável independente (X), conforme indicado pela sintaxe peso ~ altura. Além disso, precisamos especificar o conjunto de dados usando o parâmetro de dados, que definimos como "mulheres".

Tendo definido nosso modelo linear, podemos examinar seus coeficientes. Esses coeficientes correspondem à inclinação (M) e ao intercepto (B) na equação Y = MX + B. No nosso caso, os coeficientes são -87,52 e 3,45, respectivamente. Assim, nosso peso previsto (Y) pode ser calculado multiplicando a altura (X) pela inclinação (3,45) e somando o intercepto (-87,52).

Para testar nossa previsão, vamos usar um valor de altura de 59 polegadas. Multiplicando isso pela inclinação (3,45) e adicionando o intercepto (-87,52), obtemos um peso previsto de 116,03, próximo ao valor esperado de 117.

Agora, vamos visualizar os dados e a linha de regressão linear. Podemos plotar o conjunto de dados usando a função plot(), especificando os valores Y e X e o conjunto de dados como o parâmetro de dados. Ao chamar a função abline() com nosso modelo linear, podemos sobrepor a linha de regressão no gráfico.

Concluindo, exploramos o processo de fazer previsões usando o modelo de regressão linear em R. É importante observar que o conjunto de dados usado neste tutorial é relativamente pequeno, consistindo em apenas 15 linhas. Em cenários do mundo real, conjuntos de dados maiores são normalmente empregados para previsões mais precisas. No entanto, a demonstração fornece uma compreensão do processo de regressão linear.

Obrigado por assistir a este tutorial em vídeo. Se você tiver alguma dúvida, sinta-se à vontade para deixá-la na seção de comentários. Fique ligado no próximo vídeo!

Linear Regression R Program Make Predictions
Linear Regression R Program Make Predictions
  • 2017.05.11
  • www.youtube.com
Use Linear regression Model on R program data set to make predictions.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutori...
 

Como instalar pacotes R


Como instalar pacotes R

Olá a todos, sejam bem-vindos a este vídeo. Hoje, quero discutir o processo de instalação de pacotes no R.

Em particular, demonstrarei como instalar o pacote ggplot2, que é amplamente utilizado para visualização de dados. Para começar, notei que o pacote ggplot2 não está disponível em minha biblioteca. Quando tento importá-lo usando a biblioteca (ggplot2), aparece uma mensagem de erro informando que não há nenhum pacote chamado ggplot2.

Para resolver esse problema, preciso instalar o pacote ggplot2. Felizmente, a instalação de pacotes em R é simples. Podemos usar a função install.packages() seguida do nome do pacote entre aspas. Nesse caso, executarei o comando install.packages("ggplot2") e pressionarei Enter.

O processo de instalação começa e o R começa a baixar os arquivos e dados necessários para o pacote ggplot2 da Comprehensive R Archive Network (CRAN). É importante ter uma conexão com a internet durante esta etapa.

O pacote ggplot2 é conhecido por sua capacidade de criar gráficos visualmente atraentes e personalizáveis. Ele aproveita a gramática de gráficos para construir gráficos em camadas, proporcionando grande flexibilidade na visualização de dados.

Depois que a instalação estiver concluída, podemos carregar o pacote ggplot2 em nosso ambiente. Para fazer isso, usamos a função library() e passamos "ggplot2" como argumento. Ao executar library(ggplot2), não encontramos mais a mensagem de erro anterior, indicando que o pacote foi instalado e carregado com sucesso.

Obrigado por assistir a este tutorial em vídeo sobre a instalação de pacotes no R. Se você tiver alguma dúvida, sinta-se à vontade para deixá-la na seção de comentários. Não se esqueça de curtir este vídeo, se inscrever no canal para mais conteúdo e fique atento para a próxima vídeo-aula.

How To Install R Packages
How To Install R Packages
  • 2017.05.11
  • www.youtube.com
Install R packages using instal.packages("[package_name_here]") commandPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Cor do Gráfico de Barras do Programa R


Cor do Gráfico de Barras do Programa R

Olá a todos, sejam bem-vindos a este tutorial em vídeo sobre a linguagem de programação R. Nesta sessão, usaremos o RStudio para criar um gráfico de barras visualmente atraente usando a linguagem de programação R.

Para começar, vamos abrir o RStudio e configurar nosso ambiente. Já temos um objetivo específico em mente, que é criar um gráfico de barras. Mas desta vez, vamos nos concentrar em torná-lo mais esteticamente agradável.

Agora, vamos definir um vetor chamado "carros" com sete valores. Podemos conseguir isso criando uma variável chamada "cars" e atribuindo a ela um vetor que contém sete elementos. Vamos usar os valores 3, 5, 8, 6, 11, 12 e 4.

Em seguida, utilizaremos a função "barplot()", assim como fizemos antes, para criar o gráfico de barras. No entanto, desta vez, adicionaremos alguns parâmetros adicionais para aprimorar a aparência do gráfico.

Primeiro, vamos adicionar um título ao gráfico. Usaremos o parâmetro "principal" e o definiremos como "Carros" para dar um título descritivo ao nosso gráfico de barras.

Além disso, queremos rotular o eixo y, indicando que os valores representam o peso dos carros. Podemos fazer isso especificando o parâmetro "ylab" e definindo-o como "Peso".

Além disso, devemos rotular o eixo x para indicar que cada barra representa um tipo diferente de carro. Usaremos o parâmetro "xlab" e o definiremos como "Tipo".

Por último, para adicionar algum apelo visual, vamos usar cores diferentes para as barras. Vamos definir o parâmetro "col" como "rainbow(7)" para criar um arco-íris de sete cores distintas.

Depois de executar o código, o gráfico de barras aparecerá no lado direito da tela. Ele será intitulado "Carros" e exibirá os valores de peso no eixo y e os diferentes tipos de carros no eixo x. As próprias barras serão coloridas usando uma paleta vibrante de arco-íris.

Espero que você tenha achado este tutorial em vídeo útil e agradável. Se você tiver alguma dúvida, não hesite em perguntar. Lembre-se de deixar seus comentários abaixo e farei o possível para resolvê-los. Fique ligado para mais tutoriais emocionantes no próximo vídeo.

R Program Bar Chart Color
R Program Bar Chart Color
  • 2017.05.13
  • www.youtube.com
Create a Bar chart with color, title, and labels in the R programming language.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programmi...
 

R Exemplo de Histograma de Programação


R Exemplo de Histograma de Programação

Olá a todos, sejam bem-vindos a este tutorial sobre a linguagem de programação R. Neste vídeo, exploraremos como criar um histograma simples usando R. Vamos mergulhar de cabeça!

Para começar, vamos definir um vetor chamado "suv's" com sete elementos. Podemos conseguir isso criando uma variável chamada "suv's" e atribuindo a ela um vetor que contém os valores 5, 5, 5, 5, 8, 8, 19, 45 e 100.

Agora que temos o vetor do nosso suv configurado, podemos prosseguir para criar um histograma. Isso pode ser feito usando a função "hist()". Passaremos o vetor "suv's" como parâmetro para a função.

Ao executar o código, um histograma será exibido no lado direito da tela. O eixo y representa a frequência, enquanto o eixo x representa o intervalo de valores. Nesse caso, podemos observar que a faixa de 0 a 20 tem frequência 5, indicando que existem cinco ocorrências de valores dentro dessa faixa. Da mesma forma, as faixas de 40 a 60 e 80 a 100 têm frequências de 3 e 1, respectivamente.

Espero que você tenha achado este tutorial em vídeo informativo e direto. Criar um histograma usando R é uma maneira útil de visualizar a distribuição de dados. Se você tiver alguma dúvida ou comentário, sinta-se à vontade para deixá-los abaixo. Fique ligado para mais tutoriais emocionantes no próximo vídeo.

R Programming Histogram Example
R Programming Histogram Example
  • 2017.05.13
  • www.youtube.com
Simple Histogram program in RPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-programming-fo...
 

Subconjunto de Programação R


Subconjunto de Programação R

Olá pessoal, sejam bem-vindos a este vídeo sobre a linguagem de programação R. Neste tutorial, vamos explorar a criação de subconjuntos, que envolve a extração de um subconjunto específico de dados. Vamos começar!

Suponha que tenhamos um vetor chamado "X" contendo os valores 12, 13, 56, 4, 5 e 89. Imprimimos esse vetor no console para verificar seu conteúdo.

Agora, digamos que queremos extrair um subconjunto dos dados onde os valores são maiores que 10. Podemos conseguir isso usando a expressão "X > 10". Isso nos dará um subconjunto dos dados onde todos os valores são maiores que 10.

Em seguida, suponha que queremos alterar esses valores selecionados para 4. Podemos simplesmente atribuir o valor 4 ao subconjunto obtido anteriormente usando a expressão "X[X > 10] <- 4". Isso substituirá todos os valores maiores que 10 em "X" por 4.

Imprimindo o "X" modificado, podemos observar que os valores maiores que 10 foram realmente alterados para 4.

Agora, vamos trabalhar com alguns dados externos. Temos um arquivo CSV localizado na área de trabalho e queremos lê-lo em um quadro de dados chamado "conjunto de dados". Usando a função "read.csv()", especificamos o caminho e o nome do arquivo para importar os dados CSV. Imprimindo o "conjunto de dados", podemos ver as dimensões (153 linhas e 6 colunas) e identificar os valores ausentes rotulados como "NA".

Seguindo em frente, vamos explorar várias manipulações com esses dados. Podemos extrair as duas primeiras linhas do conjunto de dados usando a função "head()", especificando "dataset" e o número de linhas que queremos (2). Alternativamente, podemos usar a indexação por linhas e colunas com "dataset[1:2, ]" ou "dataset[c(1, 2), ]." Todos esses métodos fornecem o mesmo resultado de recuperação das duas primeiras linhas.

Para determinar o número de linhas no conjunto de dados, podemos usar a função "nrow()" e passar o "conjunto de dados" como argumento. Isso nos dá a contagem de linhas, que é 153.

Suponha que queremos extrair as duas últimas linhas do conjunto de dados. Podemos fazer isso usando a função "tail()" com "dataset" e especificando o número de linhas (2). As duas últimas linhas são retornadas.

Agora, vamos encontrar o valor da coluna "ozônio" na 47ª linha. Podemos acessá-lo diretamente usando indexação, como "conjunto de dados[47, 'ozônio']" ou "conjunto de dados[47, 1]". Isso recupera o valor 21.

Como alternativa, podemos usar o nome da coluna em vez do índice da coluna. Por exemplo, "dataset[47, 'ozone']" também retornará 21.

Suponha que queremos encontrar valores ausentes na coluna "ozônio". Podemos criar um subconjunto do conjunto de dados usando a função "subset()". O subconjunto consistirá em linhas onde a coluna "ozônio" possui valores "NA". Imprimindo o subconjunto, podemos ver que a coluna "ozônio" contém apenas valores "NA".

Para determinar a contagem de valores ausentes na coluna "ozônio", podemos usar a função "nrow()" no subconjunto, que nos dá a resposta como 37.

Caso desejemos remover valores ausentes do conjunto de dados, podemos usar a função "na.omit()" e passar o "conjunto de dados" como argumento. Isso retorna um conjunto de dados com valores ausentes removidos.

Outra maneira de conseguir isso é usando a função "complete.cases()" com "dataset" como argumento. Ele fornece o mesmo resultado de remoção de linhas com valores "NA".

Agora, vamos encontrar o valor máximo da coluna "ozônio" no mês de maio. Podemos criar um subconjunto do conjunto de dados usando a função "subset()". Dentro da função de subconjunto, especificamos as condições: o mês deve ser igual a 5 (representando maio) e a coluna "ozônio" não deve conter valores ausentes. Imprimindo o subconjunto, podemos ver os dados filtrados.

Para obter o valor máximo deste subconjunto sem inspecioná-lo visualmente, podemos usar a função "apply()". Aplicando a função "max()" às colunas do subconjunto, recuperamos o valor máximo. Neste caso, aplicamos na coluna "ozônio". O valor máximo de ozônio em maio é de 115.

Concluindo, abordamos várias técnicas de criação de subconjuntos em R, incluindo extração de subconjuntos com base em condições, acesso a elementos específicos usando indexação, tratamento de valores omissos e execução de cálculos em subconjuntos. Espero que você tenha achado este tutorial útil. Se você tiver alguma dúvida ou comentário, sinta-se à vontade para deixá-los abaixo. Não se esqueça de se inscrever para mais tutoriais de programação R. Obrigado por assistir, e vejo vocês no próximo vídeo!

R Programming Subset
R Programming Subset
  • 2017.05.30
  • www.youtube.com
Get subsets of matrices and data framesPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-prog...
 

R Programa Subconjunto2


R Programa Subconjunto2

Olá pessoal, sejam bem vindos a este vídeo sobre a linguagem de programação R. Neste tutorial, encontraremos a média do comprimento da sépala para a espécie 'virginica' no conjunto de dados 'iris'. Vamos começar explorando os conjuntos de dados predefinidos em R. Para visualizar os conjuntos de dados disponíveis, usamos a função 'data()' sem nenhum argumento. Isso exibe uma lista de conjuntos de dados fornecidos em R. Para nossa análise, trabalharemos com o conjunto de dados 'iris'.

Vamos carregar o conjunto de dados 'iris' digitando 'data(iris)'. Isso carrega todo o conjunto de dados, que consiste em 150 linhas e cinco colunas: comprimento da sépala, largura da sépala, comprimento da pétala, largura da pétala e espécie. Para extrair um subconjunto contendo apenas a espécie 'virginica', criamos uma nova variável chamada 'iris_subset'. Usando a operação de subconjunto, especificamos que queremos todas as linhas onde a espécie é igual a 'virginica'. Como também queremos todas as colunas, omitimos a especificação da coluna.

Imprimindo o 'iris_subset', podemos observar que agora temos um subconjunto do conjunto de dados 'iris' contendo apenas a espécie 'virginica'. Em seguida, estamos interessados em calcular a média do comprimento da sépala para este subconjunto. Para focar na coluna de comprimento da sépala, modificamos o 'iris_subset' para incluir apenas a coluna de comprimento da sépala.

Agora, vamos converter o 'iris_subset' em uma matriz. Atribuímos a matriz convertida a uma nova variável chamada 'iris_subset_matrix' usando a função 'as.matrix()'. Ao convertê-lo em uma matriz, podemos aplicar operações matemáticas em colunas específicas. O 'iris_subset_matrix' parece semelhante ao subconjunto original, mas agora é um objeto de matriz.

Para calcular a média do comprimento da sépala, usamos a função 'mean()' na coluna de comprimento da sépala da 'iris_subset_matrix'. Isso nos dá um valor médio de 6,588 para o comprimento da sépala da espécie 'virginica'.

Vale a pena mencionar que existem maneiras alternativas de realizar subconjuntos usando a função 'subset()'. No entanto, neste tutorial, demonstramos uma abordagem alternativa para manipular dados em R extraindo subconjuntos, convertendo-os em matrizes e realizando cálculos. Essas técnicas fornecem flexibilidade na análise de dados.

Obrigado por assistir! Se você tiver quaisquer perguntas ou comentários, por favor, deixe-os abaixo. Não se esqueça de curtir o vídeo e se inscrever em nosso canal para mais tutoriais de programação R. Fique ligado no próximo vídeo!

R Program Subset2
R Program Subset2
  • 2017.06.07
  • www.youtube.com
Get the mean of Sepal.Length for species virginica in the iris dataset.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Lendo Programação JSON R


Lendo Programação JSON R

Olá pessoal, sejam bem-vindos a este tutorial sobre a linguagem de programação R. Neste vídeo, discutiremos como extrair informações de JSON (JavaScript Object Notation). Para demonstrar isso, tenho a API do GitHub em segundo plano, que exibe informações sobre todos os meus repositórios. Você pode ver meu nome de usuário do GitHub destacado, junto com uma lista de repositórios, incluindo 'awesome-tensorflow' que eu extraí de outro repositório.

Para extrair e trabalhar com esses dados, usaremos a biblioteca 'jsonlite' do R. Vamos começar recuperando os dados do JSON. Criaremos uma variável chamada 'json_data' e usaremos a função 'fromJSON()' para buscar os dados de uma URL específica. Vou copiar o URL da API do GitHub e passá-lo como um argumento para a função 'fromJSON()'.

Ao executar este código, obtemos um quadro de dados. Para confirmar a classe de 'json_data', usamos a função 'class()', que revela que é de fato um quadro de dados.

Agora, vamos explorar o conteúdo da variável 'json_data'. Podemos usar a função 'names()' para recuperar os nomes dos atributos no quadro de dados. Ao digitar 'names(json_data)', obtemos uma lista de atributos, incluindo 'name', que representa o nome de cada repositório.

Para extrair os nomes de todos os meus repositórios, podemos acessar o atributo 'name' diretamente usando a sintaxe 'json_data$name'. Isso revela os nomes de todos os meus repositórios, totalizando cerca de 30.

Em seguida, vamos considerar o cenário de conversão de um quadro de dados, como o conjunto de dados 'iris', no formato JavaScript Object Notation (JSON). Para conseguir isso, podemos usar a função 'toJSON()'. Por exemplo, vamos criar uma variável chamada 'my_json' e aplicar a função 'toJSON()' ao conjunto de dados 'iris'. Além disso, podemos incluir o parâmetro 'pretty' para garantir que o JSON resultante seja formatado de maneira visualmente agradável.

Imprimindo 'my_json', podemos observar que o JSON está bem formatado com recuo adequado. Ele exibe os atributos 'comprimento da sépala', 'largura da sépala', 'comprimento da pétala', 'largura da pétala' e 'espécie' junto com seus valores correspondentes, como '6.3', '4.8', '1.8' e ' virginica'.

Se removermos o parâmetro 'pretty' e gerarmos o JSON novamente, ele se tornará menos legível e será truncado devido ao seu comprimento. Assim, o uso do parâmetro 'bonito' é recomendado para melhor visualização.

Agora, vamos explorar como converter o JSON de volta em um quadro de dados. Para conseguir isso, podemos usar a função 'fromJSON()' e fornecer a variável 'my_json' como parâmetro. A execução desse código retorna o quadro de dados original, revertendo efetivamente o processo de conversão.

Obrigado por assistir! Se você tiver quaisquer comentários ou perguntas, sinta-se à vontade para deixá-los abaixo. Seu feedback nos é de grande valia. Não se esqueça de se inscrever em nosso canal para mais tutoriais de programação R. Fique ligado no próximo vídeo!

Reading JSON R Programming
Reading JSON R Programming
  • 2017.06.20
  • www.youtube.com
Read in Javascript Object Notation (JSON) from git API using the R Programming Language.Git API: https://api.github.com/users/randerson112358/reposGet the co...
 

Ler arquivo CSV em R


Ler arquivo CSV em R

Olá pessoal, sejam bem-vindos a este vídeo tutorial sobre a linguagem de programação R. Neste tutorial, mostrarei como abrir um arquivo CSV usando R. Para começar, já abri a documentação de ajuda do R no lado direito da tela. Podemos ver que existe uma função chamada 'read.csv()' que podemos usar para esta tarefa. Por padrão, esta função assume que o arquivo possui cabeçalhos e os valores são separados por vírgulas.

Vamos criar uma variável chamada 'my_data' para armazenar os dados do arquivo CSV. Usaremos a função 'read.csv()' para ler o arquivo. Podemos especificar o caminho do arquivo como um argumento para a função. Para obter o caminho do arquivo, tenho um arquivo CSV contendo dados da casa, que obtive no site Kaggle. Vou clicar com o botão direito do mouse no arquivo, ir para 'Propriedades' e copiar o local do arquivo. Voltando ao RStudio, vou colar o caminho do arquivo entre as aspas.

Agora, precisamos incluir o nome do arquivo no caminho do arquivo. Adicionarei uma barra após o caminho do arquivo e colarei o nome do arquivo. É importante observar que, como estou usando uma máquina Windows, o caminho do arquivo contém barras invertidas. No entanto, R requer barras ou barras invertidas escapadas. Se executarmos o código agora, encontraremos um erro devido às barras invertidas. Para resolver isso, inverteremos manualmente as barras.

Vamos pressionar ENTER para executar o código. Como resultado, obtemos um quadro de dados chamado 'my_data' com 1.460 observações ou linhas e 81 feições ou colunas. Podemos confirmar isso usando as funções 'nrow()' e 'ncol()' com 'my_data'.

Para examinar os dados, podemos clicar duas vezes na variável 'my_data' no painel Environment ou usar o comando 'my_data' no console. No entanto, visualizar todo o quadro de dados no console pode não ser muito legível. Portanto, recomendo clicar duas vezes em 'my_data' para exibir uma tabela bem formatada.

É isso para este tutorial, pessoal! Obrigado por assistir. Espero que tenha achado útil. Se você tiver alguma dúvida ou comentário, sinta-se à vontade para deixá-los abaixo. Não se esqueça de se inscrever em nosso canal para mais tutoriais de programação R. Fique ligado no próximo vídeo!

Read CSV File In R
Read CSV File In R
  • 2017.07.08
  • www.youtube.com
Read a .CSV file in R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-p...
 

Regressão linear múltipla em R


Regressão linear múltipla em R

Olá pessoal, sejam bem vindos a este vídeo sobre a linguagem de programação R. Hoje, quero discutir a regressão linear múltipla e demonstrar como implementá-la no RStudio. Para começar, precisamos de um conjunto de dados para análise. Já tenho um arquivo CSV chamado 'real_estate.csv', que obtive online. Você pode encontrar o link para baixar este conjunto de dados na descrição abaixo.

Vamos começar criando uma variável chamada 'my_data' e usar a função 'read.csv()' para ler o arquivo CSV no RStudio. Precisamos especificar o local e o nome do arquivo. Para obter a localização, clicarei com o botão direito do mouse no arquivo e clicarei em 'Propriedades' para copiar a localização do arquivo. Depois de colar o local, vou colocá-lo entre aspas. Além disso, incluirei o nome do arquivo após uma barra e certifique-se de inverter as barras para corresponder ao formato necessário para máquinas Windows. A execução desse código cria o quadro de dados 'my_data', que contém 781 linhas e 8 colunas.

Agora, vamos dar uma olhada mais de perto no quadro de dados. Temos várias colunas, incluindo 'MLS' (número de serviço de listagem múltipla), 'Localização', 'Preço', 'Quartos', 'Banheiros', 'Tamanho' (tamanho da casa em pés quadrados), 'Preço/pés quadrados' e 'Status' (tipo de venda). Com o objetivo de demonstrar a regressão linear múltipla, trabalharemos apenas com colunas numéricas e excluiremos 'Localização' e 'Status'.

Para criar um novo conjunto de dados, atribuirei 'my_data' a uma nova variável chamada 'my_data2' e selecionarei as colunas 1, 3, 4, 5, 6 e 7. Esse novo conjunto de dados contém 781 linhas e 6 colunas.

Agora, vamos passar para a criação do nosso modelo linear. Vou criar uma variável chamada 'lin_mod' e defini-la igual à função 'lm()', que significa modelo linear. Queremos prever o 'Preço' com base em recursos como 'MLS', 'Quartos', 'Banheiros', 'Tamanho' e 'Preço/pé quadrado'. Especificando 'Price' como a variável dependente e incluindo os outros recursos, podemos construir nosso modelo linear usando o conjunto de dados 'my_data2'.

Para obter um resumo do nosso modelo linear, usarei a função 'summary()' em 'lin_mod.' O resumo fornece informações sobre os resíduos, coeficientes e valores-p. A significância das variáveis pode ser determinada visualmente usando estrelas, onde três estrelas indicam alta significância.

Agora que temos nosso modelo linear, vamos tentar fazer uma previsão. Vou criar uma variável chamada 'preço' e defini-la igual ao coeficiente de interceptação menos 7,34, mais os coeficientes das variáveis multiplicados por seus respectivos valores da última linha da tabela. Por exemplo, vamos multiplicar o valor 'MLS' por seu coeficiente e adicioná-lo à equação. Da mesma forma, incluiremos 'Quartos', 'Banheiros', 'Tamanho' e 'Preço/pé quadrado' na equação de previsão.

Vamos imprimir o preço previsto e compará-lo com o preço real da última linha do conjunto de dados. O preço previsto deve ficar em torno de US$ 1.100.000. Depois de executar o código, obtemos um preço previsto de US$ 1.023.000, aproximadamente US$ 77.000 abaixo do preço real. Embora a diferença seja significativa, pode não ser uma grande preocupação para os compradores que consideram uma casa de um milhão de dólares.

Espero que você tenha achado este vídeo informativo e agradável. Se você tiver quaisquer perguntas ou comentários, por favor, deixe-os abaixo. Não se esqueça de curtir este vídeo e ficar ligado para mais tutoriais. Obrigado por assistir, e vejo vocês no próximo.

Multiple Linear Regression In R
Multiple Linear Regression In R
  • 2017.07.10
  • www.youtube.com
Multiple Linear Regression In R prediction.Get the Code: https://github.com/randerson112358/R-Programs/blob/master/MultLinReg.RGet the Dataset:https://wiki.c...