프로그래밍 자습서 - 페이지 8

 

R 프로그램 막대 그래프


R 프로그램 막대 그래프

안녕하세요 여러분, R 프로그래밍 언어에 대한 또 다른 비디오 강의에 다시 오신 것을 환영합니다. 오늘 튜토리얼에서는 R을 이용하여 간단한 바 차트를 만드는 방법에 대해 알아보겠습니다.

시작하려면 6개의 값이 있는 "cars"라는 벡터를 정의해 보겠습니다. "cars"라는 변수를 만들고 값 2, 4, 7, 5, 10 및 12를 할당하여 이를 수행할 수 있습니다. 이 벡터는 막대 차트에서 시각화하려는 데이터 포인트를 나타냅니다.

이제 실제 막대 차트 만들기로 이동하겠습니다. R에서 막대 차트를 생성하기 위해 특별히 설계된 "barplot()" 함수를 활용할 것입니다. 입력 매개변수로 "cars" 벡터를 함수에 전달합니다.

코드를 실행하면 화면 오른쪽에 막대 그래프가 생성되어 "cars" 벡터의 6개 값을 개별 막대로 표시합니다.

R 프로그래밍 언어로 간단한 막대 차트를 만드는 방법에 대한 이 짧은 비디오 자습서가 유용하고 유익했기를 바랍니다. 질문이 있으시면 댓글 섹션에 자유롭게 남겨주세요. 더 흥미진진한 주제에 대해 알아볼 다음 동영상을 기대해 주세요.

R Program Bar Graph
R Program Bar Graph
  • 2017.05.13
  • www.youtube.com
Create a simple bar graph using the R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://w...
 

선형 회귀 R 프로그램 예측하기


선형 회귀 R 프로그램 예측하기

안녕하세요 여러분. R 프로그래밍 언어에 대한 이 비디오 자습서에 오신 것을 환영합니다.

이 자습서에서는 데이터 분석을 자세히 살펴보고 선형 회귀 모델을 사용하여 예측하는 데 중점을 둘 것입니다. 선형 회귀는 직선 방정식의 형태로 스칼라 종속 변수(Y)와 하나 이상의 독립 변수(X) 간의 관계를 모델링하기 위한 강력한 도구입니다.

시작하려면 예측에 적합한 데이터 세트를 선택하겠습니다. R은 data()를 입력하고 사용 가능한 옵션을 탐색하여 액세스할 수 있는 다양한 기본 제공 데이터 세트를 제공합니다. 이 자습서에서는 미국 여성의 평균 신장 및 체중 값이 포함된 "여성" 데이터 세트를 사용합니다. View(women)를 입력하여 데이터셋을 검사하고 15개의 행과 2개의 열(키와 몸무게)로 구성된 구조를 관찰할 수 있습니다.

우리의 목표는 키를 기준으로 여성의 체중을 예측하는 것입니다. 이를 달성하기 위해 선형 모델을 활용합니다. "linear_model"이라는 변수를 만들고 lm() 함수의 결과를 할당하는 것으로 시작합니다. 이 기능에는 종속 변수(Y)와 독립 변수(X)의 지정이 필요합니다. 이 경우 weight ~ height 구문으로 표시되는 것처럼 weight는 종속 변수(Y)가 되고 height는 독립 변수(X)가 됩니다. 또한 "women"으로 설정한 데이터 매개변수를 사용하여 데이터 세트를 지정해야 합니다.

선형 모델을 정의했으면 계수를 검사할 수 있습니다. 이러한 계수는 방정식 Y = MX + B에서 기울기(M) 및 절편(B)에 해당합니다. 이 경우 계수는 각각 -87.52 및 3.45입니다. 따라서 예측 체중(Y)은 높이(X)에 기울기(3.45)를 곱하고 절편(-87.52)을 더하여 계산할 수 있습니다.

예측을 테스트하기 위해 59인치의 높이 값을 사용하겠습니다. 여기에 기울기(3.45)를 곱하고 절편(-87.52)을 더하면 예상 가중치 116.03을 얻을 수 있으며 이는 예상 값 117에 가깝습니다.

이제 데이터와 선형 회귀선을 시각화해 보겠습니다. Y 및 X 값을 지정하고 데이터 매개 변수로 데이터 세트를 지정하는 plot() 함수를 사용하여 데이터 세트를 그릴 수 있습니다. 선형 모델로 abline() 함수를 호출하여 플롯에 회귀선을 오버레이할 수 있습니다.

결론적으로 R의 선형 회귀 모델을 사용하여 예측하는 과정을 살펴보았습니다. 이 자습서에서 사용된 데이터 세트는 15개 행으로만 구성된 상대적으로 작다는 점에 유의해야 합니다. 실제 시나리오에서는 더 정확한 예측을 위해 일반적으로 더 큰 데이터 세트가 사용됩니다. 그럼에도 불구하고 데모는 선형 회귀 프로세스에 대한 이해를 제공합니다.

이 비디오 자습서를 시청해 주셔서 감사합니다. 질문이 있으시면 댓글 섹션에 자유롭게 남겨주세요. 다음 영상도 기대해주세요!

Linear Regression R Program Make Predictions
Linear Regression R Program Make Predictions
  • 2017.05.11
  • www.youtube.com
Use Linear regression Model on R program data set to make predictions.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutori...
 

R 패키지 설치 방법


R 패키지 설치 방법

안녕하세요 여러분, 이 비디오에 오신 것을 환영합니다. 오늘은 R에서 패키지를 설치하는 과정에 대해 이야기하고자 합니다.

특히 데이터 시각화에 널리 사용되는 ggplot2 패키지를 설치하는 방법을 시연하겠습니다. 시작하려면 현재 내 라이브러리에서 ggplot2 패키지를 사용할 수 없다는 것을 알았습니다. 라이브러리(ggplot2)를 사용하여 가져오려고 하면 ggplot2라는 패키지가 없다는 오류 메시지가 나타납니다.

이 문제를 해결하려면 ggplot2 패키지를 설치해야 합니다. 다행히 R에 패키지를 설치하는 것은 간단합니다. install.packages() 함수 다음에 따옴표로 묶인 패키지 이름을 사용할 수 있습니다. 이 경우 install.packages("ggplot2") 명령을 실행하고 Enter 키를 누릅니다.

설치 프로세스가 시작되고 R은 CRAN(Comprehensive R Archive Network)에서 ggplot2 패키지에 필요한 파일과 데이터를 다운로드하기 시작합니다. 이 단계에서 인터넷 연결을 유지하는 것이 중요합니다.

ggplot2 패키지는 시각적으로 매력적이고 사용자 정의 가능한 그래픽을 만드는 기능으로 유명합니다. 그래픽의 문법을 활용하여 계층화된 플롯을 구성하여 데이터 시각화에 뛰어난 유연성을 제공합니다.

설치가 완료되면 ggplot2 패키지를 환경에 로드할 수 있습니다. 이를 위해 library() 함수를 사용하고 "ggplot2"를 인수로 전달합니다. library(ggplot2) 실행 시 패키지가 성공적으로 설치 및 로드되었음을 나타내는 이전 오류 메시지가 더 이상 발생하지 않습니다.

R에서 패키지를 설치하는 방법에 대한 비디오 자습서를 시청해 주셔서 감사합니다. 질문이 있는 경우 댓글 섹션에 자유롭게 남겨주세요. 이 비디오를 좋아하고 더 많은 콘텐츠를 보려면 채널을 구독하고 다음 비디오 강의를 계속 지켜봐주십시오.

How To Install R Packages
How To Install R Packages
  • 2017.05.11
  • www.youtube.com
Install R packages using instal.packages("[package_name_here]") commandPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

R 프로그램 막대 차트 색상


R 프로그램 막대 차트 색상

안녕하세요 여러분, R 프로그래밍 언어에 대한 이 비디오 자습서에 오신 것을 환영합니다. 이 세션에서는 RStudio를 사용하여 R 프로그래밍 언어를 사용하여 시각적으로 매력적인 막대 차트를 만듭니다.

시작하려면 RStudio를 열고 환경을 설정하겠습니다. 우리는 이미 막대 차트를 만드는 특정 목표를 염두에 두고 있습니다. 하지만 이번에는 미학적으로 보기 좋게 만드는 데 중점을 둘 것입니다.

이제 "cars"라는 벡터를 7개의 값으로 정의해 보겠습니다. "cars"라는 변수를 만들고 7개의 요소를 포함하는 벡터를 할당하여 이를 달성할 수 있습니다. 값 3, 5, 8, 6, 11, 12, 4를 사용합시다.

다음으로 이전과 마찬가지로 "barplot()" 함수를 사용하여 막대 차트를 만듭니다. 그러나 이번에는 차트의 모양을 향상시키기 위해 몇 가지 추가 매개 변수를 추가합니다.

먼저 차트에 제목을 추가해 보겠습니다. "main" 매개변수를 사용하고 "Cars"로 설정하여 막대 차트에 설명이 포함된 제목을 지정합니다.

또한 y축에 레이블을 지정하여 값이 자동차의 무게를 나타냄을 나타냅니다. "ylab" 매개변수를 지정하고 "Weight"로 설정하여 이를 수행할 수 있습니다.

또한 각 막대가 다른 유형의 자동차를 나타냄을 나타내기 위해 x축에 레이블을 지정해야 합니다. "xlab" 매개변수를 사용하고 "유형"으로 설정합니다.

마지막으로 시각적 매력을 더하기 위해 막대에 다른 색상을 사용하겠습니다. "col" 매개변수를 "rainbow(7)"로 설정하여 7가지 고유 색상의 무지개를 만듭니다.

코드를 실행하면 막대 차트가 화면 오른쪽에 나타납니다. "자동차"라는 제목이 지정되고 y축에는 가중치 값이 표시되고 x축에는 다양한 유형의 자동차가 표시됩니다. 막대 자체는 생생한 무지개 팔레트를 사용하여 색상이 지정됩니다.

이 비디오 자습서가 유용하고 즐거웠기를 바랍니다. 질문이 있으시면 주저하지 마시고 문의해 주십시오. 아래에 의견을 남겨주시면 최선을 다해 해결하겠습니다. 다음 비디오에서 더 흥미로운 자습서를 계속 지켜봐 주십시오.

R Program Bar Chart Color
R Program Bar Chart Color
  • 2017.05.13
  • www.youtube.com
Create a Bar chart with color, title, and labels in the R programming language.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programmi...
 

R 프로그래밍 히스토그램 예제


R 프로그래밍 히스토그램 예제

안녕하세요 여러분, R 프로그래밍 언어에 대한 이 튜토리얼에 오신 것을 환영합니다. 이 비디오에서는 R을 사용하여 간단한 히스토그램을 만드는 방법을 살펴보겠습니다. 바로 시작하겠습니다!

시작하려면 7개의 요소가 있는 "suv's"라는 벡터를 정의합니다. "suv's"라는 변수를 생성하고 값 5, 5, 5, 5, 8, 8, 19, 45 및 100을 포함하는 벡터를 할당하여 이를 달성할 수 있습니다.

이제 suv의 벡터가 설정되었으므로 히스토그램 생성을 진행할 수 있습니다. 이것은 "hist()" 함수를 사용하여 수행할 수 있습니다. "suv's" 벡터를 함수의 매개변수로 전달합니다.

코드를 실행하면 화면 오른쪽에 히스토그램이 표시됩니다. y축은 빈도를 나타내고 x축은 값의 범위를 나타냅니다. 이 경우 0에서 20까지의 범위에 5의 빈도가 있음을 관찰할 수 있으며 이는 해당 범위 내에서 5번의 값이 발생함을 나타냅니다. 유사하게, 40에서 60까지의 범위와 80에서 100까지의 범위는 각각 3과 1의 빈도를 가집니다.

이 비디오 자습서가 유익하고 직관적이기를 바랍니다. R을 사용하여 히스토그램을 만드는 것은 데이터 분포를 시각화하는 유용한 방법입니다. 질문이나 의견이 있으시면 언제든지 아래에 남겨주세요. 다음 비디오에서 더 흥미로운 자습서를 계속 지켜봐 주십시오.

R Programming Histogram Example
R Programming Histogram Example
  • 2017.05.13
  • www.youtube.com
Simple Histogram program in RPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-programming-fo...
 

R 프로그래밍 하위 집합


R 프로그래밍 하위 집합

안녕하세요, R 프로그래밍 언어에 대한 이 비디오에 오신 것을 환영합니다. 이 자습서에서는 데이터의 특정 하위 집합을 추출하는 것과 관련된 하위 집합을 탐색할 것입니다. 시작하자!

값 12, 13, 56, 4, 5, 89를 포함하는 "X"라는 벡터가 있다고 가정합니다. 이 벡터를 콘솔에 인쇄하여 내용을 확인합니다.

이제 값이 10보다 큰 데이터의 하위 집합을 추출하려고 한다고 가정해 보겠습니다. "X > 10"이라는 표현을 사용하여 이를 달성할 수 있습니다. 이것은 모든 값이 10보다 큰 데이터의 하위 집합을 제공합니다.

다음으로, 이 선택된 값을 4로 변경하고 싶다고 가정합니다. "X[X > 10] <- 4"라는 표현을 사용하여 이전에 얻은 하위 집합에 값 4를 간단히 할당할 수 있습니다. 이렇게 하면 "X"에서 10보다 큰 모든 값이 4로 대체됩니다.

수정된 "X"를 출력하면 10보다 큰 값이 실제로 4로 변경되었음을 확인할 수 있습니다.

이제 일부 외부 데이터로 작업해 보겠습니다. 데스크톱에 CSV 파일이 있고 "데이터 세트"라는 데이터 프레임으로 읽어들이고 싶습니다. "read.csv()" 함수를 사용하여 CSV 데이터를 가져올 파일 경로와 이름을 지정합니다. "데이터 세트"를 출력하면 차원(153행 및 6열)을 볼 수 있고 "NA" 레이블이 지정된 누락된 값을 식별할 수 있습니다.

계속해서 이 데이터를 사용하여 다양한 조작을 살펴보겠습니다. "dataset"과 원하는 행 수(2)를 지정하여 "head()" 함수를 사용하여 데이터 세트의 처음 두 행을 추출할 수 있습니다. 또는 "dataset[1:2, ]" 또는 "dataset[c(1, 2), ]"를 사용하여 행 및 열별로 인덱싱을 사용할 수 있습니다. 이러한 모든 방법은 처음 두 행을 검색하는 동일한 결과를 제공합니다.

데이터세트의 행 수를 결정하기 위해 "nrow()" 함수를 사용하고 "데이터세트"를 인수로 전달할 수 있습니다. 이렇게 하면 행 수가 153개로 표시됩니다.

데이터 세트의 마지막 두 행을 추출한다고 가정합니다. "dataset"과 함께 "tail()" 함수를 사용하고 행 수(2)를 지정하여 이를 수행할 수 있습니다. 마지막 두 행이 반환됩니다.

이제 47번째 행에서 "오존" 열의 값을 찾아보겠습니다. "dataset[47, 'ozone']" 또는 "dataset[47, 1]"과 같은 인덱싱을 사용하여 직접 액세스할 수 있습니다. 그러면 값 21이 검색됩니다.

또는 열 인덱스 대신 열 이름을 사용할 수 있습니다. 예를 들어 "dataset[47, 'ozone']"도 21을 반환합니다.

"오존" 열에서 누락된 값을 찾고 싶다고 가정합니다. "subset()" 함수를 사용하여 데이터 집합의 하위 집합을 만들 수 있습니다. 하위 집합은 "오존" 열에 "NA" 값이 있는 행으로 구성됩니다. 하위 집합을 인쇄하면 "ozone" 열에 "NA" 값만 포함되어 있음을 알 수 있습니다.

"ozone" 열에서 누락된 값의 수를 확인하기 위해 하위 집합에서 "nrow()" 함수를 사용할 수 있으며 답은 37입니다.

데이터 집합에서 누락된 값을 제거하려는 경우 "na.omit()" 함수를 사용하고 "dataset"을 인수로 전달할 수 있습니다. 그러면 누락된 값이 제거된 데이터 세트가 반환됩니다.

이를 달성하는 또 다른 방법은 "dataset"을 인수로 사용하여 "complete.cases()" 함수를 사용하는 것입니다. "NA" 값이 있는 행을 제거하는 것과 동일한 결과를 제공합니다.

이제 5월의 "오존" 열의 최대값을 찾는 것으로 이동하겠습니다. "subset()" 함수를 사용하여 데이터 집합의 하위 집합을 만들 수 있습니다. 하위 집합 함수 내에서 조건을 지정합니다. 월은 5(5월을 나타냄)와 같아야 하고 "오존" 열에는 누락된 값이 없어야 합니다. 하위 집합을 인쇄하면 필터링된 데이터를 볼 수 있습니다.

육안으로 검사하지 않고 이 하위 집합에서 최대값을 얻으려면 "apply()" 함수를 사용할 수 있습니다. 하위 집합의 열에 "max()" 함수를 적용하여 최대값을 검색합니다. 이 경우 "오존" 열에 적용합니다. 5월의 최대 오존 값은 115입니다.

결론적으로 우리는 조건에 따라 하위 집합을 추출하고, 인덱싱을 사용하여 특정 요소에 액세스하고, 누락된 값을 처리하고, 하위 집합에 대한 계산을 수행하는 등 R의 다양한 하위 집합화 기술을 다루었습니다. 이 튜토리얼이 도움이 되었기를 바랍니다. 질문이나 의견이 있으시면 아래에 자유롭게 남겨주세요. 더 많은 R 프로그래밍 튜토리얼을 구독하는 것을 잊지 마세요. 시청해주셔서 감사하고 다음 영상에서 뵙겠습니다!

R Programming Subset
R Programming Subset
  • 2017.05.30
  • www.youtube.com
Get subsets of matrices and data framesPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-prog...
 

R 프로그램 하위 집합2


R 프로그램 하위 집합2

여러분, R 프로그래밍 언어에 대한 이 비디오에 오신 것을 환영합니다. 이 튜토리얼에서는 'iris' 데이터셋에서 'virginica' 종의 꽃받침 길이 평균을 찾을 것입니다. R에서 사전 정의된 데이터 세트를 탐색하는 것으로 시작하겠습니다. 사용 가능한 데이터 세트를 보려면 인수 없이 'data()' 함수를 사용합니다. 그러면 R에서 제공되는 데이터세트 목록이 표시됩니다. 분석을 위해 'iris' 데이터세트로 작업할 것입니다.

'data(iris)'를 입력하여 'iris' 데이터셋을 불러오겠습니다. 이것은 150개의 행과 5개의 열(꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비 및 종)으로 구성된 전체 데이터 세트를 로드합니다. 'virginica' 종만 포함하는 하위 집합을 추출하기 위해 'iris_subset'이라는 새 변수를 만듭니다. 하위 집합 연산을 사용하여 종이 'virginica'와 동일한 모든 행을 원한다고 지정합니다. 모든 열도 필요하므로 열 지정을 생략합니다.

'iris_subset'을 출력하면 이제 'virginica' 종만 포함하는 'iris' 데이터세트의 하위 집합이 있음을 확인할 수 있습니다. 다음으로 이 하위 집합에 대한 꽃받침 길이의 평균을 계산하는 데 관심이 있습니다. 꽃받침 길이 열에 집중하기 위해 꽃받침 길이 열만 포함하도록 'iris_subset'을 수정합니다.

이제 'iris_subset'을 행렬로 변환해 보겠습니다. 변환된 행렬을 'as.matrix()' 함수를 사용하여 'iris_subset_matrix'라는 새 변수에 할당합니다. 행렬로 변환하여 특정 열에 수학 연산을 적용할 수 있습니다. 'iris_subset_matrix'는 원래 부분 집합과 유사해 보이지만 이제 행렬 개체입니다.

꽃받침 길이의 평균을 계산하기 위해 'iris_subset_matrix'의 꽃받침 길이 열에 'mean()' 함수를 사용합니다. 이것은 'virginica' 종의 꽃받침 길이에 대해 6.588의 평균값을 제공합니다.

'subset()' 함수를 사용하여 하위 집합을 수행하는 다른 방법이 있음을 언급할 가치가 있습니다. 그러나 이 자습서에서는 하위 집합을 추출하고 행렬로 변환하고 계산을 수행하여 R에서 데이터를 조작하는 대체 접근 방식을 보여주었습니다. 이러한 기술은 데이터 분석에 유연성을 제공합니다.

시청 해주셔서 감사합니다! 질문이나 의견이 있으시면 아래에 남겨주세요. 더 많은 R 프로그래밍 자습서를 보려면 비디오를 좋아하고 채널을 구독하는 것을 잊지 마십시오. 다음 영상도 기대해주세요!

R Program Subset2
R Program Subset2
  • 2017.06.07
  • www.youtube.com
Get the mean of Sepal.Length for species virginica in the iris dataset.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

JSON R 프로그래밍 읽기


JSON R 프로그래밍 읽기

여러분, R 프로그래밍 언어에 대한 이 튜토리얼에 오신 것을 환영합니다. 이 비디오에서는 JSON(JavaScript Object Notation)에서 정보를 추출하는 방법에 대해 설명합니다. 이를 시연하기 위해 모든 리포지토리에 대한 정보를 표시하는 GitHub API가 백그라운드에 있습니다. 다른 리포지토리에서 포크한 'awesome-tensorflow'를 포함하여 리포지토리 목록과 함께 강조 표시된 내 GitHub 사용자 이름을 볼 수 있습니다.

이 데이터를 추출하고 작업하기 위해 R의 'jsonlite' 라이브러리를 사용합니다. 먼저 JSON에서 데이터를 검색해 보겠습니다. 'json_data'라는 변수를 만들고 'fromJSON()' 함수를 사용하여 특정 URL에서 데이터를 가져옵니다. GitHub API URL을 복사하여 'fromJSON()' 함수의 인수로 전달하겠습니다.

이 코드를 실행하면 데이터 프레임을 얻습니다. 'json_data'의 클래스를 확인하기 위해 'class()' 함수를 사용하여 실제로 데이터 프레임임을 나타냅니다.

이제 'json_data' 변수의 내용을 살펴보겠습니다. 데이터 프레임에서 속성의 이름을 검색하기 위해 'names()' 함수를 사용할 수 있습니다. 'names(json_data)'를 입력하면 각 저장소의 이름을 나타내는 'name'을 포함한 속성 목록을 얻습니다.

내 모든 리포지토리의 이름을 추출하려면 'json_data$name' 구문을 사용하여 'name' 특성에 직접 액세스할 수 있습니다. 이렇게 하면 총 30개에 달하는 내 모든 리포지토리의 이름이 표시됩니다.

다음으로 'iris' 데이터셋과 같은 데이터 프레임을 JSON(JavaScript Object Notation) 형식으로 변환하는 시나리오를 살펴보겠습니다. 이를 위해 'toJSON()' 함수를 사용할 수 있습니다. 예를 들어 'my_json'이라는 변수를 만들고 'iris' 데이터셋에 'toJSON()' 함수를 적용해 봅시다. 또한 'pretty' 매개변수를 포함하여 결과 JSON이 시각적으로 만족스러운 방식으로 형식화되도록 할 수 있습니다.

'my_json'을 출력하면 JSON이 적절한 들여쓰기로 깔끔하게 포맷된 것을 볼 수 있습니다. '6.3', '4.8', '1.8', '6.3', '4.8', '1.8', '꽃받침 길이', '꽃받침 너비', '꽃잎 길이', '꽃잎 너비', '종' 속성을 해당 값과 함께 표시합니다. 버지니카'.

'pretty' 매개변수를 제거하고 JSON을 다시 생성하면 가독성이 떨어지고 길이 때문에 잘립니다. 따라서 더 나은 시각화를 위해 'pretty' 매개변수를 사용하는 것이 좋습니다.

이제 JSON을 다시 데이터 프레임으로 변환하는 방법을 살펴보겠습니다. 이를 달성하기 위해 'fromJSON()' 함수를 사용하고 'my_json' 변수를 매개변수로 제공할 수 있습니다. 이 코드를 실행하면 원본 데이터 프레임이 반환되어 변환 프로세스가 효과적으로 역전됩니다.

시청 해주셔서 감사합니다! 의견이나 질문이 있으시면 아래에 자유롭게 남겨주세요. 귀하의 피드백에 감사드립니다. 더 많은 R 프로그래밍 자습서를 보려면 채널을 구독하는 것을 잊지 마십시오. 다음 영상도 기대해주세요!

Reading JSON R Programming
Reading JSON R Programming
  • 2017.06.20
  • www.youtube.com
Read in Javascript Object Notation (JSON) from git API using the R Programming Language.Git API: https://api.github.com/users/randerson112358/reposGet the co...
 

R에서 CSV 파일 읽기


R에서 CSV 파일 읽기

여러분, R 프로그래밍 언어에 대한 이 비디오 자습서에 오신 것을 환영합니다. 이 튜토리얼에서는 R을 사용하여 CSV 파일을 여는 방법을 보여드리겠습니다. 시작하기 위해 화면 오른쪽에 R 도움말 문서를 이미 열었습니다. 이 작업에 사용할 수 있는 'read.csv()'라는 함수가 있음을 알 수 있습니다. 기본적으로 이 함수는 파일에 헤더가 있고 값이 쉼표로 구분되어 있다고 가정합니다.

CSV 파일의 데이터를 저장하기 위해 'my_data'라는 변수를 생성해 보겠습니다. 파일을 읽기 위해 'read.csv()' 함수를 사용할 것입니다. 파일 경로를 함수에 대한 인수로 지정할 수 있습니다. 파일 경로를 얻기 위해 Kaggle 웹사이트에서 얻은 하우스 데이터가 포함된 CSV 파일이 있습니다. 파일을 마우스 오른쪽 버튼으로 클릭하고 '속성'으로 이동한 다음 파일 위치를 복사합니다. RStudio로 돌아가서 따옴표 안에 파일 경로를 붙여넣겠습니다.

이제 파일 경로에 파일 이름을 포함해야 합니다. 파일 경로 뒤에 슬래시를 추가하고 파일 이름을 붙여넣겠습니다. Windows 시스템을 사용하고 있으므로 파일 경로에 백슬래시가 포함되어 있다는 점에 유의해야 합니다. 그러나 R에는 슬래시 또는 이스케이프된 백슬래시가 필요합니다. 지금 코드를 실행하면 백슬래시로 인해 오류가 발생합니다. 이 문제를 해결하기 위해 슬래시를 수동으로 뒤집습니다.

ENTER를 눌러 코드를 실행해 봅시다. 결과적으로 1,460개의 관찰 또는 행과 81개의 기능 또는 열이 있는 'my_data'라는 데이터 프레임을 얻습니다. 'my_data'와 함께 'nrow()' 및 'ncol()' 함수를 사용하여 이를 확인할 수 있습니다.

데이터를 검사하려면 환경 창에서 'my_data' 변수를 두 번 클릭하거나 콘솔에서 'my_data' 명령을 사용할 수 있습니다. 그러나 콘솔에서 전체 데이터 프레임을 보는 것은 읽기 쉽지 않을 수 있습니다. 따라서 'my_data'를 두 번 클릭하여 멋진 형식의 테이블을 표시하는 것이 좋습니다.

이 튜토리얼은 여기까지입니다. 시청 해주셔서 감사합니다. 도움이 되었기를 바랍니다. 질문이나 의견이 있으시면 아래에 자유롭게 남겨주세요. 더 많은 R 프로그래밍 자습서를 보려면 채널을 구독하는 것을 잊지 마십시오. 다음 영상도 기대해주세요!

Read CSV File In R
Read CSV File In R
  • 2017.07.08
  • www.youtube.com
Read a .CSV file in R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-p...
 

R의 다중 선형 회귀


R의 다중 선형 회귀

여러분, R 프로그래밍 언어에 대한 이 비디오에 오신 것을 환영합니다. 오늘은 다중 선형 회귀에 대해 논의하고 이를 RStudio에서 구현하는 방법을 시연하고자 합니다. 시작하려면 분석을 위한 데이터 세트가 필요합니다. 온라인에서 얻은 'real_estate.csv'라는 CSV 파일이 이미 있습니다. 아래 설명에서 이 데이터 세트를 다운로드할 수 있는 링크를 찾을 수 있습니다.

'my_data'라는 변수를 만들고 'read.csv()' 함수를 사용하여 CSV 파일을 RStudio로 읽어 들이는 것으로 시작하겠습니다. 파일의 위치와 이름을 지정해야 합니다. 위치를 얻으려면 파일을 마우스 오른쪽 버튼으로 클릭하고 '속성'을 클릭하여 파일 위치를 복사합니다. 위치를 붙여넣은 후 따옴표로 묶겠습니다. 또한 슬래시 뒤에 파일 이름을 포함하고 Windows 시스템에 필요한 형식과 일치하도록 슬래시를 반대로 지정합니다. 이 코드를 실행하면 781개의 행과 8개의 열을 포함하는 'my_data' 데이터 프레임이 생성됩니다.

이제 데이터 프레임을 자세히 살펴보겠습니다. 'MLS'(여러 리스팅 서비스 번호), '위치', '가격', '침실', '욕실', '크기'(평방 피트 단위의 집 크기), '평방 피트당 가격'을 비롯한 여러 열이 있습니다. 및 '상태'(판매 유형). 다중 선형 회귀를 보여주기 위해 숫자 열만 사용하고 '위치' 및 '상태'는 제외합니다.

새 데이터 세트를 만들기 위해 'my_data'를 'my_data2'라는 새 변수에 할당하고 열 1, 3, 4, 5, 6, 7을 선택합니다. 이 새 데이터 세트에는 781개의 행과 6개의 열이 포함되어 있습니다.

이제 선형 모델 생성으로 넘어 갑시다. 'lin_mod'라는 변수를 만들고 선형 모델을 나타내는 'lm()' 함수와 동일하게 설정합니다. 'MLS', '침실', '욕실', '크기' 및 '평방피트당 가격'과 같은 기능을 기반으로 '가격'을 예측하려고 합니다. '가격'을 종속 변수로 지정하고 다른 기능을 포함하면 'my_data2' 데이터 세트를 사용하여 선형 모델을 구축할 수 있습니다.

선형 모델의 요약을 얻기 위해 'lin_mod'에서 'summary()' 함수를 사용하겠습니다. 요약은 잔차, 계수 및 p-값에 대한 정보를 제공합니다. 변수의 중요도는 별표를 사용하여 시각적으로 확인할 수 있으며 별 세 개는 높은 중요도를 나타냅니다.

이제 선형 모델이 있으므로 예측을 해보겠습니다. 'price'라는 변수를 만들고 절편 계수에서 7.34를 뺀 값과 변수 계수에 테이블의 마지막 행에 있는 각 값을 곱한 값으로 설정합니다. 예를 들어 'MLS' 값에 해당 계수를 곱하고 방정식에 추가합니다. 마찬가지로 예측 방정식에 '침실', '욕실', '크기' 및 '평방피트당 가격'을 포함합니다.

예상 가격을 인쇄하고 데이터 세트의 마지막 행의 실제 가격과 비교해 보겠습니다. 예상 가격은 약 $1,100,000입니다. 코드를 실행한 후 실제 가격보다 약 $77,000 낮은 $1,023,000의 예상 가격을 얻습니다. 그 차이는 상당하지만 백만 달러짜리 집을 고려하는 구매자에게는 큰 문제가 아닐 수 있습니다.

이 비디오가 유익하고 즐거웠기를 바랍니다. 질문이나 의견이 있으시면 아래에 남겨주세요. 이 비디오를 좋아하는 것을 잊지 마시고 더 많은 자습서를 시청하십시오. 봐주셔서 감사하고 다음편에서 뵙겠습니다.

Multiple Linear Regression In R
Multiple Linear Regression In R
  • 2017.07.10
  • www.youtube.com
Multiple Linear Regression In R prediction.Get the Code: https://github.com/randerson112358/R-Programs/blob/master/MultLinReg.RGet the Dataset:https://wiki.c...