マトリックスパッケージの研究 - ページ 2

 
Alexey Burnakov:
明日、このテーマで役に立つコードをいくつか掲載する予定です。
#  hypothesis testing

#  two-sample mean comparison

t.test(x, y = NULL,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, paired = FALSE, var.equal = FALSE,
       conf.level = 0.95, ...)

#  two-sample median comparison

wilcox.test(x, y = NULL,
            alternative = c("two.sided", "less", "greater"),
            mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
            conf.int = FALSE, conf.level = 0.95, ...)

#  two distribution comparison

ks.test(x, y, ...,
        alternative = c("two.sided", "less", "greater"),
        exact = NULL)

#  normality test

shapiro.test(x)


# independence / goodness of fit / homogeneity tests for categorical variables
chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

#  covariance / correlation

var(x, y = NULL, na.rm = FALSE, use)

cov(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

cor(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

# ordinary linear regression
lm(formula, data, subset, weights, na.action,
   method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
   singular.ok = TRUE, contrasts = NULL, offset, ...)   =) that easy
 
Alexey Burnakov:

#  selecting a random subset of rows from an array to perform Shapiro–Wilk test

shapiro.test(x = lateral_residuals$`lateral_linear_model$residuals`[sample(x = nrow(lateral_residuals), size = 4999, replace = F)])
 
Alexey Burnakov:

#  generate pseudo random numbers (or probabilities) for normal

dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)


# for uniform

dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
 
Alexey Burnakov:
#  perform ANOVA on one or more trained models

anova(object, ...)   that easy =)
 
Alexey Burnakov:
#create histograms with error bars (on first 10 000 rows)

for(i in 1:8){
        
        subdat <- head(pre_an_int_eff, 10000)
        
        dodge <- position_dodge(width = 0.9)
        p <- ggplot(subdat, aes(fill = subdat$'sample_description', y = subdat$'mean', x = subdat$'sample_description')) + 
                geom_bar(position = "dodge", stat = "identity") + 
                geom_bar(position = dodge) + geom_errorbar(aes(ymin = subdat[, 9], ymax = subdat[, 10]), position = dodge, width = 0.25) +
                theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) + 
                theme(legend.position = 'none')
        
        print(p)
        
}
That is all, folks!
 
Alexey Volchanskiy:

ところで、Rをご存知の方がいらっしゃいましたら、初心者の質問です。RのディストリビューションやR-server、"A web application framework for R" http://shiny.rstudio.com/ 、Microsoftのモンスターパッケージなどがあるようですが......。何を選ぶか?

R-studioは十分に良いものです - それは単に言語(開発者による任意のRパッケージとアドオン)上の改良されたインタフェースです。 Shinyは、コントロール、入力フォーム、あらゆる種類のWebデモを作成するための同じRパッケージです。
MSから使ってないので何とも言えませんが。
 

男性諸君!

もしあなたが、何らかの言語でのプログラミング経験と統計学の知識という、わずかな前提条件を備えているならば、Rだけ、Rだけです。

Matlabは全く比較できません。別のパッケージで、しかも高額な有償パッケージです。

Rの競合はSASやSPSSですが、これらは有償パッケージであり、Rがそれらを追い抜き始めています。5年間はまだMatlabはRと比較されていましたが、もう最後のレビューで見かけなくなりましたね、忘却の彼方です。

今やRは統計学のスタンダードであり、膨大な数の出版物があり、一般に非常に強力なムーブメントとなっています。

例えば、非常に便利なブログが毎日発行されており、ニュースを購読することができます: http://www.r-bloggers.com/

非常にリーズナブルな価格で購入できる書籍の数々をご紹介します。http://www.twirpx.com/search/?query=R。Rの検索を入力した。キーワードでよく検索される。

忘れてはならないのは、アルゴリズム・プログラミング言語としてのRがトップ10に入り、Cの亜種に次ぐランクにあることだ。

使用するには、RStudioで通常のRを取る必要があります。また、Rの有料バリアントがマイクロソフトに買収され、そのバリアントを促進するために開始されたことを忘れてはならない - 開発に従ってください。

R-bloggers
R-bloggers
  • xi'an
  • www.r-bloggers.com
In econometric modeling, I usually have a problem with correlated features. A few weeks ago, I was discussing feature selection when features are correlated. This week, I was wondering about... Clustering French Cities (based on Temperatures) In order to illustrate hierarchical clustering techniques and k-means, I did borrow François Husson‘s...
 
СанСаныч Фоменко:

男性諸君!

もしあなたが、何らかの言語でのプログラミング経験と統計学の知識という、わずかな前提条件を備えているならば、Rだけ、Rだけです。

Matlabは全く比較できません。別のパッケージで、しかも高額な有償パッケージです。

Rの競合はSASやSPSSですが、これらは有償パッケージであり、Rがそれらを追い抜き始めています。5年間はまだMatlabはRと比較されていましたが、もう最後のレビューで見かけなくなりましたね、忘却の彼方です。

今やRは統計学のスタンダードであり、膨大な数の出版物があり、一般に非常に強力なムーブメントとなっています。

例えば、非常に便利なブログが毎日発行されており、ニュースを購読することができます: http://www.r-bloggers.com/

非常にリーズナブルな価格で購入できる書籍の数々をご紹介します。http://www.twirpx.com/search/?query=R。Rの検索を入力した。キーワードでよく検索される。

忘れてはならないのは、アルゴリズム・プログラミング言語としてのRがトップ10に入り、Cの亜種に次ぐランクにあることだ。

使用するには、RStudioで通常のRを取る必要があります。それに、有料のRバリアントがマイクロソフトに買収され、プロモーションを始めていることも忘れてはならない。

さて、Rをゆっくり勉強している初日ですが、私の質問に答えてください、RとMatlabの機能を比較したいのです。でも、騒がずに、バランスよく、冷静に:)

  1. RはOOPの機能を持った言語なのか?
  2. MQL4/5から直接使用するための32ビットと64ビットのDLLをRで作成することはできますか?その場合、そのようなDLLをユーザーのコンピュータで使用するには、どのようなサイズのパッケージをインストールしなければならないのでしょうか?
  3. Rから直接アクセスするために、共通のDLLを接続することはできますか?
  4. RでSimulinkのアナログはありますか?
  5. なぜ、どのレビューでもRが統計プログラムであることが強調されているのですか?DSPに興味があるのですが、Rにはデジタル信号処理用のパッケージがありますか?
  6. Matlabの.matファイルのような、コンパクトなデータ保存形式がRに組み込まれていますか?

 
Alexey Volchanskiy:

RとMatlabの可能性を比較したいのですが、質問に答えてください。ただ、おしゃべりはせず、バランスよく落ち着いて:)。


  1. 一般的なデータベースを接続して、Rから直接アクセスすることはできますか?

  2. なぜ、どのレビューでもRは統計プログラムであることが強調されているのでしょうか?DSPに興味があるのですが、Rにはデジタル信号処理用のパッケージがありますか?

はい、そうです。私の同僚は、MS SQLにしがみついている。

信号: https://cran.r-project.org/web/packages/signal/index.html

他にも似たようなパッケージがあるのではないでしょうか。

RはSから発展した。元々は統計データ処理のために開発されたものです。おそらく、本格的な言語としての機能は欠けているかもしれませんが、これで統計的な研究をするのは便利です。また、データ処理・解析のためのオープンソースのパッケージが多数(数千)存在します。

機械学習の最新トレンドであるディープラーニングや、センセーショナルなxGBoostも、今では実装されているのです。

 
Alexey Burnakov:

はい、そうです。私の同僚は、MS SQLにしがみついています。

信号: https://cran.r-project.org/web/packages/signal/index.html

他にも似たようなパッケージがあるのではないでしょうか。

RはSから発展した。元々は統計データ処理のために開発されたものです。おそらく、本格的な言語としての機能は欠けているかもしれませんが、これで統計調査をするのは便利です。また、データ処理・解析のためのオープンソースのパッケージが多数(数千)存在します。

機械学習の最新トレンドであるディープラーニングや、センセーショナルなxGBoostも、今では実装されているのです。

私のプログラムのいくつかをMatlabでRに翻訳して、速度を比較してみなければなりません。週末までになんとかわかったら、やって報告します。Matlabはかなり遅いので、私は多くのことをC#やC++で行い、スピードのためにDLLとしてプラグインしています。