Forschung in Matrix-Paketen - Seite 2

 
Alexey Burnakov:
Ich werde morgen ein paar nützliche Codes zu diesem Thema veröffentlichen.
#  hypothesis testing

#  two-sample mean comparison

t.test(x, y = NULL,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, paired = FALSE, var.equal = FALSE,
       conf.level = 0.95, ...)

#  two-sample median comparison

wilcox.test(x, y = NULL,
            alternative = c("two.sided", "less", "greater"),
            mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
            conf.int = FALSE, conf.level = 0.95, ...)

#  two distribution comparison

ks.test(x, y, ...,
        alternative = c("two.sided", "less", "greater"),
        exact = NULL)

#  normality test

shapiro.test(x)


# independence / goodness of fit / homogeneity tests for categorical variables
chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

#  covariance / correlation

var(x, y = NULL, na.rm = FALSE, use)

cov(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

cor(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

# ordinary linear regression
lm(formula, data, subset, weights, na.action,
   method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
   singular.ok = TRUE, contrasts = NULL, offset, ...)   =) that easy
 
Alexey Burnakov:

#  selecting a random subset of rows from an array to perform Shapiro–Wilk test

shapiro.test(x = lateral_residuals$`lateral_linear_model$residuals`[sample(x = nrow(lateral_residuals), size = 4999, replace = F)])
 
Alexey Burnakov:

#  generate pseudo random numbers (or probabilities) for normal

dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)


# for uniform

dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
 
Alexey Burnakov:
#  perform ANOVA on one or more trained models

anova(object, ...)   that easy =)
 
Alexey Burnakov:
#create histograms with error bars (on first 10 000 rows)

for(i in 1:8){
        
        subdat <- head(pre_an_int_eff, 10000)
        
        dodge <- position_dodge(width = 0.9)
        p <- ggplot(subdat, aes(fill = subdat$'sample_description', y = subdat$'mean', x = subdat$'sample_description')) + 
                geom_bar(position = "dodge", stat = "identity") + 
                geom_bar(position = dodge) + geom_errorbar(aes(ymin = subdat[, 9], ymax = subdat[, 10]), position = dodge, width = 0.25) +
                theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) + 
                theme(legend.position = 'none')
        
        print(p)
        
}
That is all, folks!
 
Alexey Volchanskiy:

Übrigens, falls es Leute gibt, die sich mit R auskennen, eine Frage an die Anfänger. Ich sehe, dass es mehrere R-Distributionen, R-Server, einige "A Web Application Framework for R" http://shiny.rstudio.com/ , Monster-Pakete von Microsoft... Was soll man wählen?

R-Studio ist gut genug - es ist einfach eine verbesserte Schnittstelle über die Sprache (alle R-Pakete und Add-ons vom Entwickler). Shiny ist das gleiche R-Paket zum Erstellen von Steuerelementen, Eingabeformularen, alle Arten von Web-Demos.
Ich habe es nicht von MS verwendet, ich kann es nicht sagen.
 

Männer!

Wenn Sie auch nur die geringsten Voraussetzungen mitbringen - Programmiererfahrung in einer beliebigen Sprache und einige Kenntnisse in Statistik -, dann nur R, und nur R.

Matlab kann überhaupt nicht verglichen werden - es ist ein anderes Paket, und zwar ein kostenpflichtiges Paket für viel Geld.

Die Konkurrenten von R sind SAS und SPSS, aber das sind kostenpflichtige Pakete und R beginnt, sie zu überholen. 5 Jahre lang wurde Matlab noch mit R verglichen, aber ich sehe es in den letzten Reviews nicht mehr - es ist in Vergessenheit geraten.

Heutzutage ist R der Standard für Statistik, es gibt eine große Anzahl von Veröffentlichungen und allgemein eine sehr starke Bewegung.

Zum Beispiel ein sehr nützlicher Blog, der jeden Tag veröffentlicht wird, Sie können sich für Neuigkeiten anmelden: http://www.r-bloggers.com/

Hier gibt es ein paar Bücher für sehr günstiges Geld: http://www.twirpx.com/search/?query=R. Geben Sie eine Suche nach R ein. Sie sucht gut nach Schlüsselwörtern.

Vergessen wir nicht, dass R als algorithmische Programmiersprache zu den zehn wichtigsten Sprachen gehört und neben den C-Varianten rangiert.

Um es zu verwenden, müssen Sie gewöhnliches R mit RStudio nehmen. Außerdem sollten wir nicht vergessen, dass die kostenpflichtige Variante von R von Microsoft gekauft wurde und beginnt, seine Variante zu fördern - verfolgen Sie die Entwicklungen.

R-bloggers
R-bloggers
  • xi'an
  • www.r-bloggers.com
In econometric modeling, I usually have a problem with correlated features. A few weeks ago, I was discussing feature selection when features are correlated. This week, I was wondering about... Clustering French Cities (based on Temperatures) In order to illustrate hierarchical clustering techniques and k-means, I did borrow François Husson‘s...
 
СанСаныч Фоменко:

Männer!

Wenn Sie auch nur die geringsten Voraussetzungen mitbringen - Programmiererfahrung in einer beliebigen Sprache und einige Kenntnisse in Statistik -, dann nur R, und nur R.

Matlab kann überhaupt nicht verglichen werden - es ist ein anderes Paket, und zwar ein kostenpflichtiges Paket für viel Geld.

Die Konkurrenten von R sind SAS und SPSS, aber das sind kostenpflichtige Pakete und R beginnt, sie zu überholen. 5 Jahre lang wurde Matlab noch mit R verglichen, aber ich sehe es in den letzten Reviews nicht mehr - es ist in Vergessenheit geraten.

Heutzutage ist R der Standard für Statistik, es gibt eine große Anzahl von Veröffentlichungen und allgemein eine sehr starke Bewegung.

Zum Beispiel ein sehr nützlicher Blog, der jeden Tag veröffentlicht wird, Sie können sich für Neuigkeiten anmelden: http://www.r-bloggers.com/

Hier gibt es ein paar Bücher für sehr günstiges Geld: http://www.twirpx.com/search/?query=R. Geben Sie eine Suche nach R ein. Sie sucht gut nach Schlüsselwörtern.

Vergessen wir nicht, dass R als algorithmische Programmiersprache zu den zehn wichtigsten Sprachen gehört und neben den C-Varianten rangiert.

Um es zu verwenden, müssen Sie gewöhnliches R mit RStudio nehmen. Außerdem darf man nicht vergessen, dass die kostenpflichtige R-Variante von Microsoft aufgekauft wurde und von nun an gefördert wird.

Nun, es ist der erste Tag, an dem ich langsam R lerne. Beantworten Sie meine Fragen, ich möchte die Funktionen von R und Matlab vergleichen. Aber ohne Tohuwabohu, auf ausgewogene und ruhige Weise :).

  1. Ist R eine Sprache mit OOP-Fähigkeiten?
  2. Kann ich R verwenden, um eine 32-Bit- und eine 64-Bit-DLL zur direkten Verwendung von MQL4/5 zu erstellen? Wenn ja, wie groß muss das Paket sein, das ich installieren muss, um eine solche DLL auf dem Computer eines Benutzers zu verwenden?
  3. Kann ich allgemeine DLLs für den direkten Zugriff von R aus verbinden?
  4. Gibt es ein Analogon zu Simulink in R?
  5. Warum betonen alle Rezensionen, dass R ein Statistikprogramm ist? Ich interessiere mich für DSP. Gibt es in R Pakete für digitale Signalverarbeitung?
  6. Gibt es ein eingebautes kompaktes Datenspeicherformat in R, ähnlich den .mat-Dateien in Matlab?

 
Alexey Volchanskiy:

Toll, es ist mein erster Tag, an dem ich R lerne. Bitte beantworten Sie die Fragen, ich möchte die Funktionen von R und Matlab vergleichen. Nur ohne Geplapper, ausgeglichen und ruhig :).


  1. Kann ich gemeinsame Datenbanken für den direkten Zugriff von R aus verbinden?

  2. Warum wird in allen Rezensionen betont, dass R ein Statistikprogramm ist? Ich interessiere mich für DSP. Gibt es in R Pakete für digitale Signalverarbeitung?

Ja und ja. Mein Kollege klammert sich an MS SQL.

Signale: https://cran.r-project.org/web/packages/signal/index.html

Wahrscheinlich gibt es auch andere ähnliche Pakete.

R ist aus S hervorgegangen. Es wurde ursprünglich für die statistische Datenverarbeitung entwickelt. Wahrscheinlich fehlen ihr einige Funktionen vollwertiger Sprachen, aber sie ist für statistische Untersuchungen sehr praktisch. Und es gibt viele (Tausende) Open-Source-Pakete für die Datenverarbeitung und -analyse.

Auch die neuesten Trends im Bereich des maschinellen Lernens - Deep Learning und das sensationelle xGBoost- sind inzwischen implementiert.

 
Alexey Burnakov:

Ja und ja. Ein Kollege von mir klammert sich an MS SQL.

Signale: https://cran.r-project.org/web/packages/signal/index.html

Wahrscheinlich gibt es auch andere ähnliche Pakete.

R ist aus S hervorgegangen. Es wurde ursprünglich für die statistische Datenverarbeitung entwickelt. Wahrscheinlich fehlen ihr einige Funktionen vollwertiger Sprachen, aber sie ist für statistische Untersuchungen sehr praktisch. Und es gibt viele (Tausende) Open-Source-Pakete für die Datenverarbeitung und -analyse.

Auch die neuesten Trends im Bereich des maschinellen Lernens - Deep Learning und das sensationelle xGBoost - sind inzwischen implementiert.

Ich muss versuchen, einige meiner Programme in R in Matlab zu übersetzen, um die Geschwindigkeit zu vergleichen. Wenn ich es bis zum Wochenende herausfinde, werde ich es tun und darüber berichten. Matlab ist ziemlich langsam, ich mache vieles in C# oder C++ und füge es aus Geschwindigkeitsgründen als DLL ein.