Pesquisa em pacotes matriciais - página 2

 
Alexey Burnakov:
Amanhã vou publicar alguns códigos úteis sobre o assunto.
#  hypothesis testing

#  two-sample mean comparison

t.test(x, y = NULL,
       alternative = c("two.sided", "less", "greater"),
       mu = 0, paired = FALSE, var.equal = FALSE,
       conf.level = 0.95, ...)

#  two-sample median comparison

wilcox.test(x, y = NULL,
            alternative = c("two.sided", "less", "greater"),
            mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
            conf.int = FALSE, conf.level = 0.95, ...)

#  two distribution comparison

ks.test(x, y, ...,
        alternative = c("two.sided", "less", "greater"),
        exact = NULL)

#  normality test

shapiro.test(x)


# independence / goodness of fit / homogeneity tests for categorical variables
chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

#  covariance / correlation

var(x, y = NULL, na.rm = FALSE, use)

cov(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

cor(x, y = NULL, use = "everything",
    method = c("pearson", "kendall", "spearman"))

# ordinary linear regression
lm(formula, data, subset, weights, na.action,
   method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
   singular.ok = TRUE, contrasts = NULL, offset, ...)   =) that easy
 
Alexey Burnakov:

#  selecting a random subset of rows from an array to perform Shapiro–Wilk test

shapiro.test(x = lateral_residuals$`lateral_linear_model$residuals`[sample(x = nrow(lateral_residuals), size = 4999, replace = F)])
 
Alexey Burnakov:

#  generate pseudo random numbers (or probabilities) for normal

dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)


# for uniform

dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
 
Alexey Burnakov:
#  perform ANOVA on one or more trained models

anova(object, ...)   that easy =)
 
Alexey Burnakov:
#create histograms with error bars (on first 10 000 rows)

for(i in 1:8){
        
        subdat <- head(pre_an_int_eff, 10000)
        
        dodge <- position_dodge(width = 0.9)
        p <- ggplot(subdat, aes(fill = subdat$'sample_description', y = subdat$'mean', x = subdat$'sample_description')) + 
                geom_bar(position = "dodge", stat = "identity") + 
                geom_bar(position = dodge) + geom_errorbar(aes(ymin = subdat[, 9], ymax = subdat[, 10]), position = dodge, width = 0.25) +
                theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) + 
                theme(legend.position = 'none')
        
        print(p)
        
}
That is all, folks!
 
Alexey Volchanskiy:

A propósito, se há pessoas que conhecem R, a pergunta de um principiante. Vejo que existem várias distribuições R, R-server, algumas "A web application framework for R" http://shiny.rstudio.com/ , pacotes monstruosos da Microsoft... O que escolher?

R-studio é suficientemente bom - é simplesmente uma interface melhorada sobre a linguagem (qualquer pacote R e add-ons do desenvolvedor). Brilhante é o mesmo pacote R para criar controles, formulários de entrada, todos os tipos de demos web.
Eu não o usei da MS, não posso dizer.
 

Homens!

Se você tem o menor pré-requisito - experiência em programação em qualquer linguagem e algum conhecimento de estatística, então apenas R, e apenas R.

O Matlab não pode ser comparado de forma alguma - é um pacote diferente, e um pacote pago por muito dinheiro.

Os concorrentes de R são SAS e SPSS, mas eles são pacotes pagos e R está começando a ultrapassá-los. Durante 5 anos Matlab ainda estava sendo comparado com R, mas eu não o vejo mais nas últimas revisões - ele foi para o esquecimento.

Atualmente R é o padrão para estatísticas, há um grande número de publicações e, em geral, um movimento muito poderoso.

Por exemplo, um blog muito útil, publicado todos os dias, você pode se inscrever para receber notícias: http://www.r-bloggers.com/

Aqui está um monte de livros por um dinheiro muito razoável: http://www.twirpx.com/search/?query=R. Digitado em uma busca por R. Procura bem em palavras-chave.

Não esqueçamos que R, como uma linguagem de programação algorítmica, é uma das dez principais linguagens e está entre as dez melhores ao lado das variantes C.

Para utilizá-lo, você deve tomar o R habitual com RStudio. Além disso, não esqueçamos que a variante paga de R foi comprada pela Microsoft e começa a promover sua variante - siga os desenvolvimentos.

R-bloggers
R-bloggers
  • xi'an
  • www.r-bloggers.com
In econometric modeling, I usually have a problem with correlated features. A few weeks ago, I was discussing feature selection when features are correlated. This week, I was wondering about... Clustering French Cities (based on Temperatures) In order to illustrate hierarchical clustering techniques and k-means, I did borrow François Husson‘s...
 
СанСаныч Фоменко:

Homens!

Se você tem o menor pré-requisito - experiência em programação em qualquer linguagem e algum conhecimento de estatística, então apenas R, e apenas R.

O Matlab não pode ser comparado de forma alguma - é um pacote diferente, e um pacote pago por muito dinheiro.

Os concorrentes de R são SAS e SPSS, mas eles são pacotes pagos e R está começando a ultrapassá-los. Durante 5 anos Matlab ainda estava sendo comparado com R, mas eu não o vejo mais nas últimas revisões - ele foi para o esquecimento.

Atualmente R é o padrão para estatísticas, há um grande número de publicações e, em geral, um movimento muito poderoso.

Por exemplo, um blog muito útil, publicado todos os dias, você pode se inscrever para receber notícias: http://www.r-bloggers.com/

Aqui está um monte de livros por um dinheiro muito razoável: http://www.twirpx.com/search/?query=R. Digitado em uma busca por R. Procura bem em palavras-chave.

Não esqueçamos que R, como uma linguagem de programação algorítmica, é uma das dez principais linguagens e está entre as dez melhores ao lado das variantes C.

Para utilizá-lo, você deve tomar o R habitual com RStudio. Além disso, não esqueçamos que a variante R paga foi comprada pela Microsoft e está começando a promovê-la.

Bem, é o primeiro dia que estou aprendendo R lentamente, responda minhas perguntas, quero comparar as características de R e Matlab. Mas sem nenhum alarido, de forma equilibrada e calma :).

  1. R é um idioma com capacidades OOP?
  2. Posso criar em R uma dll de 32 bits e 64 bits para uso direto da MQL4/5? Em caso afirmativo, que tamanho de pacote devo instalar para usar tal dll no computador de um usuário?
  3. Posso conectar dlls comuns para acesso direto da R?
  4. Existe um análogo de Simulink em R?
  5. Por que todas as revisões enfatizam que R é um programa de estatísticas? Estou interessado em DSP, R tem pacotes para processamento de sinais digitais?
  6. Existe um formato de armazenamento de dados compacto incorporado em R, similar aos arquivos .mat do Matlab?

 
Alexey Volchanskiy:

Ótimo, é meu primeiro dia de aprendizado R, responda minhas perguntas por favor, quero comparar as possibilidades de R e Matlab. Só que sem qualquer tagarelice, de forma equilibrada e calma :).


  1. Posso conectar bancos de dados comuns para acesso direto da R?

  2. Por que a ênfase em todas as revisões é que R é um programa estatístico? Estou interessado em DSP, R tem pacotes para processamento de sinais digitais?

Sim e sim. Meu colega está se agarrando ao MS SQL.

Sinais: https://cran.r-project.org/web/packages/signal/index.html

Provavelmente também existem outros pacotes semelhantes.

R cresceu a partir de S. Foi originalmente desenvolvido para o processamento de dados estatísticos. Provavelmente, algumas características de idiomas de pleno direito podem estar faltando nele, mas é conveniente fazer pesquisas estatísticas nele. E há muitos (milhares) pacotes de código aberto para processamento e análise de dados.

Até mesmo as últimas tendências em aprendizagem de máquinas - aprendizagem profunda e o sensacional xGBoost- foram agora implementadas.

 
Alexey Burnakov:

Sim e sim. Um colega meu está agarrado ao MS SQL.

Sinais: https://cran.r-project.org/web/packages/signal/index.html

Provavelmente também existem outros pacotes semelhantes.

R cresceu a partir de S. Foi originalmente desenvolvido para o processamento de dados estatísticos. Provavelmente, algumas características de idiomas de pleno direito podem estar faltando nele, mas é conveniente fazer pesquisas estatísticas nele. E há muitos (milhares) pacotes de código aberto para processamento e análise de dados.

Até mesmo as últimas tendências em aprendizagem de máquinas - aprendizagem profunda e o sensacional xGBoost - foram agora implementadas.

Tenho que tentar traduzir alguns de meus programas para o R em Matlab, para comparar a velocidade. Se eu conseguir descobrir isso até o fim de semana, eu o farei e me reportarei. O Matlab é bastante lento, faço muitas coisas em C# ou C++ e o conecto como uma DLL para velocidade.