Интересный факт: в 1912 году итальянский статистик и демограф Коррадо Джини написал знаменитый труд «Вариативность и изменчивость признака», и в этом же году «Титаник» затонул в водах Атлантики. Казалось бы, что общего между этими двумя событиями? Всё просто, их последствия нашли широкое применение в области машинного обучения. И если датасет...
R version 4.0.5 (2021-03-31) -- "Shake and Throw"
Copyright (C) 2021 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()'for distribution details.
R is a collaborative project with many contributors.
Type 'contributors()'for more information and
'citation()' on how to cite R or R packages in publications.
Type 'demo()'for some demos, 'help()'for on-line help, or
'help.start()'for an HTML browser interface to help.
Type 'q()' to quit R.
[Workspace loaded from F:/FX/R/.RData]
Loading required package: Matrix
Error: package or namespace load failed for ‘Matrix’ in getClassDef(class1):
reached elapsed time limit
> source('F:/FX/R/Viborka_Korrelyaciya_v_02.R', echo=TRUE)
> library('caret')
Загрузка требуемого пакета: lattice
Загрузка требуемого пакета: ggplot2
> #way <- "F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\Proboy_236_TP_4_SL_4\\Si\\Setup\\"
> #df1 = read.csv("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\ ..." ... [TRUNCATED]
> df1 = read.csv("D:\\FX\\MT5_CB\\MQL5\\Files\\Po_Vektoru_TP_0_SL_0_G_2_Bi_v2\\EURUSD_0\\Setup\\train.csv", header = TRUE, sep = ";",dec = ".")
> cor.test.range <- seq(from = 0.1,to = 0.9,by = 0.1) # диапазон перебора в коеф корр
> get.findCorrelation <- function(data , not.used.colums , cor.coef){
+ library('caret')
+ df2 <- cor( data[, ! colnames(data) %in% not.use .... [TRUNCATED]
> for(i in1:length(cor.test.range)){
+
+ reduced_Data <- get.findCorrelation(data = df1 ,
+ not.used.co .... [TRUNCATED]
Warning messages:
1: пакет ‘caret’ был собран под R версии 4.1.02: пакет ‘ggplot2’ был собран под R версии 4.1.0
> source('F:/FX/R/Viborka_Korrelyaciya_v_02.R', echo=TRUE)
> library('caret')
> #way <- "F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\Proboy_236_TP_4_SL_4\\Si\\Setup\\"
> #df1 = read.csv("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\ ..." ... [TRUNCATED]
> df1 = read.csv("D:\\FX\\MT5_CB\\MQL5\\Files\\Po_Vektoru_TP_0_SL_0\\EURUSD_0\\Setup\\train.csv", header = TRUE, sep = ";",dec = ".")
> cor.test.range <- seq(from = 0.1,to = 0.9,by = 0.1) # диапазон перебора в коеф корр
> get.findCorrelation <- function(data , not.used.colums , cor.coef){
+ library('caret')
+ df2 <- cor( data[, ! colnames(data) %in% not.use .... [TRUNCATED]
> for(i in1:length(cor.test.range)){
+
+ reduced_Data <- get.findCorrelation(data = df1 ,
+ not.used.co .... [TRUNCATED]
Error in findCorrelation_fast(x = x, cutoff = cutoff, verbose = verbose) :
The correlation matrix has some missing values.
In addition: Warning message:
In cor(data[, !colnames(data) %in% not.used.colums]) :
стандартное отклонение нулевое
这本书怎么样?
https://www.mql5.com/ru/blogs/post/723619
顺便问一下,有谁知道如何计算基尼指数 的根(我知道如何 计算根,但不 知道 基尼指数 本身)?我希望能有一个代码示例。
正如我当时指出的,"基尼指数和基尼系数是两码事--不要混为一谈"。
对于基尼系数,我们使用 GSC,即添加噪音。我在文章后面附上了计算 R 和 PY 的代码。
指数是另外一回事。
顺便问一下,有谁知道如何计算基尼系数 的根(我知道如何 计算根,但不 知道 基尼系数 本身)?我希望能有一个代码示例。
正如我当时指出的,"基尼指数和基尼系数是两码事--不要混为一谈"。
对于基尼系数,我们使用 GSC,即添加噪音。我在文章后面附上了计算 R 和 PY 的代码。
指数是另外一回事。
有基尼系数,也有基尼杂质。前者在二元分类中用作衡量标准。第二种在决策树中用作熵的类似物。
有一次,您制作了一个脚本,我决定再次使用它。
我在一个样本 上运行了这个脚本,结果出现了一个错误--我不知道从哪里可以找到这个错误,也不知道如何解决这个问题--也许你知道,因为你使用了这些库/包?
在二进制样本上一切正常。
你曾经制作过一个脚本,我决定再次使用。
我在一个样本 上运行了这个脚本,结果出现了一个错误--我不知道在哪里可以找到这个错误,也不知道如何解决这个问题--也许你知道,因为你使用了这些库/包?
在二进制样本上一切正常。
我没用过这个书目,我用过一次,我想那只是为了你....。如果你的新数据能与旧数据一起使用,那一定是你做错了什么。
是的,对我来说。它可以使用二进制数据,在我查看之前,它主要是在二进制数据上运行的。可惜他们没有告诉你哪一列/行出了问题。
对我来说是的。它能在二进制下运行,在我查看之前,它主要是在二进制下运行。可惜他们没有告诉你哪一列/行出了问题。
仔细检查您的数据,确保与二进制....。
为什么要匹配二进制?我刚才说了,脚本可以工作,但并不适用于所有数据。
我剪切了样本,并将脚本附在一个单独的存档中。
脚本会从样本中删除相关列,并保存新样本。
列的排除取决于相关性阈值。
为什么它们必须与二进制匹配?我刚说过,脚本可以工作,但并不适用于所有数据。
给你,我不得不重新写了一遍,因为代码太烂了,我不知道它在做什么