Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3402

 

Также в датасете оч. много линейно зависимых переменных . Попробуй обучить свою модель на этих очищених данных, там осталось всего 500 признаков от 2400 изначальных. В теории результат должен быть таким же как и с 2400

data <- data.table::fread("D:\\train.csv", sep = ";") |> as.data.frame()
target <- data$Target_100
data <- data[, !(names(data) %in% c("Time", "Target_P", "Target_100", "Target_100_Buy", "Target_100_Sell"))]

bad_colums <- caret::findLinearCombos(data[1:500,])$remove

ncol(data)         # количество всех колонок 2408
length(bad_colums) # кличество линейно зависимых 1908


clear_data <- cbind.data.frame(
                              target, 
                              data[,-bad_colums]
                              )

write.csv(clear_data, "E:\\FX......Setup\\не_избыточный_датасет.csv", row.names = FALSE)
 
mytarmailS #:
Переписал код, код был с ошибками, не доверяй ГПТ это лажа!

В чём ошибки? Результат получился идентичный в случае "без балансировки".

Попробую обучить с вариантом после балансировки.

 
mytarmailS #:
Попробуй обучить свою модель на этих очищених данных

Попробую, только индексы нужны для исключения колонок...

 
Aleksey Vyazmikin #:

В чём ошибки? Результат получился идентичный в случае "без балансировки".

Попробую обучить с вариантом после балансировки.

Ошибки были в тех кодах что я выделял. 
Брало неправильные колонки и не правильные колонки в итоге были записаны в конечный файл
 
mytarmailS #:
Ошибки были в тех кодах что я выделял. 
Брало неправильные колонки и не правильные колонки в итоге были записаны в конечный файл

Видимо Вы про это . Там вообще ничего не было - может синтаксис изменился за пару лет? А так - конечно надо код всегда проверять, если есть возможность.

 
Aleksey Vyazmikin #:

Видимо Вы про это . Там вообще ничего не было - может синтаксис изменился за пару лет? А так - конечно надо код всегда проверять, если есть возможность.

это ссылка на МОЙ вчерашний код.

я про это недоразумение

 
mytarmailS #:

это ссылка на МОЙ вчерашний код.

я про это недоразумение

Это работает корректно.

 
Aleksey Vyazmikin #:

Это работает корректно.

нет

 
Aleksey Vyazmikin #:

Попробую, только индексы нужны для исключения колонок...

data <- data.table::fread("D:\\train.csv", sep = ";") |> as.data.frame()

original_colum_names <- colnames(data)

target <- data$Target_100

data <- data[, !(names(data) %in% c("Time", "Target_P", "Target_100", "Target_100_Buy", "Target_100_Sell"))]

bad_colums <- caret::findLinearCombos(data[1:500,])$remove

good_colums_idx <- which(original_colum_names %in% colnames(data)[-bad_colums])

write.csv(good_colums_idx, "E:\\...\\индексы_колонок.csv", row.names = FALSE)
 
mytarmailS #:

нет

Как "нет" - если результат правильный?

Причина обращения: