Обсуждение статьи "Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом" - страница 7

 
Maxim Dmitrievsky

В том ноутбуке только этот блок с кодом выдает ошибку


pr = get_prices(look_back=LOOK_BACK)

pr = add_labels(pr, 10, 25)

rep = tester(pr, MARKUP)

plt.plot(rep)

plt.show() 


ValueError: Cannot set a frame with no defined index and a value that cannot be converted to a Series 

В чем может быть причина?

 
Evgeni Gavrilovi:

В том ноутбуке только этот блок с кодом выдает ошибку


pr = get_prices(look_back=LOOK_BACK)

pr = add_labels(pr, 10, 25)

rep = tester(pr, MARKUP)

plt.plot(rep)

plt.show() 


ValueError: Cannot set a frame with no defined index and a value that cannot be converted to a Series 

В чем может быть причина?

датафрейм пустой

проверьте получены котировки или нет

 
elibrarius:
Вы попробуйте. Недолго ведь. Неужели не интересно проверить в эксперименте? Брейман же не сделал этого в своем случайном лесе.

это медленно. Попробую потом.

 
Maxim Dmitrievsky:

это медленно. Попробую потом.

Будет интересно узнать результат. Думаю можно тестовую еще пополам разделить, половину для теста и половину для экзамена. Ну или добавить пару лет.
 
Maxim Dmitrievsky:

датафрейм пустой

проверьте получены котировки или нет

точно, не обратил внимание, что у брокера у пары евробакс в конце ещё буква "m" есть - EURUSDm

 
elibrarius:
Будет интересно узнать результат. Думаю можно тестовую еще пополам разделить, половину для теста и половину для экзамена. Ну или добавить пару лет.

я делал подобное раньше, стакал леса. Собственно, ничего прекрасного это не дало.

В данном случае тоже сомневаюсь. Но потом проверю.

 
Maxim Dmitrievsky:

я делал подобное раньше, стакал леса. Собственно, ничего прекрасного это не дало.

В данном случае тоже сомневаюсь. Но потом проверю.

Согласен, в лесе изначально усреднение лучших результатов. Но проверить не мешает)

 
Valeriy Yastremskiy:

Согласен, в лесе изначально усреднение лучших результатов. Но проверить не мешает)

Нет, всех.

И называется случайный лес, потому что все случайные деревья суммируются.
Для лучших назвали бы не случайным, а лучшим лесом. )))

 
elibrarius:

Нет, всех.

И называется случайный лес, потому что все случайные деревья суммируются.
Для лучших назвали бы не случайным, а лучшим лесом. )))

Видимо у нас разные представления о рандом бустинг. Решающее дерево, это про отобранные признаки из случайного набора. Смысл, что наборы случайны, но выбор / кластеризация на плохие хорошие изначально была. Это как иголку бросать, углы мерять и число Пи вычислять)

из вики

  1. Построим решающее дерево, классифицирующее образцы данной подвыборки, причём в ходе создания очередного узла дерева будем выбирать набор признаков, на основе которых производится разбиение (не из всех M признаков, а лишь из m случайно выбранных). Выбор наилучшего из этих m признаков может осуществляться различными способами. В оригинальном коде Бреймана используется критерий Джини, применяющийся также в алгоритме построения решающих деревьев CART. В некоторых реализациях алгоритма вместо него используется критерий прироста информации. [3]
 
Valeriy Yastremskiy:

Видимо у нас разные представления о рандом бустинг. Решающее дерево, это про отобранные признаки из случайного набора. Смысл, что наборы случайны, но выбор / кластеризация на плохие хорошие изначально была. Это как иголку бросать, углы мерять и число Пи вычислять)

из вики

  1. Построим решающее дерево, классифицирующее образцы данной подвыборки, причём в ходе создания очередного узла дерева будем выбирать набор признаков, на основе которых производится разбиение (не из всех M признаков, а лишь из m случайно выбранных). Выбор наилучшего из этих m признаков может осуществляться различными способами. В оригинальном коде Бреймана используется критерий Джини, применяющийся также в алгоритме построения решающих деревьев CART. В некоторых реализациях алгоритма вместо него используется критерий прироста информации. [3]

Да, деревьев много, но каждое пытается обучиться наилучшим образом на разных признаках. Это не то же самое, что объединять несколько лесов (в т.ч. и плохих)