Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3374

 
Maxim Kuznetsov #:

Изначально табличные данные:

X; Y ; H ; S ; V ;

Изначально это матрица пикселей, данные не табличные, а однородные. Для НС это хорошо. Тут она побьет бустинг.
 
Maxim Dmitrievsky #:
Изначально это матрица пикселей, данные не табличные, а однородные. Для НС это хорошо. Тут она побьет бустинг.

Дискретные данные представленные в виде таблицы.

Не ТО ?

Тогда я прямо теряюсь...а что такое табличные/не-табличные данные... табличные это линейная метрика и зависимость Y исключительно от X? тогда да, там вообще ниюя не работает, просто таких зверей нет в природе

 
Maxim Kuznetsov #:

Дискретные данные представленные в виде таблицы.

Не ТО ?

Тогда я прямо теряюсь...а что такое табличные/не-табличные данные... табличные это линейная метрика и зависимость Y исключительно от X? тогда да, там вообще ниюя не работает, просто таких зверей нет в природе

Табличные это разнородные, например список работников. Где указан пол, возраст, зряплата и прочее. Еще строки в табличных данных обычно не связаны друг с другом, например если сложить несколько работников, то Оптимус прайм не получится. А если сложить несколько пикселей, то получится.
 
В нашем случае изначальные данные это тайм-серии, а не таблицы. Если не использовать новостной анализ; если использовать, то таблицы.

Значит, в первом случае, подходят как НС так и бустинг, возможно НС лучше, будет зависеть от представления данных. Во втором лучше бустинг.

Так мы научились различать изначальное представление данных и их представление после обработки.
 
Aleksey Nikolayev #:
Если их можно записать в таблицу, но нельзя записать в матрицу)
Ну НС как раз лучше работают на однородных данных. Табличные данные же можно записать в матрицу, если они одного типа.
 
Для табличных данных есть нейронка архитектуры TabNet

Позиционируеться как конкурент бустам.
Я пробовал,  работает хорошо, не скам.. 
 
Есть такие, да. Но для нашей темы нужнее сети для работы с последовательностями, а не таблицами. Потому что они изначально последовательности.
 
Maxim Dmitrievsky #:
Есть такие, да. Но для нашей темы нужнее сети для работы с последовательностями, а не таблицами. Потому что они изначально последовательности.

чёй-то такой настроение...

а можешь доказать что они именно последовательности ? помимо факта очерёдности приёма.

 
Табличные данные как я понял из этой наводки

Это так называемые данные в формате  tidy data Тобишь "аккуратные даные" 

Это таблица где каждая строка это наблюдение, а колонка это признак

 
Maxim Dmitrievsky #:
 темы нужнее сети для работы с последовательностями, а не таблицами. 
Не понял,  последовательности не могут быть в табличном формате?