Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3253
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
На малых ТФ переполняться память. Забивается 16 озу и файл подкачки (своп на маке) 30гиг. Ну там матрица корреляционная 50к на 50к размером, например.
зачем там кореляционная матрица вообще нужна можешь обяснить?
есть паттерн , есть масив истории с которой можно паттерн сравнить, в чем проблема вообще?
зачем там кореляционная матрица вообще нужна можешь обяснить?
есть паттерн , есть масив истории с которой можно паттерн сравнить, в чем проблема вообще?
нет паттерна, паттерны ищутся по корр. матрице
через SQL эффективно будет считать?
никогда в жизни
....
пробуй apache Arrow или DuckDB
но всеравно оперативка это самый быстрый способ.
.....
Тут сама задача через Ж..у решаеться , твоя проблема это кор. матрица которая нафиг не нужна
В алглибе есть ф-я расчета корелляции double. Думаю можно просто поменять все переменные на char/uchar и все будет работать.Там еще с десяток используемых функций тоже надо переделать. И от CMatrixDouble перейти к динамическим массивам или как то по другому.
//| INPUT PARAMETERS: |
//| X - array[N,M], sample matrix: |
//| * J-th column corresponds to J-th variable |
//| * I-th row corresponds to I-th observation |
//| N - N>=0, number of observations: |
//| * if given, only leading N rows of X are used |
//| * if not given, automatically determined from input |
//| size |
//| M - M>0, number of variables: |
//| * if given, only leading M columns of X are used |
//| * if not given, automatically determined from input |
//| size |
//| OUTPUT PARAMETERS: |
//| C - array[M,M], correlation matrix (zero if N=0 or N=1) |
//+------------------------------------------------------------------+
static bool CBaseStat::PearsonCorrM(const CMatrixDouble &cx,const int n,
const int m,CMatrixDouble &c)
И если у вас самоделка - то и квантизацию надо будет делать, если нет готового пакета, который ее делает.
вроде тупанул.. через нампай очень быстро считает ) через панда долго и памятозатратно. Позже все перепроверю.
нет паттерна, паттерны ищутся по корр. матрице
может я чего то не понимаю...
может я чего то не понимаю...
Паттерн = весь набор семплов с высокой корреляцией между друг другом
Таких паттернов может быть много во всем датасете, у каждого разное количество совпадений на истории
без матрицы ты ничего не найдешь, либо фрагментарно выберешь часть, а я считаю все возможные варианты
то есть тебе надо взять каждую строку и посчитать корреляцию со всеми остальными, получается матрицаПаттерн = весь набор семплов с высокой корреляцией между друг другом
Таких наборов может быть много во всем датасете
без матрицы ты ничего не найдешь, либо фрагментарно выберешь часть, а я считаю все возможные варианты
то есть тебе надо взять каждую строку и посчитать корреляцию со всеми остальными, получается матрицаВ общем то это похоже на кластеризацию.
Тут максимизируется похожесть примеров.
Классификация/регрессия в деревьях максимизируют похожесть будущего этих примеров. Похожесть прошлого от этого ухудшается.
Тоже делал подобное давно, сейчас с новыми мыслями переделываю
Паттерн = весь набор семплов с высокой корреляцией между друг другом
Таких паттернов может быть много во всем датасете, у каждого разное количество совпадений на истории
без матрицы ты ничего не найдешь, либо фрагментарно выберешь часть, а я считаю все возможные варианты
то есть тебе надо взять каждую строку и посчитать корреляцию со всеми остальными, получается матрицаЕсть у нас какие то трех мерные данные
строка это наблюдение , колонка это признак.
первая строка это типа последние данные
можно посчитать корреляцию последней строки с каждой
И мы получим этот "рисунок сходства" между последней/текущей строкой и историей
Можно сделать кластеризацию и тоже получить что то подобное
но зачем считать абсоютно всю кореляционную матрицу, если нам надо только состояние дел относительно текущей/последней строки я не понимаю
В чем тут глубина мысли?
В том что мы сразу все паттерны найдем?, а нам нужны все? или нам нужно то что соответствует текущей ситуации те последнему наблюдению
Есть у нас какие то трех мерные данные
строка это наблюдение , колонка это признак.
первая строка это типа последние данные
можно посчитать корреляцию с последней строки с каждой
И мы получим этот "рисунок сходства" между последней/текущей строкой и историей
Можно сделать кластеризацию и тоже получить что то подобное
но зачем считать абсоютно всю кореляционную матрицу, если нам надо только состояние дел относительно текущей/последней строки я не понимаю
В чем тут глубина мысли?
В том что мы сразу все паттерны найдем, а нам нужны все или нам нужно то что соответствует текущей ситуации те последнему наблюдению
нет никакого текущего, это просто поиск на истории
потом сортируешь паттерны по своим метрикам, лучшие зашиваешь в бота