Предсказание рынка на основе макроэкономических показателей - страница 8

 
Замена регрессии одной прямой на регрессию двумя прямыми, одну для положительных значений входа и другую для отрицательных, особых преимуществ не показала. Попытка предесказать GDP вместо S&P500 привела к меньшей СКО предсказаний, но оптимальное количество входов по прежнему 1. То есть добавление второго и третьего предсказателей всегда ведёт к увеличению СКО предскзазаний. Мне это не нравится. Хотелось бы увидеть модель с большим количеством переменных. Так что поиск моделей, данных и их преобразований продолжается. Обманывать себя выборкой предсказателей на основе всей истории и предсказаниями по той же истории выбранными предсказателями не хочется. Насущая задача сейчас это как выбрать предсказатели имея в наличии только историю до предсказываемой дате. Может реальность действительно ограничивает выбор только одного предсказателя.
 
gpwr:
Замена регрессии одной прямой на регрессию двумя прямыми, одну для положительных значений входа и другую для отрицательных, особых преимуществ не показала. Попытка предесказать GDP вместо S&P500 привела к меньшей СКО предсказаний, но оптимальное количество входов по прежнему 1. То есть добавление второго и третьего предсказателей всегда ведёт к увеличению СКО предскзазаний. Мне это не нравится. Хотелось бы увидеть модель с большим количеством переменных. Так что поиск моделей, данных и их преобразований продолжается.

увеличение количества переменных вполне естественно увеличивает общую дисперсию

оптимальное количество предикторов от 5 до 8 (имхо) 

 

Доу-Джонс и трех месячная процентная  ставка LIBOR по доллару. Странно учебники гласят, когда ставку повышают рынок падает, а тут наоборот.

Впрочем сильной корреляции не особо видно. 

 P.S. Кто подскажет, где взять данные по процентным ставкам раньше 1986 года и цены(не доходности) на трежерис старее 2007 года?

 
forexman77:

Доу-Джонс и трех месячная процентная  ставка LIBOR по доллару. Странно учебники гласят, когда ставку повышают рынок падает, а тут наоборот.

Впрочем сильной корреляции не особо видно. 

 P.S. Кто подскажет, где взять данные по процентным ставкам раньше 1986 года и цены(не доходности) на трежерис старее 2007 года?

http://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/Historic-LongTerm-Rate-Data-Visualization.aspx

но правда сильно неудобно сделано ((( 

 
transcendreamer:

http://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/Historic-LongTerm-Rate-Data-Visualization.aspx

но правда сильно неудобно сделано ((( 

сорри, там только ставки
цены нашлись здесь но только помесячно
http://www.investing.com/rates-bonds/us-10-yr-t-note-historical-data 

 
gpwr:
Замена регрессии одной прямой на регрессию двумя прямыми, одну для положительных значений входа и другую для отрицательных, особых преимуществ не показала. Попытка предесказать GDP вместо S&P500 привела к меньшей СКО предсказаний, но оптимальное количество входов по прежнему 1. То есть добавление второго и третьего предсказателей всегда ведёт к увеличению СКО предскзазаний. Мне это не нравится. Хотелось бы увидеть модель с большим количеством переменных. Так что поиск моделей, данных и их преобразований продолжается. Обманывать себя выборкой предсказателей на основе всей истории и предсказаниями по той же истории выбранными предсказателями не хочется. Насущая задача сейчас это как выбрать предсказатели имея в наличии только историю до предсказываемой дате. Может реальность действительно ограничивает выбор только одного предсказателя.

Не понимаю, почему не RAttle - используете какие-то убогие, а главное, ограниченные модели.

У меня предложение.

Скиньте цсв.файл с наименованием колонок. Укажите, какую (какие) колонки следует использовать в качестве целевых переменных. Естественно, что строка таблицы должна относиться к одному моменту времени.

Я загоню в Rattle и с Вашего разрешения выложу здесь результат по 6 очень приличным моделям.  

 

ПС.

Линейные регрессии на финансовых рядах..... более, чем сомнительно.  

 
transcendreamer:

сорри, там только ставки
цены нашлись здесь но только помесячно
http://www.investing.com/rates-bonds/us-10-yr-t-note-historical-data 

Спасибо! Дневные данные судя по графику на сайте с 2013 года. 

 
faa1947:


Линейные регрессии на финансовых рядах..... более, чем сомнительно.  

ну почему же, в качестве простых моделей вполне пригодно
конечно не так универсально как нейросети но все таки
часто наблюдал что если регрессия на дает хорошего качества модели то и другие оптимизаторы не дают

 
transcendreamer:

ну почему же, в качестве простых моделей вполне пригодно
конечно не так универсально как нейросети но все таки
часто наблюдал что если регрессия на дает хорошего качества модели то и другие оптимизаторы не дают

Да, ладно...

Регрессионные модели практически  не применимы на финансовых данных. Получаете цифры, верите им, а то, что цифры, которые вы видите вообще не существует, то для понимания этого не хватает знаний - игра в цифирь.  

 

Но мое дело предложить... А там дело хозяйское... 

 

ПС.

Нейросети дают не самые хорошие результаты. Есть другие модели, и результат лучше и внутренняя структура поддается интерпретации. 

 
faa1947:

Да, ладно...

Регрессионные модели практически  не применимы на финансовых данных. Получаете цифры, верите им, а то, что цифры, которые вы видите вообще не существует, то для понимания этого не хватает знаний - игра в цифирь.  

 

Но мое дело предложить... А там дело хозяйское... 

 

ПС.

Нейросети дают не самые хорошие результаты. Есть другие модели, и результат лучше и внутренняя структура поддается интерпретации. 


я все-таки не соглашусь - регрессия прекрасно работает с любыми данными, не обязательно что лучше других методов, но все таки достаточно хорошо особенно если учесть крайнюю нетребовательность к вычислительным ресурсам 

 

обычно перед регрессией рекомендуют логарифмировать или брать дельты - но это убивает трендовую информацию! - может быть поэтому скепсис к регрессии?

предварительная нормализация может портить данные, это нужно делать очень осторожно

 

я согласен что модель должна иметь "физический" смысл... и чем сложнее модель, тем более она отрывается от "физической" интерпретации, в любой сложной модели коэффициенты абстрактны (если это не соответствует лотам например или номерам наблюдений/баров, множители для расчета волатильности или что-то подобное), нейросети - абстрактны, случайные леса - тоже, что еще? генетика? тоже абстрактная модель

в регрессии обычно коэффициенты интерпретируют как силу связи/влияния того или иного фактора и это достаточно логично, если посчитать сумму модулей коэффициентов и рассчитать долю коэффициента в сумме - это будет уровень значимости влияния переменной

конечно не всегда это можно выразить через экономические термины (в этом случае нужно строить предметную модель, этим цифирям можно верить, но это уже совсем другой уровень) например если анализируется связь фондового индекса и макроэкономической статистики то будет что-то вроде "% роста индекса к % роста показателя" или например прямой связи остатков на счетах ЦБ и каким-нибудь курсом нет, но модель может показать что есть, не факт что эта связь объективна (что остатки как-то влияют на курс или наоборот) но модель указывает на синхронность изменений, значит есть какая-то общая причина, которая может быть даже не включена в модель, возможно это даже не поддается измерению, но тем не менее можно исследовать косвенную связь

а если в модели только торгуемые инструменты то можно пересчитать коэффициенты в лоты - более чем физическая интерпретация