Регрессионная модель Султонова (РМС) - претендующая на математическую модель рынка. - страница 46

Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Не имеет значения. Метод решения уравнения на решение, если оно существует и единственно, не влияет, если же приемлемых решений много и у Юсуфа это локальный минимум, то лучше генетика или пчелы. Для лобового решения вручную - просто воспользуйтесь тестером: генетический алгоритм Вам поможет.
Есть опасность скатиться к подгонке - при таком количестве варьируемых параметров нужно брать больше примеров для оптимизации.
И еще одно замечание - Вы не знаете период выборки на котором производился поиск коэффициентов. Если этот период совпал с периодом роста баланса на графике, то, увы, не все так радужно.
Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:
F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)
Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:
Получили очень важные сведения о характере изменения цены:
1. Наиболее значимыми для формирования цены будущего бара являются цены закрытия текущего бара С;
2. Вторым по значимости следуют цены L, что указывает на значительную силу медведей по отношении к быкам;
3. Затем по значимости стоят цены открытия O;
4. Малозначимость цен H указывает на то, что маловероятно значительное движение цены вверх.
Вывод: на ближайшую перспективу предпочтительнее СЕЛЛ.
Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:
F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)
Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:
Совершенно не понимаю как оцениваются коэффициенты регрессии.
Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.
Dependent Variable: F
Method: Panel Least Squares
Date: 12/02/12 Time: 10:26
Sample: 1 50
Periods included: 23
Cross-sections included: 3
Total panel (unbalanced) observations: 47
F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)
Coefficient Std. Error t-Statistic Prob.
C(1) 0.114716 0.046286 2.478392 0.0173
C(2) -0.051038 0.156544 -0.326030 0.7460
C(3) -0.343986 0.179835 -1.912786 0.0626
C(4) 0.139395 0.190961 0.729968 0.4695
C(5) 1.163942 0.207562 5.607671 0.0000
R-squared 0.947458 Mean dependent var 1.247037
Adjusted R-squared 0.942454 S.D. dependent var 0.002839
S.E. of regression 0.000681 Akaike info criterion -11.64578
Sum squared resid 1.95E-05 Schwarz criterion -11.44895
Log likelihood 278.6757 Hannan-Quinn criter. -11.57171
F-statistic 189.3409 Durbin-Watson stat 1.935322
Prob(F-statistic) 0.000000
Вот график
Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 2000 баров.
Dependent Variable: F
Method: Panel Least Squares
Date: 12/02/12 Time: 10:29
Sample: 1 2000
Periods included: 23
Cross-sections included: 85
Total panel (unbalanced) observations: 1915
F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)
Coefficient Std. Error t-Statistic Prob.
C(1) 0.000190 0.000729 0.260526 0.7945
C(2) 0.026179 0.029181 0.897122 0.3698
C(3) -0.020055 0.028992 -0.691745 0.4892
C(4) -0.106262 0.032127 -3.307569 0.0010
C(5) 1.099945 0.031672 34.72901 0.0000
R-squared 0.999362 Mean dependent var 1.259869
Adjusted R-squared 0.999361 S.D. dependent var 0.031014
S.E. of regression 0.000784 Akaike info criterion -11.46178
Sum squared resid 0.001174 Schwarz criterion -11.44727
Log likelihood 10979.66 Hannan-Quinn criter. -11.45644
F-statistic 748391.1 Durbin-Watson stat 2.058272
Prob(F-statistic) 0.000000
При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!
Извини, Юсуф, но это очередной велосипед. Любой учебник по регрессионному анализу начинается с уравнение, подобных твоему. Но в отличие от тебя студенты умеют оценивать результат подгонки - любой из них скажет, что указанной регрессией пользоваться нельзя.
Совершенно не понимаю как оцениваются коэффициенты регрессии.
Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.
При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!
Приведите, пожалуйста, вид исследуемого Вами уравнения регрессии.
Оно указано в посте. Вот копия:
F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)
Для 50 баров вот с коэф.
F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)
Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.
Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим?
Оно указано в посте. Вот копия:
F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)
Для 50 баров вот с коэф.
F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)
Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.
Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим?
По определению, МНК дает наилучшую оценку коэффициентов рассматриваемого уравнения и если они Вам не нравятся по какой-либо причине, ищите другой способ их оценки или меняйте вид уравнения. Вот стандартный подход при исследовании явлений и процессов. Если уравнение регрессии с найденными методом МНК обеспечивают относительную ошибку менее 1% (0,29% в данном случае), то я что еще хочу от этих коэффициентов? Вы зациклились с проблемой надежности коэффициентов, более надежного способа их определения, чем МНК, еще не придумали. Тем не менее, мы должны отдавать себе отчет, что любые наши рассуждения и выводы верны только в пределах рассматриваемой выборки и нет гарантии, что вне ее, включая и будущее, они останутся верными. Но, вынуждены, с определенной доли вероятности, допустить их применимость в ближайшее время. Абсолютно точно предсказать будущее не способен никто и ничто.
Вы почему-то не вникли в отчет по подгонке регрессии. В последней разные коэф имеют разную точность вычисления. Наилучшая 3%. Но есть и кратно превосходящие номинал.
Я ни на чем не зацикливаюсь. Просто стандартно шурую при оценке регрессии. Во всяком величины коэф не привожу без их оценки.
На счет МНК. Хочу Вас разочаровать. МНК не единственный метод, более того, метод с большим числом ограничений. Есть другие методы, не имеющих таких ограничений.
Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:
F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)
Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:
Эти 15 дневных баров - какие брали даты?
Использованы данные на Д1 с 16. 09. 12 по 05. 10. 12
))))Ну я так и подумал:
1. у вас не однородная данные. В модель включены данные, характеризующие 24-х часовую динамику цены, и данные, характеризующие 4-х часовую динамику цены. Данные за воскресенье надо убирать. Это ошибку делают все.
2. у вас должно быть оптимальное количество наблюдений. Четкой формулы тут нет, но это где то от 5 до 10 наблюдений на одну переменную. У вас четыре переменные и пятнадцать наблюдений. Модель неадекватна. И не надо делать так, как делал один великий специалист на этом форуме - брать модель из четырех переменных и 5 000 наблюдений!))))
3. когда построили модель, определяете частные коеффициенты корреляции для каждой переменной. И у вас окажется, что статистически значимой является только С. Строите модель, включающую только С и коэффициент перед С будет положительный.
Из этого делаете вывод, общий для ВСЕХ моделей авторегрессии - ЕСЛИ ЦЕНА РОСЛА, ТО С БОЛЬШЕЙ ВЕРОЯТНОСТЬЮ РОСТ ПРОДОЛЖИТСЯ В БУДУЩЕМ И НАОБОРОТ. Потом выкидываете модель.