Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 968

 
СанСаныч Фоменко:


В программировании очень часто выбирают то, что удобнее, а не то полезнее, функциональное, но поливать, чтобы сделать крайне сомнительный выбор - не надо.

Да какое тут удобство, вот Rattle - опять отказался читать файл для теста модели, при этом смешно, что читает тот на котором строилась модель (если грузить его отдельно), а аналогичный не читает - и не поймешь, что ему не так.

Ну, а у меня пока затык с многопоточностью - памяти катастрофически не хватает. Нашел статью про то, как что-то там преобразовывать, но пользоваться этим так и не понял как толком....

 
Maxim Dmitrievsky:

СанСаныч, источник дистрибутива там только один - сайт питона :)

для статистики и машинного обучения расширение IPython и anaconda. Зайдите в русскоязычное коммьюнити opendatascience или посмотрите ролики от яндекса. Там про R вообще не слышали. Так что считать стандартом? В попробуйте питон, что бы составить свое собственное мнение и сравнить. Плюс знание питона, как вы уже сказали, позволит вам заниматься не только статистикой но и делать другие вещи, при необходимости.

Для определения статистики использования языков имеются другие, более авторитетные источники. Я регулярно привожу сведения из этих источников.

У меня несколько новостных лент по статистики - нигде нет питона, поэтому и стимулов его изучать нет. А вот тексты на R - это регулярно.


Здесь на сайте обо мне сложилось неверное представлении как о поклоннике R. Я не являюсь поклонником какого-либо языка программирования и в частности R, для меня язык программирования -  это инструмент. А вот в организации специализированной, трейдерской тусовки по статистике на этом сайте я очень заинтересован, и из этой заинтересованности вытекает R как "система графики и статистики". И трачу свое время на сайте я на статистику, а R - это абсолютно точное выражение мыслей в этой области, не более. 

 
СанСаныч Фоменко:

Для определения статистики использования языков имеются другие, более авторитетные источники. Я регулярно привожу сведения из этих источников.

У меня несколько новостных лент по статистики - нигде нет питона, поэтому и стимулов его изучать нет. А вот тексты на R - это регулярно.


Здесь на сайте обо мне сложилось неверное представлении как о поклоннике R. Я не являюсь поклонником какого-либо языка программирования и в частности R, для меня язык программирования -  это инструмент. А вот в организации специализированной, трейдерской тусовки по статистике на этом сайте я очень заинтересован, и из этой заинтересованности вытекает R как "система графики и статистики". И трачу свое время на сайте я на статистику, а R - это абсолютно точное выражение мыслей в этой области, не более. 

да не, никакого мнения не сложилось

я просто пишу по своим ощущениям что мне больше понравилось, т.к. вообще не программист и чисто угараю для себя. Поэтому говорю что мне вкатило

и хотелось бы подобный коннектор как у Вас, мб тоже надо будет заказать если буду продолжать. А на самом деле пока что пофиг, т.к. нестационарность статметодами не убивается, как мы тут все уже выяснили, а только божественным провидением и узкоспециализированными стратегиями типа арбитража или ночной торговли

 
Aleksey Vyazmikin:

Да какое тут удобство, вот Rattle - опять отказался читать файл для теста модели, при этом смешно, что читает тот на котором строилась модель (если грузить его отдельно), а аналогичный не читает - и не поймешь, что ему не так.

Ну, а у меня пока затык с многопоточностью - памяти катастрофически не хватает. Нашел статью про то, как что-то там преобразовывать, но пользоваться этим так и не понял как толком....

Как раз последние месяцы постоянно использую rattle - чрезвычайно удобно проверять мысли и никаких проблем. Удобнее всего написать скрипт на R по первоначальной подготовке предикторов, запомнить в .RData, а потом грузить в rattle этот файл .RData.

Многопоточность - это отсюда.  Грузить можно и все ядра и соседние компьютеры.

ПС.

Совет по изучению английского. Учится до идиотизма просто, на основе самодисциплины и первичных знаний грамматики.

0. заготавливаете куски бумаги примерно 4*5 см

1. Берете абзац любого текста и переводите. Каждое новое слово  выписываете на отдельный кусок бумаги: с одной стороны по английски, с другой по русски.

2. Несколько раз в день просматриваете эти куски бумаги с двух сторон: один раз с английской стороны, другой с русской.

3. Делать надо регулярно

4. Через пару недель будете запоминать до 50 слов в день.

5. Всего надо пару тысяч слов для свободного чтения по-английски.


Через пару месяцев проблем с английским не будет и на первый план выйдут проблемы со значением слов хоть по русски, хоть по-английски. 

CRAN Task View: High-Performance and Parallel Computing with R
  • cran.r-project.org
This CRAN task view contains a list of packages, grouped by topic, that are useful for high-performance computing (HPC) with R. In this context, we are defining 'high-performance computing' rather loosely as just about anything related to pushing R a little further: using compiled code, parallel computing (in both explicit and implicit modes...
 
Maxim Dmitrievsky:

, т.к. нестационарность статметодами не убивается, как мы тут все уже выяснили, а только божественным провидением и узкоспециализированными стратегиями типа арбитража или ночной торговли

Если про нестационарность, то огромное количество публикаций, мэинстрим - это GARCH. Везде, от высокочастотников до дневок. 

 
СанСаныч Фоменко:

Если про нестационарность, то огромное количество публикаций, мэинстрим - это GARCH. Везде, от высокочастотников до дневок. 

статьи видел, графики с реала не видел :)

 
Maxim Dmitrievsky:

статьи видел, графики с реала не видел :)

Ну, что Вы.... Попадалась как-то статья по выбору варианта GARCH на всех акциях, входящих в S&P500. 

Думаю, что идеал ТС - это GARCH+МО. Особый интерес в GАRCH - модель отрабатывает гэпы.

 
Maxim Dmitrievsky:

В очередной раз убедился что R не мое :) синтаксис почти не подсвечивается, код не читаемый, ошибки практически не подсвечиваются. Сам код и язык эстетически не приятен

здесь могли быть ваши контраргументы

Да, можно обучить алгоритм в 3 строчки, вместо 5-и на питоне, это все. При этом читаемость на питоне будет лучше. По пакетам с МО не вижу никаких преимуществ, все одно и то же.

Покажите пример. У меня так в Rstudio/ Все подствечивается и настраивается под предпочтения пользователя

#--function-------------------------
evalq({
  import_fun("InformationValue", optimalCutoff, CutOff)
  import_fun("InformationValue", youdensIndex, th_youdens)
  GetThreshold <- function(X, Y, type){
    switch(type,
           half = 0.5,
           med = median(X),
           mce = CutOff(Y, X, "misclasserror"),
           both = CutOff(Y, X,"Both"),
           ones = CutOff(Y, X, "Ones"),
           zeros = CutOff(Y, X, "Zeros")
    )
  }
}, env)

И ошибки мгновенно показываются. 

Кыегвшщ

Я уже не раз просил, пишите скромнее и не давайте оценки тому, что не умеете пользовать.

Учите матчасть.

Удачи

 
Vladimir Perervenko:

Покажите пример. У меня так в Rstudio/ Все подствечивается и настраивается под предпочтения пользователя

И ошибки мгновенно показываются. 

Я уже не раз просил, пишите скромнее и не давайте оценки тому, что не умеете пользовать.

Учите матчасть.

Удачи

бесполезно спорить, на мой вкус этот редактор выглядит уродски при любой цветовой схеме, язык тоже

думаю, вы сами видели код на python, IDE vscode и jupiter notebook

 
Maxim Dmitrievsky:

СанСаныч, источник дистрибутива там только один - сайт питона :)

для статистики и машинного обучения расширение IPython и anaconda. Зайдите в русскоязычное коммьюнити opendatascience или посмотрите ролики от яндекса. Там про R вообще не слышали. Так что считать стандартом? Вы попробуйте питон, что бы составить свое собственное мнение и сравнить. Плюс знание питона, как вы уже сказали, позволит заниматься не только статистикой но и делать другие вещи, при необходимости.

Это тоже интерпретируемый язык, но отлично подсвечивается и проверяет синтаксис на лету а не только после запуска скрипта, + фолдинг кода, блокноты и куча разных плюшек

Глупость на глупости. 

1. Пакеты/модули в Python могут загружаться с помощью pip install  / conda install при этом одноименные пакеты могут вообще не совпадать по содержанию. А этот перл " источник дистрибутива там только один - сайт питона :)" нужно занести в аналы.

2. Ни IPython ни  anaconda не являются расширениями для МО. Первый простой редактор с возможностью выполнения построчного/поблокового кода а Анаконда это система управления пакетами (ну типа репозитория) причем не только Python но и R. 

Если хотите блеснуть знаниями имейте их. Иначе дилетанство проявляется. 

Скромнее.