я хоть и говорю о R, однако мой скилл вери смолл)) кто-то может проверить правильность кода?

если код верен, то можете проверить бенчмарк?

Код ошибочен.

Вы же замерили время компиляции функции, а не ее исполнение:

The function cmpfun compiles the body of a closure and returns a new closure with the same formals and the body replaced by the compiled body expression.

Доказательство ошибочности:

> library(microbenchmark)
> library(compiler)
> n <- 2000
> k <- seq(0,n,by=20)
> qqq<- function(xx) { a <- dbinom(k, n, pi/10, log = TRUE) }
> res <- microbenchmark(cmpfun(qqq))
> a
Ошибка: объект 'a' не найден

Если бы  во время бенчмарка запускалась функция qqq, то объект a получил бы расчитанные данные. Но вместо этого оказалось, что объект даже не был создан.

В результате бенчмарк посчитал время компиляции, а не время исполнения. В моем коде все верно - бенчмарк считает фактическое время исполнения и объект a создается с правильными данными.

И да, компиляция - достаточно затратный процесс: он в миллисекундах показан вместо микросекунд

> print(res)
Unit: milliseconds
        expr      min       lq     mean   median       uq      max neval
 cmpfun(qqq) 1.741577 1.783867 1.856366 1.812613 1.853096 2.697548   100

Ну и отдельный прикол, как вы в своем примере переопределили системную функцию q() - quit.

Выйти из R нельзя было никак :)


Я к тому что mql компилятор во время компиляции уже знает все входные параметры. Ему достаточно во время компиляции всё посчитать, а при вызове скрипта - он просто возвращает уже заранее посчитанный результат. Видел какие-то статьи на хабре где сравнивали компиляторы на c++, там судя по анализу ассемблерного кода именно так происходит.

Да, может и активно этим пользуется. Вот примеры: https://www.mql5.com/ru/forum/58241

Но в данном случае это не пройдет - считать надо в полный рост из-за сложности, цикла и заполнения массива.


если код верен, то можете проверить бенчмарк?

Нужно res <- microbenchmark(cmpfun(q)) заменить на res <- microbenchmark(q()). Но уже ранее скомпилированные библиотеки в байткод не перекомпилятся, у меня резульаты остались теже.


Renat Fatkhullin:
qqq<- function(xx) { a <- dbinom(k, n, pi/10, log = TRUE) }

"a" в таком случае будет локальной переменной, недоступной за пределами самой функции в любом случае. Но можно сделать так -
a <<- dbinom(k, n, pi/10, log = TRUE)
тогда она будет таки глобальной


Renat Fatkhullin:

Но в данном случае это не пройдет - считать надо в полный рост из-за сложности, цикла и заполнения массива.

понятно, скорость выполнения отличная тогда


Кстати, интерпретировать примитивный вызов a <- dbinom(k, n, pi/10, log = TRUE) с прямым проваливанием в ядро R с нативным исполнением (dbinom находится в r.dll) практически не стоит ничего.

Так что попытки скомпилировать этот вызов заведомо бесполезны.


Так как я много раз писал о быстродействии R, то позвольте вставить свои пять копеек.


Уважаемый Ренат!

Ваш пример вообще не о чем!

Вы взяли две аналогичные функции и делаете вывод вообще о быстродействии R.

Функции, которые Вы привели, вообще не отображают мощь и многообразие R.

Сравнивать надо вычислительно емкие операции.

Например, перемножение матриц...

Давайте померяем выражение на R

с <- a*b,

где a и b матрицы размером хотя бы 100*100. При этом Вы в своем коде проследите, чтобы R использовал MKL Intel. А это достигается просто установкой соответствующей версии R.



Если мы посмотрим на R, то горы кода, содержащего вычислительно емкие операции. Для их исполнения используются библиотеки, которые на данный момент максимальную эффективность.

И полезность Rв трейдинге не в функциях,которые Вы переписали (хотя они также необходимы), а в моделях. В одном из ответов Вам я упоминал пакет caret. Посмотрите, что это такое.... Вот реализация какой-либо практически полезной торговой модели  в рамках этого пакета и на мкл и даст ответ


Кроме этого следует не забывать, что загрузка всех ядер компа - это рутина для R. Кроме этого можно загрузить соседние компы в локальной сети.  



Для меня является сомнительной идея сравнения быстродействия МКЛ и R: эти две системы имеют совершенно разные предметные области 


СанСаныч, все проверим и выпустим бенчмарк. Но сначала допишем функционал.

Тест был обоснован и он сразу вскрыл проблему. Теоретическое обоснование я представил и уверен, что системный оверхед у R сохранится по подавляющему объему функционала.

Матрицы и мы перемножить можем так, что и Интел проиграет. Это давно уже не rocket science, а Интел(вернее, такие же сторонние программисты в рамках принадлежности к компании) не чемпион в мифическом знании своих процессоров.

СанСаныч Фоменко:

Так как я много раз писал о быстродействии R, то позвольте вставить свои пять копеек.


Сан-Санычу и другим ребятам.

Сан-Саныч, Вы же знаете как я Вас уважаю ... ((С) Катаев и Файнзильберг, известные как "Ильф и Петров"), несмотря на некоторые Ваши пост-советские приколы тут.

Позвольте я Вам поясню кое-что важное:

1). Основная работа программиста - это не писать программы, а ЧИТАТЬ программы, в частности свою. Любой программист 95...99% своего времени сидит и пялится в монитор. Разве он ПИШЕТ программу? Нет, он её в основном ЧИТАЕТ. Поэтому чем ближе к естественному языку будет то, что он читает на экране, то есть к тому, чему его учили мама, папа, бабушка, учительница в школе, - тем эффективнее он будет расшифровывать эти языко-пободные кракозябры на экране и втыкать соответствие между алгоритмом и своей программой.

2). Для целей пункта (1) нет ничего лучше в среднем, чем язык Си.  именно поэтому, например мне лично (а также 2-3 ответственных, и не очень, человека) удалось написать проект объёмом в 700+ подпрограмм, на Си, MQL4, CUDA.... И всё работает.

3). С точки зрения пункта (1) объектно-ориентированный вариант Си, то есть Си++ намного хуже. (Но об этом в другой раз).

4). Полная совместимость классического Си и MQL4 просто бесценна. Перенос процедуры туда-обратно занимает полминуты.

5). Основное достоинство Си+MQL4 - это CLARITY. То есть понятность и прозрачность всего, что есть на экране у программиста.

Если сравнить Си-MQL4 с этой Вашей R, то здесь надо смотреть не на скорость и объём понаписанного кода, а на CLARITY текста. То есть на его понятность. Иначе программист будет сутками пялиться на экран, в тщетных попытках понять, что делает прога, какие у неё там параметры, почему автор их так назвал,  и вообще почему программер сделал именно так, а не иначе. Тут не скорость программы важна, а правильность её работы, и скорость ЕЁ ПРИМЕНИМОСТИ у конечного программиста.

С этой точки зрения то, что сделали Метаквоты - конечно огромная поддержка тем, кто захочет вставить статистику в свои советники. Тут даже нечего сравнивать по степени простоты и понятности функций. А это важно. Особенно если у Вас тонкие расчёты (а Форекс и трейдинг вообще требует тонких расчётов).

Давайте сравним.

Вот как выглядит на Си - MQL4 функция интегрирования:

//                                                                                                                                                      |
//               Integral_Simpson_3_Points_Lite ()                                      |
#define FACTOR_1_3      (1.0 / 3.0)

double Integral_Simpson_3_Points_Lite
   double       & Price_Array[],
   int          Period_Param,
   int          Last_Bar
        double  Sum, Sum_Full_Cycles, Sum_Tail, Sum_Total;
        int             i, j;
        int             Quant;
        int             Full_Cycles;
        int             Tail_Limit;
        int             Tail_Start;

        if (Last_Bar < 0)
                Last_Bar = 0;
        if (Period_Param <= 1)
                return (0.0);
        if (Period_Param == 2)
                return (0.5 * (Price_Array[Last_Bar] + Price_Array[Last_Bar + 1]));
        Quant = 3;
        Full_Cycles = (Period_Param - 1) / (Quant - 1);
        Tail_Start = Full_Cycles * (Quant - 1);
        Tail_Limit = Period_Param - Tail_Start;
        j = Last_Bar;

        Sum = 0.0;
        for (i = 0; i < Full_Cycles; i ++)
                Sum += Price_Array[j];
                Sum += 4.0 * Price_Array[j + 1];
                Sum += Price_Array[j + 2];
                j = j + (Quant - 1);
        Sum_Full_Cycles = Sum * FACTOR_1_3;
        Sum_Tail = Integral_Trapezoid_Lite (Price_Array,
                                            Last_Bar + Tail_Start);
        Sum_Total = Sum_Full_Cycles + Sum_Tail;
        return (Sum_Total) ;


Буду писать частями, так легче писать.

Там есть внутри функция интегрирования трапецией:

//                                                                                                                                                      |
//               Integral_Trapezoid_Lite ()                                                     |
double Integral_Trapezoid_Lite
   double       & Price_Array[],
   int          Period_Param,
   int          Last_Bar
        double  Sum;
        int             i;
        int             Price_Index ;
        if (Last_Bar < 0)
                Last_Bar = 0;
        if (Period_Param <= 1)
                return (0.0);
        if (Period_Param == 2)
                return (0.5 * (Price_Array[Last_Bar] + Price_Array[Last_Bar + 1]));
        Sum = 0.0;
        for (i = 0; i < Period_Param; i++)
                Price_Index = Last_Bar + i;
                if (Price_Index < 0)
                if ((i == 0) || (i == (Period_Param - 1)))
                        Sum = Sum + Price_Array[i] * 0.5;
                        Sum = Sum + Price_Array[i];
        return (Sum) ;

Всё абсолютно ясно и понятно. И что важно, это работает всегда и работает хорошо, то есть с низкой погрешностью даже в MT4-MQL4, что экономит кучу времени.

Но если Вы захотите узнать почему у Вас вылазят непонятные погрешности при работе в R, или если Вы просто захотите разобраться какие там параметры в процедуре интегрирования или какой именно метод интегрирования они там запрограммировали, то Вы увидите следующее (прости Господи меня за выкладывание такого - незрелым отрокам программирования):


Это только заголовок функции, изначально написанной на Фортране. Основной текст будет позже. Это оригинал программы, которая используется в пакете R для интегрирования.

Что здесь можно понять, скажите мне?

