İş Gereklilikleri
Необходимо преобразовать скрипт на языке R для вычислений с применением множества GPU, целью является повышение скорости обработки данных.
Скрипт на языке R будет предоставлен соискателям.
Работа скрипта заключается в считывание данных из файла CSV с табличными данными - примерно 15000*500 и генерации на основании этих данные дерева решений. После построение деревьев происходит их оценка и оценка их компонентов (предикторов), после чего происходит генетический отбор и повторное построение деревьев - размер таких итераций регулируется, как и настройки дерева решений (к примеру глубина).
Применяются открытые библиотеки в R:
library(GA) library(MLmetrics) library(rpart) library(memoise) library(rpart.plot)
Рассматривается вариант реализации и на питоне, или на ином языке, который позволит существенно повысить производительность работы скрипта.