Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1921

 
mytarmailS:

Não entendo, queres que os pró-formas resultantes das regras sejam transferidos para a Mcule?

Claro, senão como aplicaria o modelo depois? :)

 
Aleksey Vyazmikin:

Claro, senão como aplicaria o modelo mais tarde? :)

)))))) bem reescrever todos os algoritmos com R em µl e depois obter todas as transformações em regras em µl ))

 
mytarmailS:

)))))) bem reescrever todos os algoritmos com R em µl e depois obter todas as transformações em regras em µl ))

Percebeu que este tipo de clustering não cria regras que possam reproduzir o resultado sem repetir o clustering. E o agrupamento é muito lento. Portanto, precisamos criar regras através da construção de árvores, que dividirão os resultados do agrupamento em classes apropriadas de acordo com alguns atributos.

Então a questão permanece - como salvar em csv pertencente a cada classe?


Embora seja estranho, por que não continuar agrupando com dados já existentes e definir nova string em uma das classes, ou é possível?

 
Tenho tido dificuldades - percebo que poderia salvar o mapa de agrupamento e continuar com o trabalho, mas não consigo perceber como. Mas eu encontrei um livro sobre R.
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
Aqui está o que eu encontrei aqui.

1. Não é imediatamente claro como lidar com objectos kmeans. A coisa mais fácil a fazer é anexá-lo ao seu quadro de dados:
 k = kmeans(data, centers = 7)
 data = k$cluster
Agora você tem o número do cluster como uma coluna em data.frame. Salve, no entanto você salvaria o data.frame.

2. Study Value help(kmeans), Centres lhe dirá onde fica o centro do meio. Para os dados recebidos, calcule a que centro está mais próximo. Exemplo:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

E eu não entendo como enrolar os resultados em uma coluna em particular?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

Esta imagem mostra os mesmos preditores de antes, mas o tamanho da amostra é diferente e, mais importante, foram adicionados novos preditores.

E é assim que se interpreta - a propensão para o excesso de treino?

 

Eu vou ajustar elegantemente qualquer curva usando o agrupamento. Contato

O porquê de um algoritmo tão grosseiro começar a verter sobre novos dados quase imediatamente ultrapassa-me

Eu culpo a árvore da reciclagem. Eu quero usar boosta, mas não pode ser transferido rapidamente para o mql.

 

Aqui está a resposta.

se você treinar um modelo por um período de tempo e depois olhar acuras nos dados para outro (recém agrupado), então para a árvore que será:

TRAIN DATA:  1.0   0.8541666666666666
NEW DATA:  0.1 8323586744639375 Fuuuuuuu

trane é o conjunto de dados de formação + conjunto de dados de validação

novo conjunto de dados são geralmente novos dados sobre novos clusters. Embora a árvore tenha funcionado bem na validação, mas nas novas é um fiasco.


Veja catbust sobre os mesmos dados:

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:  0.8528265107212476

Qual é a diferença?

não sabes o que se passa até o verificares passo a passo.

Eu estava certo em culpar a árvore. Pensei que podia lidar com uma tarefa tão simples, mas não.

a analisar o busto do gato...

 
Maxim Dmitrievsky:

Aqui está a resposta.

se você treinar um modelo por um período de tempo e depois olhar acuras nos dados para outro (recém agrupado), então para a árvore que será:

trane é o conjunto de dados de formação + conjunto de dados de validação

novo conjunto de dados são geralmente novos dados sobre novos clusters. Embora a árvore tenha funcionado bem na validação, mas nas novas ela falha.


Veja catbust sobre os mesmos dados:

Qual é a diferença? Parsing the catbust...

Demora algum tempo a perceber o que se passa, até verificar tudo passo a passo.

Eu estava certo em culpar a árvore.
Agora dá-me algumas fotos das montanhas. A propósito, como foi lá em cima nas montanhas? Onde você estava?
 
Ilnur Khasanov:
Agora dá-me fotos das montanhas. A propósito, como foi lá em cima nas montanhas? Onde você esteve?

Altai... Eu não fui no último momento, eu não queria ir).

Já agora, sabes alguma coisa sobre as vantagens?