Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1709

 
Aleksey Nikolayev:

Não se pode passar sem experiências. A ideia principal, tanto quanto sei, é simplesmente reduzir significativamente a lista de substâncias permitidas para experiências. Aqui está um link para um relato em russo mais sensato desta pesquisa, com ênfase na biologia e sem os detalhes do MO.

Um bom artigo científico, sem o entusiasmo "borbulhante" sobre a onipotência da IA e a proximidade de uma panaceia. Mostra como a natureza é "complicada" e como é ingénuo pensar que já se encontrou a chave para ela e agora...

O resultado da utilização do MO para encontrar uma opção adequada a partir das vastas "bibliotecas" de compostos e dados sobre os seus efeitos em diferentes estirpes tem sido bem sucedido. Mas, é um resultado quase isolado e não garante vitórias semelhantes no futuro. Porquê? - Porque o MOE usa uma abordagem estatística e probabilística. Outras aplicações desta pesquisa podem não ser bem sucedidas em absoluto.

Eu me concentraria na aprendizagem dos princípios gerais da replicação microbiana e na criação de uma ferramenta de bloqueio seletivo em certas cepas. Esta é a diferença entre uma abordagem inteligente e uma abordagem estatística e probabilística (ou seja, uma solução universal, versus uma solução particular).

 
Reuter Konow:

Um bom artigo científico, sem o entusiasmo "borbulhante" sobre a onipotência da IA e a proximidade de uma panaceia. Mostra como a natureza é "astuta" e como o homem é ingénuo ao pensar que já encontrou a chave para ela e agora...

O resultado da utilização do MO para encontrar uma opção adequada a partir das vastas "bibliotecas" de compostos e dados sobre os seus efeitos em diferentes estirpes tem sido bem sucedido. Mas, é um resultado quase isolado e não garante vitórias semelhantes no futuro. Porquê? - Porque o MOE usa uma abordagem estatística e probabilística. Outras aplicações desta pesquisa podem não ser bem sucedidas em absoluto.

Eu me concentraria na aprendizagem dos princípios gerais da replicação microbiana e na criação de uma ferramenta de bloqueio seletivo em certas cepas. Isto é o que distingue a abordagem inteligente, da abordagem estatística e probabilística (isto é, a solução universal, versus a particular).

Ao nível de moléculas de DNA individuais, os efeitos quânticos são inevitáveis, que são intrinsecamente probabilísticos por natureza e não podem, em princípio, ser considerados sem um teórico e matstat. E em todos os níveis superiores, até aos ensaios clínicos de medicamentos, estas ciências são indispensáveis. Portanto, métodos como os utilizados neste estudo não são de forma alguma alheios à biologia e até levaram à cunhagem do termo em silico (semelhante ao in vivo e in vitro).

 
Aleksey Nikolayev:

Ao nível de moléculas de DNA individuais, os efeitos quânticos são inevitáveis, que são intrinsecamente probabilísticos por natureza e não podem, em princípio, ser considerados sem um teórico e um matstat. E em todos os níveis superiores, até e incluindo os ensaios clínicos de medicamentos, estas ciências são indispensáveis. Portanto, métodos como os utilizados neste estudo não são de forma alguma alheios à biologia, tendo mesmo levado ao surgimento do termo in silico (análogo ao in vivo e in vitro).

Sim, eu também notei um artigo no Zen sobre "flutuações" quânticas no DNA gerando suas mutações. Certamente o MO é uma boa ferramenta em muitas áreas de pesquisa. Mas, pessoalmente, eu percebi - MO, não é IA, e não deve ser confundido com ela. A IA vai procurar uma solução absoluta, enquanto a MO procura uma solução privada. Eles têm métodos de trabalho absolutamente diferentes e o MO não vai "crescer" em IA.

 
boa noite, qualquer conselho para um novato...


Se eu comprar um EA (5 cópias) todas as atualizações subsequentes estarão disponíveis? Elas serão gratuitas para todas as 5 cópias?

 
Aleksey Nikolayev:

O que você acha da Idéia Absoluta de Hegel?)

Não estou familiarizado ou não me lembro :) Agora estou mais no cristianismo, resolvendo quebra-cabeças
 
3565832:
Boa noite, pode aconselhar um novato...


Se você comprar um EA (5 cópias) todas as atualizações subsequentes estarão disponíveis? Elas serão gratuitas para todas as 5 cópias?

Sim
 
Maxim Dmitrievsky:
Não estou familiarizado ou não me lembro :) Estou mais interessado no Cristianismo agora, resolvendo quebra-cabeças

Com Alexander-Toddler você cria uma doutrina do Graal?)

 
elibrarius:

Alexei, você faz análise foliar, aparentemente pode responder... ou alguém que o faça.

Aqui está uma descrição das divisões de uma árvore tão profundas como 2 de kaboos


O que significa "valor"? É a resposta da folha? O que significam os números negativos?

Em caso afirmativo, qual é o valor para a classificação multiclasse? Abaixo estão as divisões de uma das árvores treinadas em 3 classes.
Em cada folha vemos um conjunto de 3 valores de valor. Qual é a resposta? O valor mais alto? Então porquê armazenar dois valores redundantes? O que significam os valores negativos?

Curiosamente, a soma dos três valores é 0.

Sim, na classificação binária este é o valor de probabilidade de pertencer à classe "principal".

Eu não fiz multiclassificação no CatBoost, mas acho que é a probabilidade de pertencer a uma classe em particular.

A figura precisa ser transformada para obter o valor real da probabilidade - existe uma função logística.

As folhas ativadas no modelo são resumidas - assim, entre outras coisas, os sinais podem estar com sinais diferentes - este é um processo de equilíbrio, apenas pode ser desbastado depois que o modelo é construído e as folhas e árvores do lixo podem ser descartadas.

 
Aleksey Vyazmikin:

Sim, na classificação binária este é o valor de probabilidade de pertencer a uma classe "principal".

Eu não fiz multiclassificação no CatBoost, mas acho que é a probabilidade de pertencer a uma classe em particular.

A figura precisa ser transformada para obter o valor real da probabilidade - existe uma função logística.

As folhas ativadas no modelo são resumidas - assim, entre outras coisas, os sinais podem estar com sinais diferentes - este é um processo de equilíbrio, apenas pode ser afinado depois que o modelo é construído e as folhas e árvores do lixo podem ser descartadas.

Obrigado. Foi mais ou menos o que eu pensei.
Não sei bem como é que eles calculam este valor.
Por exemplo, eu treinei 1 árvore com profundidade 1:

    "left": {
      "value": -0.5202020202020202,
      "weight": 384
    },
    "right": {
      "value": -0.0019267822736030828,
      "weight": 507
    },
    "split": {
      "border": 12.587499618530273,
      "float_feature_index": 0,
      "split_index": 0,
      "split_type": "FloatFeature"
    }

Quando peço uma resposta da árvore, recebo:

cmodel.predict(X, prediction_type='RawFormulaVal') = -0.52020202020202 - este é o valor da descrição da folha

cmodel.predict_proba(X)=0.372805 é classe 1 probabilidade
verificado com a fórmula
x1=-0.52020202
prob=math.exp(x1)/(1+math.exp(x1))=0.3728049958676699

Calculado correctamente.

Há 891 linhas no total do conjunto de dados.

Contei o número de ocorrências da 1ª classe em
borda < 12.587499618

Tenho 384 exemplos no total, o que corresponde aos pesos da descrição da folha, dos quais 89 são exemplos da classe 1.

A probabilidade da classe 1 deve ser
89 / 384 = 0,2317708

Mas o modelo dá uma probabilidade de 0,372805.

Acontece que algum outro algoritmo é usado lá para obter a probabilidade.

 
elibrarius:

Acontece que algum outro algoritmo de probabilidade está sendo usado lá.

Sim, os resultados são estranhos. Eles não retiram a probabilidade da amostra de teste envolvida no treino? Mas parece haver aqui um erro.

Quantas unidades (linhas de alvo) existem no total da amostra?