Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2745

 
JeeyCi #:


e os testes estatísticos para os coeficientes de regressão servem para quê? ou para testar hipóteses sobre a igualdade da média e da variância? (se a ACP ainda mostrar que o 1º PC explica a parte aceitável da variação [a variação residual é muito pequena], então aceite-a e verifique a confirmação da importância dos coeficientes de regressão)...).

Idealmente, está claro que, para ter 100% de probabilidade, devemos usar relações funcionais em vez de relações de correlação, mas se estudarmos um processo estocástico, os resultados serão apenas probabilísticos e confirmáveis somente em um grande número de dados de teste e somente até que um novo driver apareça no mercado. [aqui, a propósito, a consciência factual/lógica também é muito importante, não apenas a análise robusta].

O ajuste ao histórico está sempre presente, desde que nos baseemos em dados históricos..... mas sempre podemos comparar a variância pela estatística F: se a redução da variância for muito maior do que a variância inexplicada restante, então uma nova regressão é identificada. (com dr SLOPE)... e isso funciona somente até um momento no futuro e somente em grandes números... bem, ou mudar o estado do ator (se DL for usado)... mas o motorista sabe que não deve esperar... mas é melhor conhecer o driver do que esperar até que a amostra atual seja coletada para confirmá-la.

Engenharia de recursos Se você tornar lógico, como você observou corretamente, "teoricamente" lógico (sob qualquer processamento estatístico, existem leis físico-lógicas terrenas e conhecimento humano, os padrões não caem do ar) - [mas alguém pode ter ignorância] - então o FS no processo de modelagem não incomodará muito o modelador ou o desenvolvedor.... e não se pode ir a lugar algum sem a história, para saber o que e quando se tornou um motor e o que não se tornou - não é preciso ter muita inteligência em matemática superior, apenas entender as leis do dinheiro e do mercado de commodities, dos setores privado e estatal, caso contrário, estaremos usando o aparato da matemática superior aplicada apenas "depois" de saber que a notícia que mudou o mundo já foi ouvida uma vez.... O fato é que a reação do mercado, inclusive a reação do mercado, geralmente está atrasada.

p.s..

para quem palavras e letras são desconhecidas, não leia um tópico desconhecido de letras desconhecidas, para não se apegar a letras - procure uma máquina VM para seu FS.... se você também provar a validade estatística de seus resultados, e não apenas a porcentagem de acerto por ponto (nem sempre imparcial, a propósito), então as conversas serão diferentes.... Mas, por enquanto, sim, todos têm sua própria terminologia....

Tudo começou com o fato de que as pessoas queriam cooperar )) começou a se organizar, e descobriu-se que todos negam tudo o que os outros fazem. Além disso, inventam novas definições. No final, ninguém entendeu nada. Em geral, gosto da abordagem de Sanych, por isso pedi detalhes. E com as designações, também, é um problema o fato de haver uma relação e uma conexão, se não uma correlação.

É óbvio que ele valoriza seu know-how e não revela detalhes.
 
Maxim Dmitrievsky #:
Tudo começou com pessoas que queriam cooperativas), começaram a investigar e descobriram que todos negam tudo o que os outros fazem. Além disso, eles criam novas definições. No final, ninguém entendeu nada. Em geral, gosto da abordagem de Sanych, por isso pedi informações específicas. E com as designações, também, o que é relação e conexão, se não correlação.

Obviamente, ele valoriza seu conhecimento e não revela detalhes.

Na minha opinião, há dois tipos de correlação.

O primeiro é causal, que é determinado por informações a priori sobre o objeto de pesquisa a partir do conhecimento na área de assunto em questão, e não por alguns cálculos.

O segundo tipo é a dependência probabilística, que pode ser calculada a posteriori a partir de alguns dados obtidos pela observação do comportamento do objeto. O segundo tipo inclui a correlação, a dependência determinística (como um caso extremo) e assim por diante, incluindo a descrita por cópulas e outros métodos. A base para o estudo desse tipo é a suposição de que há uma distribuição conjunta para preditores e alvo.

 
Aleksey Nikolayev #:

Em minha opinião, há dois tipos de comunicação.

O primeiro é causal, que é determinado por informações a priori sobre o objeto de pesquisa a partir do conhecimento na área de assunto em questão, e não por alguns cálculos.

O segundo tipo é a dependência probabilística, que pode ser calculada a posteriori a partir de alguns dados obtidos pela observação do comportamento do objeto. O segundo tipo inclui a correlação, a dependência determinística (como um caso extremo) e assim por diante, incluindo a descrita por cópulas e outros métodos. A base para o estudo desse tipo é a suposição de que há uma distribuição conjunta para os preditores e o alvo.

Correto. Por falta de suposições a priori, o segundo tipo é usado. Gostaria de saber como Sanych vê isso. Por exemplo, como os alvos são construídos, eles podem ser simplesmente ajustados a qualquer característica e vice-versa.

Minha abordagem é totalmente personalizada para essas manipulações, talvez algo possa ser melhorado.
 
mytarmailS #:

Há um PCA considerando o alvo, que destacará os componentes que caracterizam o alvo,

Ele nunca fará isso, pois não leva em conta a relação com o alvo. - Ele apenas criará uma projeção ortogonal no espaço de recursos que explica a variação máxima..... (Só não tenho certeza se a rotação deve ser feita manualmente [acho que havia algo sobre isso no pacote Statistika - algum botão] ou se ela será calculada automaticamente - outras bibliotecas podem já ter a rotação incorporada).


mytarmailS #:

mas o que é triste é que o alvo é uma variável subjetiva e ela "flutuará" assim que o rastreamento for concluído.... E em que isso difere do aprendizado normal com um professor?

Sim, infelizmente, você tem suas próprias interpretações do propósito desse método e suas próprias maneiras e propósitos de usá-lo.... Não sei como isso pode ajudá-lo com essas opiniões sobre ele... - portanto, também não precisa me perguntar mais nada.
 
JeeyCi #:
1) ele nunca fará isso - ele não leva em conta os links para o alvo!!!! - ele apenas criará uma projeção no espaço de recursos que explica a variação máxima.... (Só não tenho certeza se a rotação deve ser feita manualmente [acho que havia algo sobre isso no pacote Statistika - algum botão] ou se ele descobrirá isso automaticamente - outras bibliotecas podem já ter a rotação incorporada).


2) Sim, é triste - você tem suas próprias interpretações da finalidade desse método e suas próprias maneiras e propósitos de usá-lo... Não sei como isso pode ajudá-lo com essas visões..... - portanto, também não precisa me perguntar mais nada.

1) Estou dizendo que há rsa's que levam em conta o alvo.

2) Eu não perguntei nada, eu afirmei.

 

mytarmailS #:

1) Estou dizendo que existemrsa 's quelevam em conta a segmentação.

2) Eu não estava perguntando nada, estava afirmando.

esses já são algoritmos para vincular artificialmente os PCs ao alvo - algoritmos diferentes (software implementado às vezes até de forma diferente em bibliotecas diferentes)... você também pode usar o PLS... a forma como você vincula o alvo aos recursos é da sua conta, isso não faz com que o ponto do PCA = "com o professor" (o professor é vinculado separadamente - na verdade - da forma que você quiser) - novamente estamos nos afastando do ponto e entrando no tópico de "gosto e cor..." (bibliotecas). (bibliotecas).

Não tenho certeza se você sabe se sua biblioteca faz rotação ou se você mesmo tem que codificá-la... Portanto, afirmações não verificadas e incompletas/incorretas não interessam a ninguém aqui, especialmente quando elas mudam os significados e a essência de fenômenos/objetos, e depois você grita que não entende as palavras... aparentemente, você não entende nem mesmo suas próprias palavras com precisão

 
JeeyCi #:

Não tenho certeza se você mesmo sabe se sua biblioteca faz rotação ou se você mesmo tem que codificá-la....

não julgue por si mesmo

(Só não tenho certeza se a rotação deve ser feita manualmente [acho que havia algo sobre isso no pacote Statistika - algum botão] ou se ela será feita automaticamente - no outro pacote.

JeeyCi #:

portanto, declarações não verificadas e incompletas/incorretas não interessam a ninguém aqui

E se você não tiver certeza, não tem o direito de afirmar nada que seja verificado. o que não é, quem está interessado, quem não está.... se sua cabeça estiver em ordem, é claro


ps E se há rotação na matriz é fácil de verificar se houver compreensão, mas aparentemente há um problema com isso.....

 

Portanto, verifique-o antes de se atirar contra as pessoas,

- se não entender desde a primeira vez, coloque seus tons gurianos/incorretos em seu código e em seus resultados, em vez de procurar os extremos

 
Qual é a diferença entre isso e o LDA? Nas citações, você obtém um ajuste rígido que não funciona com novos dados. Mas isso reduz o erro do modelo treinado para quase zero. Uma situação semelhante pode ocorrer com a abordagem de Sanych. O princípio é o mesmo: ajustar as moscas às costeletas

Mas uma janela deslizante deve trazer alguma alegria se forem coletadas estatísticas sobre ela. Ainda não consigo imaginar isso.
 

Algum tipo de aumento nas postagens!


Mais uma vez.

Classifico os preditores de acordo com a capacidade de previsão.

Uso meu próprio algoritmo, pois os algoritmos de vários pacotes são muito lentos - o meu é menos preciso, mas muito rápido.

A capacidade preditiva NÃO é uma correlação e NÃO é o resultado da escolha de preditores que os modelos produzem.

A capacidade preditiva é a correlação de informações e NÃO:

1. A correlação é a "semelhança" de uma série estacionária com outra, e sempre há algum valor e nenhum valor "sem relação". A correlação sempre tem algum tipo de valor, portanto, você pode facilmente usar a correlação para descobrir a relação entre um professor e a borra de café.

2. A seleção de fichas é a frequência de uso de fichas na criação de modelos. Se considerarmos preditores não relacionados ao professor, ainda assim obteremos uma classificação de fichas.

Um análogo ao meu entendimento de "poder preditivo é, por exemplo, caret::classDist(), que define as distâncias de amostragem de Mahalanobis para cada classe de centros de gravidade. Ou woeBinning. Há muitas abordagens e muitos pacotes no R. Há outras baseadas na teoria da informação.