Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2755

 
mytarmailS #:
Argumentar

Nem sempre, e nem sempre o mesmo. Há padrões idênticos causados por eventos que não são idênticos, temos um impacto cumulativo além do nosso controle. Ou seja, o erro do caso sempre será sem o controle dos eventos de FA. É por isso que não é assim.

Em geral, estou inclinado à ideia de que o alvo é o comportamento das decisões/nossas ações sobre o comportamento do preço. Afinal, uma função é algo definido, mesmo com algumas probabilidades, corredores, mas com regras e inter-relações.

Estou procurando uma ideia de definir o comportamento por meio de uma grade de níveis, uniforme, ou níveis de extremos históricos) Como se fosse necessário aplicar as duas abordagens, enquanto estou resolvendo o problema, o que deve ser calculado a partir de um número que definiria a etapa correta da grade, e com que frequência é necessário alterar essa grade)))))

 
Valeriy Yastremskiy #:

Estou procurando uma ideia para determinar o comportamento por meio de uma grade de níveis, uniforme ou níveis de extremos históricos. Como se fosse necessário aplicar as duas abordagens, enquanto estou resolvendo o problema, o que deve ser calculado a partir de um número que definiria a etapa correta da grade e com que frequência é necessário alterar essa grade)))))

Talvez seja melhor simplesmente pegar alguma situação no mercado com um nível, depois encontrar situações semelhantes, combiná-las em um grupo e tentar separar esse grupo de todo o resto....

 
mytarmailS #:

Talvez seja melhor simplesmente pegar uma situação no mercado com um nível, encontrar situações semelhantes, agrupá-las e tentar separar esse grupo de todo o resto.

Talvez seja melhor. Esse é um trabalho diferente. Inicialmente, você pode pegar um gráfico de notícias (pelo menos formalizado de alguma forma) e eventos (é necessário formalizar) e buscar os mesmos padrões, mas isso já foi feito e está sendo feito. A questão é como formalizar, pois o que temos hoje não dá resultados lucrativos.

É mais lucrativo usar o mesmo intervalo de tempo.

Ainda estou fascinado pela ideia da definição correta do estado. Sanych gostou da conclusão, a mudança de comportamento muitas vezes drena o depósito sem aviso))))) Minha conclusão é que o preço muda de comportamento com bastante frequência e em uma faixa ampla o suficiente e, aparentemente, com padrões diferentes antes da mudança de comportamento. Ainda não consigo formular com mais precisão o que isso significa. Em matemática, parece que é necessário um número infinito de padrões para descrever o SB. Para o mercado, ainda não temos modelos suficientes para descrevê-lo com precisão suficiente.

Em geral, o que deve ser contado na linha, que calcularia corretamente a etapa da grade))))) E com que frequência alterar a etapa))))

Por que a grade, porque é uma das variantes mais simples de controle de estado, tudo entre os níveis não é fixo, as transições de nível para nível, a tendência, o retorno, significa extremo.... Bem, como se houvesse problemas, mas essa formalização do estado é tão simples.
 
JeeyCi #:

Sim, eu gosto dessa palavra (algo tão nativo da programação orientada por eventos).

na variante expressa por SanSanych Fomenko - algo assim parece ser implementado: outlier -> significa entrada (ou saída) ... misturei uma bagunça de dim_reduction e métodos de classificação multidimensional (LDA, clustering) acima... mas a essência do Mahalanobis provavelmente sempre esteve principalmente no espaço multidimensional como detecção de outliers/novidades de qualquer forma... portanto, a opção de negociar com outliers parece muito boa (somente a feature_engineering deve ser feita corretamente, e não um conjunto idiota de dados iniciais a serem pesquisados para fs)...

mas ainda assim a "janela deslizante" é confusa (embora o modelo autorregressivo usual seja comum para a negociação de acompanhamento de séries temporais).... - também pode haver uma bagunça (na janela)... -- Presumo que os limites da janela sejam a entrada no mercado de smarts, que, aliás, usam em seu gerenciamento de portfólio a otimização de média e variância... não conhecemos o portfólio deles, é claro (apenas aproximadamente a partir de SoTs retrospectivamente), mas dentro dessa variação eles provavelmente fazem o reequilíbrio do portfólio --- enquanto fixam ou carregam sobre o varejo...

negociar com base em valores atípicos é certamente uma opção interessante, mas considerar quem está enfrentando isso - OTF ou DTF (day traders) - também é importante para interpretar o valor atípico corretamente...

p.s..

Bem, ou simplesmente não considere os outliers de Mahalanobis, mas os decis extremos da distribuição de previsão - para o comportamento de aceitação de risco (vs. evitação de risco), por exemplo, o ator'a (com a correspondente mudança de seu estado de acordo com os parâmetros ambientais).

Você ainda está se movendo em uma janela deslizante, independentemente da forma e das propriedades que ela tenha ou dos atributos que ela contenha. Seria tolice negar o óbvio.

Até que as pessoas aprendam o básico, será impossível se comunicar

O aprendizado por reforço está ligado ao fato de que o agente afeta o ambiente, exceto em exemplos simples de tabelas. E há um número finito de estatísticas, ou as políticas mudam lentamente e não aos trancos e barrancos. Com base nisso, é impossível implementar um agente no Forex, pois você sempre obterá uma classificação regular.

Na forma, parecerá "uau", o agente faz algo em um determinado ambiente. E, em essência, ele não é realizado, apenas categoriza as instâncias. Para robótica ou jogos, é mais adequado.

Sem que essa condição seja atendida, a RL pode ser vista como uma otimização, uma das...
 
Maxim Dmitrievsky #:
A aprendizagem por reforço está ligada ao fato de que o agente afeta o ambiente, exceto para exemplos simples de tabelas. Com base nisso, é impossível implementar um agente no Forex, pois você sempre obterá uma classificação regular.

Na forma, parecerá "uau", o agente faz algo em um determinado ambiente. E, em essência, ele não é realizado, apenas categoriza casos. Para robótica ou jogos, é mais adequado.

Sem que essa condição seja atendida, a RL pode ser vista como uma otimização.

concordo... portanto, tendo a pensar que o agente é OTF (grande capitalização, inteligência) -- por volume ultra-alto (como no VSA padrão) -- tanto restringindo quanto violando volumes para formalizar.... é nesse ponto que vejo o principal objetivo do ML na preparação de dados: determinar o que é uhv em um determinado ativo... e é a inteligência que deve ser tratada como um ator, não os comerciantes diários.... embora, é claro, a formalização ainda seja necessária....

 

A propósito, estou tentando examinar seu link sobre inferência causal - o link, a propósito, descreve o significado do fenômeno em russo bastante desajeitado.... mas os links para o livro e outros sugerem que estamos falando de estudos de coeficientes de correlação parcial (para dizer em russo), ou seja, com fatores fixos diferentes do que está sendo estudado.... ou seja, um coeficiente de correlação parcial é encontrado (há fórmulas matemáticas estatísticas nos círculos acadêmicos ou em qualquer livro de estatística padrão), sua significância é avaliada por meio da hipótese nula (H0) e uma conclusão é feita sobre a influência ou não influência (ou seja, dependência ou independência das variáveis selecionadas), por exemplo, em russo:

при фиксированном качестве посевного материала, мин. удобрений и фин. затрат - продуктивность посевов не зависит от фондооснащённости

ou seja, o fundo-equipamento e a produtividade da cultura são linearmente NÃO dependentes ... (isso é em termos de intervenções)...

e é possível provar isso por meio de um coeficiente particular de correlação das estatísticas.... essa é exatamente a situação de provar que a correlação no espaço multifatorial não serve necessariamente como causalidade do fenômeno observado... Ou seja, em essência, o Planejamento de Experimentos padrão é projetado para resolver esses problemas - para livrar as conclusões lógicas sobre os resultados de estarem repletas de correlações insignificantes entre fatores e resultados, que são injustificadamente elevadas à categoria de fenômenos causais.

Não li o restante (sobre fatores de confusão etc.), mas, de alguma forma, os artigos para leitores em massa (não no melhor sentido) e os artigos para relações públicas (para promover novas palavras sobre verdades antigas) estão muito desalinhados semântica e logicamente com os argumentos de uma argumentação científica razoável (bem, e uma prova razoável de argumentos, ou seja, relações de causa e efeito, ou seja, relações de causa e efeito).ou seja, as relações de causa e efeito de certas dependências comprovadas(!) pelo planejamento CERTO e pela montagem de uma série de experimentos)...

... para o varejo (devido a informações incompletas sobre o mercado), a inferência causal é, em princípio, incompreensível; para os institutos de pesquisa, não pode ser comprovada (pelo mesmo motivo, devido a vários elementos de sigilo comercial); para o comitê estatístico do nível estadual, talvez haja algumas amostras representativas... mas, de qualquer forma, os dados estatísticos sobre finanças sempre se baseiam no sigilo comercial... e, para os profissionais de marketing, é apenas um brinquedo para "olhar a carteira de outra pessoa a qualquer custo" - é por isso que acho que seu link é mais interessante como um "brinquedo para profissionais de marketing", mas, em essência, baseado na metodologia estatística clássica - apenas para eles é uma metodologia estatística clássica. metodologia, -- só que eles nem sempre estão interessados em pesquisa científica clássica, teoria e métodos estatísticos de matriz e nem sempre têm acesso a todas as informações para modelagem de matriz completa, assim como psicólogos, sociólogos etc. devido à "ética dos experimentos" ...

>> por isso, eles citam "exemplos de brinquedo" em seus artigos e livros, sobre os quais um grande número de cérebros secam - simplesmente porque na vida real não é possível realizar tais experimentos, nem obter tais dados, não é possível encontrar financiamento para tais pesquisas, não é possível encontrar essa lógica vazia sobre piscinas, e as empresas querem explicações quando e como a demanda nasce.... então eles escrevem artigos "shir.consum" para os marqueteiros que sonham em se aproveitar da inflação - por um longo tempo e com lucro... e os cérebros, secando, tentam soldar esses exemplos de brinquedo à vida real....

um experimento científico real, cientificamente fundamentado, logicamente adequado, sobre essas ou aquelas dependências implica o planejamento adequado do experimento para reunir a base de evidências para essas/outras conclusões lógicas, confirmadas estatisticamente ... não o populismo da estatística em si, mas em termos de inglês ...

foi o que me pareceu a partir do link obtuso (( - portanto, não se preocupe com o fato de não soldar esse artigo à análise de mercado imediatamente ...

--- esta é a minha análise

Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
  • adam kelleher
  • medium.com
Often, we need fast answers with limited resources. We have to make judgements in a world full of uncertainty. We can’t measure everything. We can’t run all the experiments we’d like. You may not have the resources to model a product or the impact of a decision. How do you find a balance between finding fast answers and finding correct answers...
 
Esse é um tipo de artigo introdutório ou promocional, acho que havia um link para a própria biblioteca.
E havia algo sobre inferência para séries temporais mais adiante, mas ainda não tive tempo de dar uma olhada. Talvez seja um tópico exagerado, mas não posso descartar essa possibilidade

Acho que faz sentido procurar por "inferência causal de classificação de séries temporais" e coisas do gênero
 
Maxim Dmitrievsky #:
Esse é um tipo de artigo introdutório ou promocional, acho que havia um link para a própria biblioteca.
E algo sobre inferência para séries temporais estava mais adiante,

e era realmente promocional. e não nas melhores tradições da arte da propaganda...

Na parte de séries temporais do link, há uma referência ao SUTVA, que é do livro.

A suposição de que não há interferência foi denominada "nenhuma interação entre unidades" por Cox (1958),

e está incluída na "suposição de valor de tratamento de unidade estável (SUTVA)" descrita por Rubin (1980).

VanderWeele (2009) formalizou esse ponto como o pressuposto da "irrelevância da variação do tratamento", ou seja, o pressuposto de que podem existir várias versões do tratamento, mas todas elas resultam no mesmo resultado.

Na presença de interferência, o contrafactual para um indivíduo i não é bem definido porque o resultado de um indivíduo depende dos valores de tratamento de outros indivíduos.

Assim como a suposição de ausência de interferência, a suposição de ausência de múltiplas versões de tratamento está incluída na "suposição de valor de tratamento de unidade estável (SUTVA)" descrita por Rubin (1980).

A interferência existe quando o tratamento de um indivíduo afeta o resultado de outros na população.

E mais adiante no livro - algumas linhas sobre "transportabilidade [incluindo adverbialidade] de inferências causais entre populações", mas ao mesmo tempo "a estimativa de cada método é baseada em diferentes suposições de modelagem". - o que é comum em modelagem. Em seguida, as esperanças dos profissionais de marketing de "espalhar rumores" nas populações, enquanto separam os indivíduos da população por sugestionabilidade (aqueles que acreditam, não acreditam, resistem, reclamam, cedem) - ou seja, uma nova divisão para classificação.... nesse ritmo, obviamente nos afastaremos da modelagem do movimento de preços para a modelagem das massas sociais, enquanto sonhamos que o mercado é movido pelo mesmo sentimento, e que não precisa ser modelado - ele só precisa ser reunido em uma pilha e direcionado na direção (psicologia das multidões), pelo menos até a lua - é com isso que os profissionais de marketing estão brincando.... sonhando em se equiparar aos cientistas políticos...

e há muitas tecnologias de relações públicas e disseminação de informações na sociedade - como a manipulação da opinião pública... todos "treinam" na divulgação de suas especulações, sonhando em influenciar o processo decisório de alguém... mas as decisões tomadas com base nas opiniões da multidão raramente são de longo prazo e sempre há "níveis de parada" além dos quais a multidão não poderá ir (por quem? - pelo Regulador, se ele cumprir suas funções)... Acho que é inútil estudar o comportamento plano (quem está contra quem e por quais meios, pelo menos a SUTVA) - se o objetivo for se juntar aos espertos e " seguir o rabo deles".

O livro, a propósito, chama-se What IF - harvard.edu (ainda não terminei de lê-lo - já a leitura na diagonal me faz sorrir).

p.s.

não, mas ainda assim eles não inventarão nada e o chamarão de cálculos de alta tecnologia, de modo que na economia eles não distribuirão benefícios entre as pessoas, mas darão o brinquedo aos marqueteiros e distribuirão publicidade (substituto do produto real, ficção, esperança, sonho, autoengano) - e ficarão felizes por terem um trabalho tão "bom" e "promissor" - marketing.... Ainda estou mais próximo da lógica normal baseada na ciência, mesmo que seja um comportamento de multidão.... mas eu não tomo decisões de negociação com base no comportamento da multidão e não aconselho ninguém...

portanto, a análise de inferência causal (quem empurrou quem na multidão e como a briga começou) não é considerada modelagem do processo de precificação, mas modelagem da briga ... sempre há um árbitro (e não é o marketing - é a economia!, não há sinal de igual entre eles), e é impossível levar tudo em consideração (a modelagem é sempre uma ou outra suposição, se um objeto for modelado, que não pode ser estudado até o fim).

p.p.s..

Não aceito argumentos sobre a igualdade das tecnologias econômicas e políticas... o "campo socioeconômico" lembra mais as leis da Terra do que as abstrações linguísticas... aqui na Terra há um "bem" (seja uma pá ou qualquer outra coisa), "não precisa" e "utilidade marginal" desse bem, que deve ser maximizada, mas há limitações - orçamento e outros recursos - isso está nos negócios.... mas na vida há um regulador... ele força a demanda e a oferta agregadas a se expandirem ou se contraírem devido às circunstâncias... Conclusão: "siga a cauda deles", mas não misture o marketing em suas piores tradições com a economia e a vida das pessoas reais (incluindo fundos de pensão, fundos de hedge, fundos de investimento para atender ao dinheiro das pessoas - mercado de liquidez).

 
... é isso - após a contrapropaganda, estou indo embora... apenas o endereço do site harvard.edu era um pouco confuso... assim como o link para o SUTVA na seção de séries temporais
 
Tudo bem, que se dane, então não vou me aprofundar no assunto, há outros tópicos interessantes para discutir

Gostei de sua expressão e análise, acredito em você 😀 .

Achei que havia algumas ferramentas prontas na biblioteca para que você pudesse deduzir algo sem muito esforço.