Como você praticamente avalia a contribuição de uma contribuição "específica" para o NS?

 

Não é bem sexta-feira, mas ...

Há um NS, qualquer NS, há uma entrada A={A1, A2, .... A20}. Treine o NS e obtenha um resultado satisfatório. Como praticamente avaliamos a contribuição de cada elemento de entrada A1, A2, ... A20 a este resultado?

As opções fora do topo da minha cabeça são:

1) De alguma forma, somar e calcular todos os pesos com os quais o elemento passa através da rede. Não estou muito claro como fazê-lo, teria que mergulhar na operação da rede e calcular de alguma forma alguns coeficientes, etc.

2) Tente "zerar" de alguma forma, ou por exemplo, reverter um elemento do vetor de entrada e ver como ele afeta o resultado final. Até agora, já me acomodei a isso.

Mas antes de perceber esta segunda variante, decidi pedir meu conselho. Quem poderia estar pensando sobre este assunto há mais tempo do que eu? Talvez alguém possa aconselhar um artigo de livro?

 
Figar0:

Não é bem sexta-feira, mas ...

Há um NS, qualquer NS, há uma entrada A={A1, A2, .... A20}. Treine o NS e obtenha um resultado satisfatório. Como praticamente avaliamos a contribuição de cada elemento de entrada A1, A2, ... A20 a este resultado?

As opções fora do topo da minha cabeça são:

1) De alguma forma, somar e calcular todos os pesos com os quais o elemento passa através da rede. Não estou muito claro como fazê-lo, teria que mergulhar na operação da rede e calcular de alguma forma alguns coeficientes, etc.

2) Tente "zerar" de alguma forma, ou por exemplo, reverter um elemento do vetor de entrada e ver como ele afeta o resultado final. Até o momento, me acomodei a isso.

Mas antes de perceber esta segunda variante, decidi pedir meu conselho. Talvez alguém esteja pensando neste tópico há mais tempo do que eu? Talvez alguém possa aconselhar um artigo de livro?


ou talvez excluir esta entrada e tentar ensinar sem ela. Se o resultado for quase idêntico, você não eliminou realmente o elemento certo :)
 
Avals:

Ou talvez excluir esta entrada e tentar treinar sem ela. Se o resultado for quase idêntico, então não excluímos o elemento certo :)


Aqui está o quadro: esta abordagem dependerá fortemente do método de treinamento, ou melhor, da capacidade do treinamento de encontrar o máximo absoluto. Não tenho ilusões a este respeito, por exemplo, tenho certeza de que usando a GA para treinar 300 pesos não vou encontrá-lo. Portanto, um máximo local, mas me convém bem. Excluindo algo eu posso obter um resultado igualmente bom, mas apenas uma variante diferente de NS. Mas se eu pudesse treinar a NS por meio do ISC, ou seja, para encontrar a única solução correta - então eu faria exatamente isso.

Em qualquer caso, minha tarefa é diferente: há um NS, há um input, há um resultado de aprendizado e o grau de influência de cada elemento do input sobre o resultado final deve ser encontrado.

 
Figar0:


Aqui o quadro é o seguinte: esta abordagem dependerá fortemente do método de aprendizagem, ou melhor, da capacidade de aprender a encontrar o máximo absoluto. Não tenho ilusões sobre isso, tenho certeza que não consigo encontrar um máximo absoluto treinando 300 pesos em uma rede com GA. Portanto, um máximo local, mas me convém bem. Excluindo algo eu posso obter um resultado igualmente bom, mas apenas uma variante diferente de NS. Mas se eu pudesse treinar a NS por meio do ISC, ou seja, para encontrar a única solução correta - então eu faria exatamente isso.

Em qualquer caso, minha tarefa é diferente: há um NS, há um input, há um resultado de aprendizado e o grau de influência de cada elemento do input sobre o resultado final deve ser encontrado.


Em seguida, sua opção 2. Mas provavelmente não zerando ou invertendo, mas substituindo-o por aleatório (ruído)
 
Avals:

mas substitua-o por aleatório (ruído)
Sim, isso é provavelmente uma coisa sensata a fazer. E para o bem da pureza da experiência, faça-o a cada elemento várias vezes. Terei que pensar sobre isso....
 
Outra opção é tentar todas as redes com 1 entrada, depois 2 entradas, depois 3 entradas, etc. :-)
 
jartmailru:
Outra opção é tentar todas as redes com 1 entrada, depois 2 entradas, depois 3 entradas, etc. :-)

Era isso mesmo que eu estava pensando... Eu deveria, de alguma forma, tentar contabilizar a interconexão das entradas, ou seja, excluir ou incluir as entradas também em grupos.
 
Começou a fazer experiências, eliminando diferentes combinações de 1 a 5 entradas. Os resultados são muito interessantes, mas ainda não sei como interpretá-los) Alguns resultados são tão inesperados... Terei que coçar minha cabeça por um longo tempo.
 
Figar0:
Os resultados são muito interessantes, mas não sei como interpretá-los).
Interprete-o corretamente. Se você interpretar errado, pode ficar confuso e não chegar a nada.
 
Figar0:
Começou a fazer experiências, eliminando diferentes combinações de 1 a 5 entradas. Os resultados são muito interessantes, mas ainda não sei como interpretá-los) Alguns resultados são tão inesperados... Terei que coçar minha cabeça por um longo tempo.

Qual é a surpresa?
 

O grau de influência de cada entrada é praticamente impossível de avaliar . Há todo tipo de fórmulas matemáticas, e software especializado pode calcular automaticamente o grau de influência. Mas todos estes cálculos são apenas um valor convencional, que realmente não diz muito, porque pode ter um grande erro.

Por experiência, somente um comerciante que sabe por experiência própria qual instrumento tem maior influência em outro instrumento (quando se fala de entradas em múltiplas moedas) pode determinar isto.

Se estamos falando da seleção de indicadores como uma entrada do mesmo símbolo sobre o qual negociamos, a seleção de uma entrada de vários indicadores não tem quase nenhum efeito sobre a saída da rede neural, já que a rede neural é muito não linear e, portanto, quase não se importa com o que é entrado - estocástico ou mcd ou qualquer outra coisa. Portanto, haverá definitivamente alguma diferença, mas não uma diferença drástica ou geralmente notável que praticamente não afeta o resultado.