NN에 대한 입력 값을 올바르게 구성하는 방법.

--- 2008.07.04 11:50

NN 입력에 대한 올바른 값에 대한 질문이 포럼에 지속적으로 나타납니다. 그러나 불행히도 이 질문은 아직 완전히 공개되지 않았습니다. 나는 최근에 국회에 참여했고 이제 이 문제의 중요성을 이해합니다. 나는 그 연구소에서 이론을 가르쳤고 이 지식을 소유한 사람들을 부러워합니다.

따라서 이 스레드에서 가능한 한 완전히 올바른 값과 해당 유형에 대한 질문을 밝힙니다.

나는 단지 세부 사항으로 시작하고 싶지 않습니다(우리가 이웃 가격의 차이를 취하는 것처럼). 우선 입력 값에 대한 일반적인 요구 사항에 대한 이론이 바람직합니다. 글쎄, 그렇다면, 예를 들어 줄 수 있습니다.

Dmitry Fedoseev 2008.07.04 13:27 #1

            |               *      *
            |          *
            |      * 
            |    *
            |  *
            | *
            |*
----------------------- 1 ---------------
           *|
          * |
         *  |
       *    |
     *      |
  *         |

입력 값 1의 sigmoid가 포화 상태에 들어가면 입력 값이 2인지 3인지는 중요하지 않습니다. 결과는 거의 같습니다. 입력 값은 1 이내에 있어야 합니다. 충돌하는 샘플이 없어야 합니다. 입력에서 동일한 값이 출력에서 다른 값입니다.

Artem Titarenko 2008.07.04 13:57 #2

이것이 도움이 되기를 바랍니다.

파일:

bfgzk.zip 201 kb

Борис 2008.07.04 14:01 #3

sergeev писал (а) >> 를 썼습니다.

... 나는 연구소에서 이론을 배웠고이 지식을 소유 한 사람들이 부러워합니다.

여기에 부러워 할 것이 없습니다. 지난 천년 동안 나는 대학에서도 공부했으며 이전에는이 주제가 소비에트 방식으로 더 겸손하게 불렸습니다. TAR ..., 기껏해야,

그들은 / 교사 / 시계를 읽기 위해 귀에 국수를 걸 것입니다 ... 글쎄, 그들은 전형적인 교과서의 각 섹션의 2-3 페이지를 넘지 않을 것입니다 !!!

--- 2008.07.04 14:13 #4

2 StatBars 기사에 대해 대단히 감사합니다.

Integer писал (а) >>

그리고 1로 정규화되지 않은 입력은 어떻습니까? Sigmoid를 사용할 수 있습니까? 아니면 다른 기능이 필요합니까?

--- 2008.07.04 14:17 #5

Integer писал (а) >>
Конфликтных образцов не должно быть - одинковых значений на входе с разным значением на выходе.

출력에서 둘 이상의 값을 갖는 것이 가장 좋습니다(즉, 시장을 위 또는 아래뿐만 아니라 일부 중간 상태로 분류하기 위해). 그리고 입구에 더 있습니다.

Dmitry Fedoseev 2008.07.04 14:25 #6

입력 데이터를 정규화해야 합니다. 예를 들어, 최대 범위의 샘플을 찾아 정규화하고 상수 성분을 제거합니다. 예를 들어, MA에 상대적인 값 또는 회귀선에 상대적인 값을 계산한 다음에만 정규화할 수 있습니다. 최대 범위를 기준으로 각 샘플을 개별적으로 정규화할 수도 있습니다.

--- 2008.07.04 14:30 #7

Integer писал (а) >>
입력 데이터를 정규화해야 합니다. 예를 들어, 최대 범위의 샘플을 찾아 정규화하고 상수 성분을 제거합니다. 예를 들어, MA에 상대적인 값 또는 회귀선에 상대적인 값을 계산한 다음에만 정규화할 수 있습니다. 최대 범위를 기준으로 각 샘플을 개별적으로 정규화할 수도 있습니다.

예, 이 문제를 제기한 것이 좋습니다. 나는 항상 (당신의 경험에 따르면) 정규화하는 것이 더 정확할 것인지 의심합니다. 하나의 샘플 자체 또는 일반적으로 모든 샘플에 대해?

지점 이름을 변경하기로 결정했습니다.

Dmitry Fedoseev 2008.07.04 15:10 #8

방금 공통 샘플에 대한 정규화에 대해 생각했습니다. 이 방법이 더 좋을 것이라고 생각합니다. 네트워크는 모양뿐만 아니라 샘플의 절대 크기도 고려하지만 학습하는 데 시간이 더 오래 걸릴 것입니다.

--- 2008.07.04 15:12 #9

나도 그런 결론에 도달하는 경향이 있다. 단순히 데이터를 압축하면 비정규화 데이터에 대한 질문이 제거됩니다.

0 입력 값에 해당하는 가중치의 문제도 있습니다. 그들은 훈련에 참여하지 않을 것입니다 ...

Dmitry Fedoseev 2008.07.04 15:27 #10

sergeev писал (а) >> 를 썼습니다.

0 입력 값에 해당하는 가중치의 문제도 있습니다. 그들은 훈련에 참여하지 않을 것입니다 ...

네. 하나의 입력에는 항상 0이 있습니다(첫 번째 입력에서). 일반적으로 모든 샘플에서 첫 번째 요소를 제거하고 끝에 하나를 더 추가할 수 있습니다.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

새 코멘트