Как правильно сформировать входные значения для НС.

 

На форуме постоянно появляются вопросы на тему правильных значений для входов НС. Но к сожалению этот вопрос все остается не до конца раскрытым. Я совсем недавно занялся НС и сейчас понимаю важность этого вопроса. Завидую белой завистью тем людям, которым в институтах преподавалась теория и которые обладают этими знаниями.

Поэтому давайте именно в этой ветке как можно полнее раскроем вопрос ПРАВИЛЬНОСТИ значений и их виды.

Просто не хочется начинать с конкретики (типа берем разности соседних цен). Для начала желательна теория о вообще требованиях ко входным значениям. Ну а уж потом если пойдет можно и примеры.

 
            |               *      *
            |          *
            |      * 
            |    *
            |  *
            | *
            |*
-----------------------1---------------
           *|
          * |
         *  |
       *    |
     *      |
  *         |
Если сигмоид при значении на входе 1 входит в насыщение, то уже нет разницы, подавать ли на вход значение 2 или 3 - результат будет примерно одинаковый. Надо, чтобы входные значения находились в пределах 1. Конфликтных образцов не должно быть - одинковых значений на входе с разным значением на выходе.
 
Надеюсь Вам это поможет
Файлы:
bfgzk.zip  201 kb
 
sergeev писал (а) >>

... Завидую белой завистью тем людям, которым в институтах преподавалась теория и которые обладают этими знаниями.


завидовать тут-нечему,в прошлом тысячелетии я тоже учился в вузе,и раньше этот предмет назывался скромнее,по-советскому:ТАР...,в лучшем случае,

они/преподаватели/ лапшу на уши навесят,чтобы часы прочитать...ну не пойдут они дальше 2-3 страничек каждого раздела типового учебника!!!

 

2 StatBars Большое спасибо за статьи.


Integer писал (а) >>

Если сигмоид при значении на входе 1 входит в насыщение, то уже нет разницы, подавать ли на вход значение 2 или 3 - результат будет примерно одинаковый. Надо, чтобы входные значения находились в пределах 1. Конфликтных образцов не должно быть - одинковых значений на входе с разным значением на выходе.

А как на счет входов не нормированных на единицу? Можно ли использовать сигмоид или требуются другие функции?

 

Integer писал (а) >>
Конфликтных образцов не должно быть - одинковых значений на входе с разным значением на выходе.


Получается, что лучше всего иметь на выходе не одно значение (то есть классифицировать рынок не просто вверх или вниз, а и с некоторыми промежуточными состояниями). И на входе побольше.

 
Нормировать надо входные данные. Например найти образец с максимальным диапазоном и по нему нормировать, еще постоянную составляющую убрать. Здесь широкое поле для творчества, например, можно относительно МА посчитать значения или относительно линии регрессии, только потом нормировать. Нормировать можно и каждый образец поотдельности, относительно своего максимального диапазона.
 
Integer писал (а) >>
Нормировать надо входные данные. Например найти образец с максимальным диапазоном и по нему нормировать, еще постоянную составляющую убрать. Здесь широкое поле для творчества, например, можно относительно МА посчитать значения или относительно линии регрессии, только потом нормировать. Нормировать можно и каждый образец поотдельности, относительно своего максимального диапазона.

Да, кстати хорошо что вы затронули этот вопрос. Я все время сомневаюсь как правильнее  (по вашему опыту) будет нормировать - один образец сам на себя или в общем на всех образцах?


Решил переименовать ветку.

 
Только сейчас додумался насчет нормировки относительно общего образца. Думаю так лучше будет - сеть будет учитывать абсалютный размер образца, а не только форму, но наверно будет учиться дольше.
 

Я порой тоже склоняюсь к такому выводу. Получается, что мы просто ужимаем данные и вопрос про ненормированные данные снимается.

Еще есть проблема весов, которые попадают на нулевые значения входа. Они не будут принимать участие в обучении...

 
sergeev писал (а) >>

Еще есть проблема весов, которые попадают на нулевые значения входа. Они не будут принимать участие в обучении...

Да. Получается, что на одном входе всегда ноль будет (на первом). Можно вообще убрать из всех образцов первый элемент, в конец добавить еще один.

Причина обращения: