Что подать на вход нейросети? Ваши идеи... - страница 64

 

Прежде чем говорить о прикладном виде (алгоритме) обучения, и даже теории обучения, хотелось обратить внимание на полную картину локального сабжа (обучения). От и до.

Исходя из некоторых ответов, 
Обучение — это постепенное осваивание способа взаимодействия с миром, где обучение становится не столько процессом накопления знаний, сколько постоянной адаптацией, пониманием закономерностей и возможностью их применять на практике в новом контексте.

Окей, обобщили понятие. 


Но если анализ — это разбиение целого на части, то как можно изучать обучение без изучения предмета обучения — информации. Имитаторы интеллектуального труда (ИИ, LLM) тоже работают с ней и ни с чем другим. Информация прежде всего находится в виртуальном поле. 

Если виртуальность — сущность нематериальная, то прежде чем изучать явления виртуальности без привязки к реальной биологии/робототехнике и в принципе к реальному миру, при анализе нужно изучить минимальную единицу виртуального пространства. Что это может быть?
В реальности — частицы, атомы, молекулы. Ведь чтобы понять фундаментальные единицы виртуальности, нам нужно определить, что может быть эквивалентом «частиц», «атомов» и «молекул» в виртуальном пространстве.


Сейчас будет очевидная инфа, не агримся: 


1. Очевидно, бит как минимальная единица:

На самом низком уровне любой информации, будь то текст, изображение или звук, находится бит — элементарная единица информации, принимающая одно из двух значений: 0 или 1. Это базовая «цифровая» единица, с которой работают все вычислительные системы. В контексте виртуального мира, бит можно считать тем, из чего состоят все более сложные структуры: программы, объекты, взаимодействия.

Но если бит — это просто элементарный переключатель, то нам нужно двигаться дальше, чтобы понять, как из этих битов создаётся виртуальная реальность.


2. Блоки информации (информационные объекты):

Информация может представлять собой объекты разного уровня сложности, например:

  • Байт (состоит из 8 битов и всё такое) — минимальная единица, на которой базируется символ или знак.
  • Информационный объект — это уже осмысленный фрагмент данных, который имеет значение в виртуальном пространстве. Это может быть пиксель изображения, звук, фрагмент текста или отдельный символ.

Таким образом, на более высоком уровне минимальной единицей может быть не бит, а некий информационный объект — минимальная порция данных, которая имеет смысл в конкретном контексте.


3. Информационная связь или отношение:

Информация сама по себе, будь то бит или байт, не имеет ценности, если она не находится в каком-то отношении с другими данными. Это приводит нас к следующей мысли: минимальная единица виртуальности может быть отношением или связью между элементами информации. В таком случае виртуальное пространство — это не просто набор данных, а сеть связей и взаимодействий. Как в реальности атомы взаимодействуют через силы, так и в виртуальной реальности информационные объекты взаимодействуют через отношения.


4. Единица смысла — семантический элемент:

Мы можем пойти дальше и предположить, что минимальной единицей виртуального пространства является семантический элемент — минимальная единица смысла, которую система или человек может воспринять. Это может быть слово, символ, действие или любое другое явление, которое имеет значение в определённом контексте.

Если виртуальное пространство — это информация, то смысл и контекст становятся ключевыми. Без смысла информация теряет свою значимость. Поэтому можно рассматривать минимальную единицу как фрагмент информации, который несёт значение, будь то образ, звук, текст или даже команда в программном коде.


5. Единица взаимодействия:

Виртуальное пространство — это не просто поле данных, это активное взаимодействие между компонентами. Поэтому ещё одной минимальной единицей может быть акт взаимодействия, будь то обработка данных, передача сигнала или изменение состояния в системе. Взаимодействие — это то, что делает виртуальность «живой» и динамичной.


6. Элементарная структура — паттерн или шаблон:
Ещё одной мыслью может быть, что минимальная единица виртуальности — это не просто единичные данные, а паттерн — повторяющаяся структура, которая служит основой для более сложных явлений. Например, в программировании это могут быть шаблоны кода или алгоритмов, которые можно считать «атомами» программного мира. В таком понимании паттерн — это минимальная структура, из которой строится весь виртуальный мир.


Вывод:

Минимальная единица виртуального пространства может быть разной в зависимости от того, с какого уровня мы смотрим на виртуальность:

  • Бит — это самая простая физическая единица информации.
  • Информационный объект — более сложная структура, которая может быть визуализирована или осмыслена (например, пиксель, символ, фрагмент кода).
  • Семантический элемент — минимальная единица смысла, которая имеет значение в определённом контексте.
  • Отношение или взаимодействие — минимальная динамическая единица, связывающая данные и создающая структуры.
  • Паттерн или шаблон — элементарная повторяющаяся структура, из которой создаются сложные системы.

Смотря на виртуальное пространство как на поле информации, каждая из этих единиц важна, но ключевое значение, возможно, имеет то, как они взаимодействуют и создают смысловые структуры.



Теперь форекс:

Учитывая, что в нашей информационной среде есть только один объект — график цены, то каждая цена, каждая котировка — это и есть минимальная единица информации. Каждая «частица» графика, соединяясь в «атомы» графика и дальше в «молекулы», образуют разное «вещество» - паттерны. Эти паттерны в свою очередь затем составляют нечто больше. 

Но если в реальности вещество имеет одно и то же свойство в любой момент времени, то в виртуальном поле у нас существует такое ключевое явление, как контекст

Подобно тексту, который читает Чат, определяя контекст всего лишь из 2-х слов, совокупности котировок по идее также должны иметь «контекст». На примере: когда сегодня пересечение МА вверх - это бай. А завтра пересечение МА тоже вверх - это уже сел. 





Так вот, как бы выглядела структура/архитектура движка, чтобы 

1. Изучать совокупности битов: информационные объекты, семантичекие элементы, отношения и взаимодействия, паттерны и шаблоны. 
2. Изучать неизвестный язык, подобно расшифровке древней письменности

И само изучение: как бы выглядело это обучение



Вот есть всякие MLP, RNN, LSTM и прочее: в них просто подаются числа. Но числа для таких систем работают тогда, когда это отражение реальной действительности (стационарности), поэтому в чисто виртуальном объекте по типу графика цены они «в упор» — не работают. На вход подают числа и дальше извращаются с этими числами. А что эти числа означают — никто не знает. Просто решили сделать "окно". И подать его. 

Обучение — это что-то более фундаментальное, сложное, состоящее из нескольких «движков»/отделов, которые, наверное, должны быть связаны друг с другом, передавать друг другу что-то, сохранять/изменять/удалять/корректировать. ЧИать контекст. 
 
Andrey Dik #:

1. Причем здесь запоминание и "переборе возможных вариантов"? Не нужно выдумывать того, чего я не утверждал, а значит и не мог навязывать кому либо.))

Выше вы писали:

Запоминание. Если в процессе сохранения осуществляется оценка качества, это уже запоминание.
Расскажите, как вы оцениваете качество при сохранении такой информации: 3*3=9, которое, как вы утверждаете, только после оценки качества становится запоминанием.
 
Forester #:

Выше вы писали:

Расскажите, как вы оцениваете качество при сохранении такой информации: 3*3=9, которое, как вы утверждаете, только после оценки качества становится запоминанием.

Озвучиваете ответы на все варианты в таблице умножения и подсчитываете количество правильных ответов. Когда достигнете 100% правильных ответов - поздравления!, вы выучили таблицу умножения.

Сохранение от запоминания отличается ещё и тем, что не требует формирования множественных связей. Единица информации при сохранении занимает единицу места на носителе, в то время как запоминание требует возникновения связей между единицами сохранённой информации, а это уже процесс, требующий оценке.

Все учились в школе и помнят, как это было. Таблицу умножения с первого раза далеко не все смогли запомнить, часто ошибались.))

Если грубо, запоминание по сути - сжатие информации и занимает меньше места на носителе, нежели сохранение и как правило это итерационный процесс.
 
Andrey Dik #:
Озвучиваете ответы на все варианты в таблице умножения и подсчитываете количество правильных ответов. Когда достигнете 100% правильных ответов - поздравления!, вы выучили таблицу умножения.

Оцените только запись 3*3=9. Вы же записываете только по 1 строке. Чтобы ее запомнить, как ее надо оценить?

 
Andrey Dik #:

Озвучиваете ответы на все варианты в таблице умножения и подсчитываете количество правильных ответов. Когда достигнете 100% правильных ответов - поздравления!, вы выучили таблицу умножения.

Сохранение от запоминания отличается ещё и тем, что не требует формирования множественных связей. Единица информации при сохранении занимает единицу места на носителе, в то время как запоминание требует возникновения связей между единицами сохранённой информации, а это уже процесс, требующий оценке.

Все учились в школе и помнят, как это было. Таблицу умножения с первого раза далеко не все смогли запомнить, часто ошибались.))

возможно лучше пример про треугольник Паскаля. Таблицу умножения хотя-бы до 10 все помнят с младых ногтей..

про треугольник паскаля - тоже в школе, но учатся правилам построения. И всей информации - единицы по осям и правило рекуррентного сложения ("сложи число слева с числом сверху, зри коэффициент"). 

 
Forester #:

Оцените только запись 3*3=9. Вы же записываете только по 1 строке. Чтобы ее запомнить, как ее надо оценить?

В данном случае ответ будет либо верным, либо нет. Максимально возможное количество правильных ответов - 1. Достигните этого показателя - значит запомнили.
 
Andrey Dik #:
В данном случае ответ будет либо верным, либо нет. Максимально возможное количество правильных ответов - 1. Достигните этого показателя - значит запомнили.
Не понятно. Опишите алгоритм оценки.