트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

JeeyCi 2021.11.07 15:35 #24921

에코컴 # :
TensorFlow 문서를 읽으십시오. 모든 것이 생성자 형식으로 되어 있습니다. 사실상. 사실, 이것들은 블랙박스입니다. 관심이 있으시면 손으로 작성한 퍼셉트론 코드를 보여드릴 수 있습니다. 그런데 모든 것이 완전히 행렬 미적분학이며 모든 것이 이를 기반으로 구축됩니다.

나는 이제 TensorFlow 의 Evgeny Dyuka와 그의 ServerNN(코드 읽기)의 포스트 로 돌아왔습니다.

왜냐하면 Habré에서 Python 라이브러리에 대한 일종의 비판을 만났습니다.

sklearn 스택의 xgboost, lightGBM 패키지에는 "나무 모델"에 대한 기능(기능 중요도)의 중요성을 평가하기 위한 기본 제공 방법이 있습니다.

1.이득
이 측정은 모델에 대한 각 기능의 상대적 기여도를 보여줍니다. 계산하기 위해 우리는 각 트리를 살펴보고 노드 분할로 이어지는 트리의 각 노드를 살펴보고 메트릭(지니 불순물, 정보 이득)에 따라 모델의 불확실성이 얼마나 감소하는지 확인합니다.
각 기능에 대해 모든 트리에 대한 기여도가 요약됩니다.

2.커버
각 피처에 대한 관찰 수를 표시합니다. 예를 들어, 4개의 기능과 3개의 트리가 있습니다. 트리 노드의 기능 1이 트리 1, 2 및 3에 각각 10, 5 및 2개의 관측치를 포함한다고 가정하면 이 기능에 대한 중요도는 17(10 + 5 + 2)과 같습니다.

3. 주파수
이 기능이 트리의 노드에서 얼마나 자주 발생하는지 보여줍니다. 즉, 각 트리의 각 기능에 대한 노드로 트리의 총 분할 수가 계산됩니다.

이러한 모든 접근 방식의 주요 문제는 이 기능이 모델 예측에 정확히 어떻게 영향을 미치는지 명확하지 않다는 것입니다. 예를 들어, 우리는 은행 고객의 대출 상환 능력을 평가할 때 소득 수준이 중요하다는 것을 배웠습니다. 하지만 정확히 어떻게? 소득이 높을수록 모델의 예측이 얼마나 편향됩니까?

그러나 여기에서 "나무 모형"에 대해 - 나는 그것들을 피하고 싶습니다. 왜냐하면. 그들은 많은 요원을 먹습니다 (그리고 나는 속도와 소형화의 지지자입니다) ...

- 일반적으로, 귀하의 질문에 대한 대답은 - 물론, 흥미롭습니다 ... 예, 신경망에는 연속 행렬 미적분학이 있다고 생각했습니다.

추신

인용문에 있는 라이브러리가 다항식 계수(답변: 얼마)를 예측할 수 없다면 동적 모델을 어떻게 설명할까요? (선형이 아니라 회귀가 아니라 [같은 것]).. 그래서 지금은 모델 컴파일에 대해 생각하고 있습니다 (미분을 기억하려고 ... 어렵게)

Машинное обучение в трейдинге: теория, практика, торговля и не только

2021.10.23
www.mql5.com

Добрый день всем, Знаю, что есть на форуме энтузиасты machine learning и статистики...

FOREX - 동향, 예측 MQL5 마법사 및 표준 전문 고문 - 기타

eccocom 2021.11.07 15:45 #24922

JeeyCi # :

방금 Evgeny Dyuka의 게시물로 돌아 왔습니다.

왜냐하면 Habré에서 Python 라이브러리에 대한 일종의 비판을 만났습니다.

sklearn 스택의 xgboost, lightGBM 패키지에는 "나무 모델"에 대한 기능(기능 중요도)의 중요성을 평가하기 위한 기본 제공 방법이 있습니다.

얻다
이 측정은 모델에 대한 각 기능의 상대적 기여도를 보여줍니다. 계산하기 위해 우리는 각 트리를 살펴보고 노드 분할로 이어지는 트리의 각 노드를 살펴보고 메트릭(지니 불순물, 정보 이득)에 따라 모델의 불확실성이 얼마나 감소하는지 확인합니다.
각 기능에 대해 모든 트리에 대한 기여도가 요약됩니다.
씌우다
각 기능에 대한 관찰 수를 표시합니다. 예를 들어, 4개의 기능과 3개의 트리가 있습니다. 트리 노드의 기능 1이 트리 1, 2 및 3에 각각 10, 5 및 2개의 관측치를 포함한다고 가정하면 이 기능에 대한 중요도는 17(10 + 5 + 2)과 같습니다.
빈도
이 기능이 트리의 노드에서 얼마나 자주 발생하는지 보여줍니다. 즉, 각 트리의 각 기능에 대한 노드로 트리의 총 분할 수가 계산됩니다.

이러한 모든 접근 방식의 주요 문제는 이 기능이 모델 예측에 정확히 어떻게 영향을 미치는지 명확하지 않다는 것입니다. 예를 들어, 우리는 은행 고객의 대출 상환 능력을 평가할 때 소득 수준이 중요하다는 것을 배웠습니다. 하지만 정확히 어떻게? 소득이 높을수록 모델의 예측이 얼마나 편향됩니까?

글쎄, 내 취향에 파이썬은 요리하는 법을 모르는 사람들에게 비판을받습니다. 다른 모든 것은 이미 만들어진 솔루션을 사용하지 않고 라이브러리를 사용하여 작성하면 더 쉽게 수행할 수 있습니다. 그런데 예를 들어 numpy를 사용하면 C++보다 훨씬 더 빠른 속도를 얻을 수 있습니다. 포트란으로 작성되었습니다. 게다가 이제 Python은 MT5와 직접 쉽게 통합되어 소켓이 있는 서버 없이도 AI를 사용할 수 있습니다.

Forester 2021.11.07 15:46 #24923

JeeyCi # :

방금 Evgeny Dyuka의 게시물로 돌아 왔습니다.

왜냐하면 Habré에서 Python 라이브러리에 대한 일종의 비판을 만났습니다.

sklearn 스택의 xgboost, lightGBM 패키지에는 "나무 모델"에 대한 기능(기능 중요도)의 중요성을 평가하기 위한 기본 제공 방법이 있습니다.

얻다
이 측정은 모델에 대한 각 기능의 상대적 기여도를 보여줍니다. 계산하기 위해 우리는 각 트리를 살펴보고 노드 분할로 이어지는 트리의 각 노드를 살펴보고 메트릭(지니 불순물, 정보 이득)에 따라 모델의 불확실성이 얼마나 감소하는지 확인합니다.
각 기능에 대해 모든 트리에 대한 기여도가 요약됩니다.
씌우다
각 기능에 대한 관찰 수를 표시합니다. 예를 들어, 4개의 기능과 3개의 트리가 있습니다. 트리 노드의 기능 1이 트리 1, 2 및 3에 각각 10, 5 및 2개의 관측치를 포함한다고 가정하면 이 기능에 대한 중요도는 17(10 + 5 + 2)과 같습니다.
빈도
이 기능이 트리의 노드에서 얼마나 자주 발생하는지 보여줍니다. 즉, 각 트리의 각 기능에 대한 노드로 트리의 총 분할 수가 계산됩니다.

이러한 모든 접근 방식의 주요 문제는 이 기능이 모델 예측에 정확히 어떻게 영향을 미치는지 명확하지 않다는 것입니다. 예를 들어, 우리는 은행 고객의 대출 상환 능력을 평가할 때 소득 수준이 중요하다는 것을 배웠습니다. 하지만 정확히 어떻게? 소득이 높을수록 모델의 예측이 얼마나 편향됩니까?

이 모든 방법은 쓸모가 없습니다. 다음은 수표입니다. https://www.mql5.com/en/blogs/post/737458
나무와 숲은 빠르게 계산됩니다. 한 번에 하나씩 기능을 추가/제거할 수 있습니다. 그리고 개선되는 것과 결과를 악화시키는 것을 찾으십시오.

Сравнение разных методов оценки важности предикторов.

www.mql5.com

Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За

eccocom 2021.11.07 15:50 #24924

모델의 경우 요점은 그 안에 있는 것이 아니라 AI가 본질적으로 근사치이고 이것이 시장을 제외한 다른 모든 경우에 강점이라는 사실에 있습니다. 가격 파동을 일으키는 바다 아래 너무 많은 물고기와 고지라. 가격에 모든 것이 포함되어 있다고 가정하고 사실이지만 이것은 너무합니다. 신경망은 일종의 시스템의 일부일 뿐이며 이에 동의하지 않는 사람은 자기기만에 빠진 것입니다.

mytarmailS 2021.11.07 16:07 #24925

에코컴 # :
모델의 경우 요점은 그 안에 있는 것이 아니라 AI가 본질적으로 근사치이고 이것이 시장을 제외한 다른 모든 경우에 강점이라는 사실에 있습니다. 가격 파동을 일으키는 바다 아래 너무 많은 물고기와 고지라. 가격에 모든 것이 포함되어 있다고 가정하고 사실이지만 이것은 너무합니다. 신경망은 일종의 시스템의 일부일 뿐이며 이에 동의하지 않는 사람은 자기기만에 빠진 것입니다.

그리고 AI 근사기를 부르는 사람은 무엇을 하고 있습니까? )

eccocom 2021.11.07 16:44 #24926

mytarmailS # :
그리고 AI 근사기를 부르는 사람은 무엇을 하고 있습니까? )

글쎄요, 제가 인공지능을 잘못 불렀을 수도 있습니다. 왜냐하면 저는 단지 신경망만을 의미했고 이것은 인공지능의 특별한 경우이기 때문입니다. 나는 다른 사람들과 마찬가지로 성배를 찾는 일에 몰두하고 있으며, 광신도 없이 선택적으로 수행합니다.) 나는 모델에 대한 아이디어를 찾고자 여기에 왔습니다(정확히 신경망에 대한 이해에서). 공유할 것이 있습니다. 물론 경력이 20년은 아니지만 국회에 100번의 선택지를 거쳤다. 근거리에서 최대 효율은 약 68%에 이르렀지만 이것이 안정적이지 않고 상황에 따라 다르다는 것을 이해하실 것입니다.

mytarmailS 2021.11.07 16:56 #24927

에코컴 # :
글쎄요, 제가 인공지능을 잘못 불렀을 수도 있습니다. 왜냐하면 저는 단지 신경망만을 의미했고 이것은 인공지능의 특별한 경우이기 때문입니다. 나는 다른 사람들과 마찬가지로 성배를 찾는 일에 몰두하고 있으며, 광신도 없이 선택적으로 수행합니다.) Suda는 모델에 대한 아이디어를 찾고 있었습니다(정확히 신경망에 대한 이해에서). 공유할 것이 있습니다. 물론 경력이 20년은 아니지만 국회에 100번의 선택지를 거쳤다. 근거리에서 최대 효율은 약 68%에 이르렀지만 이것이 안정적이지 않고 상황에 따라 다르다는 것을 이해하실 것입니다.

네 당연히 이해합니다...

그러나 20년 경력의 전문가가 다른 사람에게 코드를 구걸하는 것을 조심하십시오. ;)

eccocom 2021.11.07 17:27 #24928

mytarmailS # :
네 당연히 이해합니다...

그러나 20년 경력의 전문가가 다른 사람에게 코드를 구걸하는 것을 조심하십시오. ;)

네, 사람이 좋으면 코드에 대해 미안하지 않습니다.) 그건 그렇고, 나는 Mihail Marchukajtes의 기사를 읽고 거기에 적용된 아이디어 중 일부를 활용하지만 이에 대한 이유는 저자의 것과 완전히 다릅니다. 레이어가 가장 효과적인 것으로 판명된 모델의 변형을 논의하는 것은 흥미로울 것입니다. 정황 증거에 따르면 Michael은 완전히 연결된 Sequential() 레이어를 사용하는 것으로 보입니다.

Mihail Marchukajtes

2021.10.12
www.mql5.com

Профиль трейдера

mytarmailS 2021.11.07 17:39 #24929

에코컴 # :
네, 사람이 좋으면 코드에 대해 미안하지 않습니다.) 그건 그렇고, 나는 Mihail Marchukajtes의 기사를 읽고 거기에 적용된 아이디어 중 일부를 활용하지만 이에 대한 이유는 저자의 것과 완전히 다릅니다. 레이어가 가장 효과적인 것으로 판명된 모델의 변형을 논의하는 것은 흥미로울 것입니다. 정황 증거에 따르면 Michael은 완전히 연결된 Sequential() 레이어를 사용하는 것으로 보입니다.

그는 뉴런을 전혀 사용하지 않고 기성 작가의 평범한 프로그램(SVM과 MGUA의 일종의 하이브리드가 있음)을 사용하며 각각 파이썬이나 R-ke, 즉 Sequental( ) 그에게는 익숙하지 않은데, 신경망에서 20년 동안 똑같은 경험을 했지만, 그런 것에 관심을 갖기에는 너무 이르다...

eccocom 2021.11.07 17:59 #24930

mytarmailS # :
그는 뉴런을 전혀 사용하지 않고 기성 작가의 평범한 프로그램(SVM과 MGUA의 일종의 하이브리드가 있음)을 사용하며 각각 파이썬이나 R-ke, 즉 Sequental( ) 그에게는 익숙하지 않은데, 신경망에서 20년 동안 똑같은 경험을 했지만, 그런 것에 관심을 갖기에는 너무 이르다...

))))). 나는 당신이 의사 소통의 견고한 짐을 가지고있는 것처럼 보입니다. 나 자신은 10개의 경우 중 8개의 경우에 힌두교 코드를 작성한다는 것을 인정해야 합니다.)), 하지만 경험을 교환할 수 있다면 여전히 기쁠 것입니다. 그리고 신경망 뿐만 아니라 전체 어드바이저 구조를 파이썬으로 작성하시는 분들을 찾아보시면 좋을 것 같습니다.

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2493