트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

Forester 2022.10.18 16:58 #27901

mytarmailS #:

평균화는 나쁜 생각, 아주 나쁜 생각이라고 생각합니다...

특히 관련이 없는 행은 산을 쌓아 올리는 방식이죠. Line

100개의 예측 라인 중 어떤 것을 사용해야 할까요? 평균이 가장 확실한 해결책입니다.

mytarmailS 2022.10.18 18:06 #27902

elibrarius #:
그렇다면 100개의 예측 라인 중 어떤 것을 예측해야 할까요? 평균이 가장 확실한 해결책입니다.

50개의 예측을 50개씩 평균을 내서 수평 예측을 얻었다고 가정해 보겠습니다.)

Forester 2022.10.18 18:55 #27903

mytarmailS #:
글쎄요, 50개의 예측이 50개씩 올라가고, 평균을 내고, 수평 예측을 얻었다고 가정해 보겠습니다.)

그리고 그게 다입니다... 어떤 옵션이 있나요?

mytarmailS 2022.10.18 18:55 #27904

elibrarius #:
그게 다입니다. 어떤 옵션이 있나요?

위에서 제안한 것과 같이

Forester 2022.10.18 19:13 #27905

elibrarius #:
100개의 예측 라인 중 어떤 라인을 예측해야 할까요?

제안을 보지 못했습니다)

Maxim Dmitrievsky 2022.10.19 04:39 #27906

"유익한" 마크업의 변형인 펜 테스트입니다:

def labeling_entropy(dataset, min_Mi = 0.1, min=15, max=15):
    labels = []
    MIs = []
    for i in range(max, dataset.shape[0]-max*2):
        rand = random.randint(min, max)
        curr_pr = dataset['close'][i]
        future_pr = dataset['close'][i + rand]
        full_pr = dataset[i-rand:i+rand]

        mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])
        MIs.append(mi.mean())

        if future_pr + MARKUP < curr_pr and mi.mean() > min_Mi:
            labels.append(1.0)
        elif future_pr - MARKUP > curr_pr and mi.mean() > min_Mi:
            labels.append(0.0)
        else:
            labels.append(2.0)
    
    dataset = dataset.iloc[max:]
    dataset = dataset.iloc[:len(labels)].copy()
    dataset['labels'] = labels
    return dataset.dropna(), MIs

내 기사에서와 같이 일련의 부호를 취하고 레이블을 마크 업하지만 거래를 시작하기 전에 부호 집합의 n- 문자열과 미래 가격의 n- 문자열 사이의 상호 정보 (회귀 유형)를 고려합니다.

상호 정보가 임계값보다 낮으면 거래하지 않는 것으로 표시합니다.

그런 다음 2019년부터 신호와 거래/거래하지 않음에 대해 2개의 모델을 학습시켰습니다.

Res:

이 접근 방식으로는 별다른 성과를 얻지 못했습니다.

mytarmailS 2022.10.19 05:28 #27907

elibrarius #:
제안을 보지 못했습니다.)

제 게시물, 마지막 사진을 다시 읽어보세요.

여전히 다음과 같이 나와 있습니다.

Maxim Dmitrievsky 2022.10.19 06:26 #27908

논리적으로 할 수 있는 일은 다른 옵션을 시도하는 것이었습니다:

mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[0:rand]) сравниваем фичи и цены в момент предсказания
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand*2], full_pr[full_pr.columns[0]].iloc[0:rand*2]) сравниваем на глубину предсказания вперед + назад
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[rand:rand*2], full_pr[full_pr.columns[0]].iloc[rand:rand*2]) только вперед
mi = mutual_info_regression(full_pr.iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])текущие цены и фичи в момент предсказания VS будущие цены

모든 옵션은 아무것도 생성하지 않습니다.

Forester 2022.10.19 07:49 #27909

mytarmailS #:
제 게시물, 마지막 사진을 다시 읽어보세요.

여전히 이렇게 쓰여 있습니다.

처음 25개 막대에는 2개의 변형만 있었습니다. 그리고 2개의 오류는 작은 오류입니다.
그리고 이것은 수천 개의 차트 중 하나의 변형일 뿐입니다. 다른 경우에는 상황이 다를 수 있습니다. 전략을 세우고 (공식화하지 않은) 새로운 데이터의 균형선을 지켜봐야합니다 (Maxim은 그의 아이디어를 끝까지 가져 왔고 모든 것이 한 번에 명확 해졌습니다).

Maxim Dmitrievsky 2022.10.19 08:00 #27910

1년 이상 전에 클러스터링으로 동일한 작업을 수행한 다음 그림과 같이 평균 수준을 결정하고 주문을 배치했습니다. 위, 아래, 평균 회귀의 3 개의 클러스터로 나뉩니다. 그것은 훈련에 잘 작동합니다.

재미있는 점은 어떤 특별한 수단을 사용하더라도 무작위에서 좋은 것을 얻을 수 없다는 것입니다.

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2791