양적 거래 (Quantitative trading) - 페이지 6

 

Ernest Chan(Predictnow.ai) - "최적화를 위해 기계 학습을 사용하는 방법"



Ernest Chan(Predictnow.ai) - "최적화를 위해 기계 학습을 사용하는 방법"

Predictnow.ai의 공동 설립자인 Ernest Chan은 시장의 체제 변화를 다룰 때 전통적인 포트폴리오 최적화 방법이 직면한 문제를 탐구합니다. 그는 기계 학습이 이 문제에 대한 해결책을 제공할 수 있다고 제안합니다. Chan은 그의 팀이 변동성, 가격 및 금리와 같은 다양한 재무 측면을 측정하는 시계열 기능 통합에 중점을 두고 포트폴리오 최적화에 기계 학습 기술을 적용하는 방법을 설명합니다. Farmer-French Three Factor 모델을 순위가 예측보다 더 중요하다는 이해와 결합하여 최적의 포트폴리오 최적화를 달성하는 것을 목표로 합니다.

Chan은 계속해서 CBO 모델의 성과에 대한 구체적인 결과를 공유하고 이 접근 방식을 사용하여 포트폴리오 성과 개선을 경험한 클라이언트의 예를 제공합니다. 그는 기계 학습 모델이 제도 변화에 적응할 수 있는 능력을 갖추고 있어 진화하는 시장 상황에 효과적으로 대응할 수 있다고 강조합니다. 또한 시계열 기능을 활용하는 기계 학습 알고리즘을 사용하여 S&P 500 지수 및 그 구성 요소의 수익을 계산하는 방법에 대해 설명합니다.

또한 Chan은 최적화 및 추측을 위해 그의 팀에서 사용하는 앙상블 접근 방식을 강조합니다. 그는 광범위한 계산 능력의 필요성을 제거하는 "비밀 소스"를 언급합니다. 제도를 예측하고 수익 분배를 조절하는 2단계 프로세스를 따르기보다는 시각적 요소를 활용하여 포트폴리오의 성과를 직접 예측합니다. 또한 Chan은 알고리즘에 교육 샘플의 상당 부분을 포함함으로써 예상 수익이 과거 결과와 일치한다고 설명합니다.

Ernest Chan 박사는 제도 변화가 있을 때 기존 포트폴리오 최적화 방법이 직면한 문제를 설명하고 이 문제를 해결하는 데 있어 기계 학습의 역할을 강조합니다. 그는 기계 학습 기술의 적용, 시계열 기능의 중요성 및 최적의 포트폴리오 최적화를 달성하는 데 있어 순위 지정의 중요성에 대해 논의합니다. 그는 변화하는 시장 조건에 대한 기계 학습 모델의 적응성을 강조하면서 구체적인 결과와 고객 성공 사례를 공유합니다. Chan은 또한 기계 학습 알고리즘을 사용하여 수익 계산에 대한 통찰력을 제공하고 앙상블 접근 방식과 고유한 방법론을 조명합니다.

  • 00:00:00 이 섹션에서 Ernest Chan은 전통적인 포트폴리오 최적화 방법과 시장 체제 변화의 문제에 대해 논의합니다. 이는 과거에 최적이었던 포트폴리오가 미래에는 최적이 아닐 수 있음을 의미합니다. 그는 대부분의 방법이 과거의 역사적 수익이나 정보를 입력으로 사용하고 체제 변화를 고려하지 않는다고 설명합니다. 그는 기계 학습이 빅 데이터와 여러 시장에서 관찰된 모든 변수를 활용하여 이 문제를 해결하는 데 도움이 될 수 있다고 제안합니다. 머신 러닝은 과거 수익률만을 기반으로 하지 않는 기대 수익률을 생성할 수 있으므로 제도 변화를 처리하는 데 더 적합할 수 있습니다.

  • 00:05:00 이 섹션에서 Ernest Chan은 재무 체제의 개념과 이것이 최적화에 미치는 영향에 대해 설명합니다. 그는 약세장이나 강세장과 같이 실행 가능한 체제가 있는 반면 명시적으로 정의할 수 없고 지속적으로 변화하는 숨겨진 체제도 있다고 설명합니다. 이러한 체제는 예측하기 어렵고 고전적인 최적화 방법을 망칩니다. 이러한 이해로 인해 Chan 박사는 많은 변수를 사용하여 현재 체제를 측정하고 적응할 수 있는 조건부 포트폴리오 최적화 기술을 개발했습니다. 이 기술은 다양한 시장 상황에서 거래 전략 성과를 향상시킬 수 있습니다.

  • 00:10:00 이 섹션에서는 Ernest Chan이 최적화를 위한 기계 학습 사용과 지도 학습을 사용하여 매개변수를 조정하는 방법에 대해 설명합니다. 그는 감독 학습에서 최적화할 매개변수와 같은 레이블이 지정된 대상 변수가 있다고 설명합니다. 이는 예리한 비율 또는 거래 전략의 향후 1개월 수익률입니다. 입력은 현재 체제를 측정하는 시장 및 거시 경제 변수와 거래자가 조정할 수 있는 제어 변수의 조합으로 큰 데이터 세트를 형성합니다. 최적화를 위해 조건부 매개변수 최적화인 최대 샤프 비율을 찾기 위해 매개변수의 다양한 조합에 대한 철저한 검색이 수행됩니다. Ernest Chan은 입력을 위한 하나의 행을 형성하기 위해 시장 기능과 제어 기능의 조합을 설명하는 장난감 전략을 사용하는 간단한 예를 들어 결론을 내립니다.

  • 00:15:00 이 섹션에서 Ernest Chan은 그의 팀이 기계 학습을 포트폴리오 최적화에 적용하는 방법을 설명합니다. 팀은 매개변수 최적화에 적용한 것과 동일한 기계 학습 접근 방식을 사용하여 이 보다 광범위한 문제를 해결합니다. 그들은 빅 데이터를 입력 기능으로 사용하고 숨겨진 정권의 암시적 예측을 사용합니다. 과거 수익률과 수익률의 공분산만을 입력 데이터로 사용하는 기존 포트폴리오 최적화 방법과 달리 현재 시장 상황, 기술 및 기본 지표, 거시 경제 지표를 고려하여 체제에 적응하고 현재 상황에서 최적의 포트폴리오를 찾는 방법입니다. 시장 상황. 팀은 Q&A의 질문에 답하면서 시뮬레이션이 아니라 실제 시장 데이터를 사용하여 특정 가상 자본 배분에서 수익을 계산한다고 설명합니다.

  • 00:20:00 이 섹션에서는 Ernest Chan이 기계 학습을 통해 포트폴리오 최적화에 사용되는 기능 유형을 설명합니다. 그는 시계열 기능만 사용하고 단면 기능은 포함하지 않는다고 강조합니다. 이 방법은 재무, 변동성, 가격 및 금리를 측정하는 요소와 같은 포트폴리오 또는 시장 체제 전체의 특성에 중점을 둡니다. 이것이 이상하게 보일 수 있지만 Chan은 이를 Farmer-French Three Factor Model의 설명 품질과 관련시킵니다. 기계 학습 모델을 사용하는 목적은 수익을 예측하는 것이 아니라 최적의 포트폴리오 최적화를 달성하기 위해 정확하게 순위를 매기는 것입니다.

  • 00:25:00 이 섹션에서 Ernest Chan은 재무 애플리케이션에서 순위 지정의 중요성과 이를 포트폴리오 최적화에 적용하는 방법에 대해 설명합니다. 그는 기계 학습 모델을 사용하여 횡단면 수익을 예측하는 기존 방법은 수익 예측의 크기와 부호가 정확하지 않은 경우 가비지 인, 가비지 아웃 상황을 초래할 수 있다고 설명합니다. 그러나 Fama-French Factor 모델과 예측보다 순위가 더 중요하다는 개념을 결합한 CPO 방법을 사용하면 프로그램의 모든 단계에서 오류에 대해 최적의 솔루션이 훨씬 더 안정적입니다. 그는 또한 이 방법이 순위 때문에 기계 학습 예측에서 엄청난 오류를 허용할 수 있다고 언급합니다.

  • 00:30:00 이 섹션에서 Ernest Chan은 옵션 구매 활동의 순 델타와 같은 친숙한 시장 지표를 사용하여 행동 금융의 효과를 측정할 수 있는 방법에 대해 설명합니다. 그는 그의 회사가 현상의 핵심 원인이 아니라 현상의 영향을 고려하는 CBO 모델의 기능 중 하나로 이 메트릭을 사용한다고 설명합니다. 그런 다음 Chan은 평균 분산 방법을 능가하고 기존 자산을 능가하는 것을 포함하여 CBO 모델의 성능에 대한 구체적인 결과를 공유합니다. 또한 그는 CBO 방법이 다른 방법과 비교하여 특정 기간 동안 성장주 및 대형주에 가중치를 할당하는 데 어떻게 더 나은 성과를 냈는지에 대한 예를 제공합니다.

  • 00:35:00 이 섹션에서 화자는 시장 체제에 적응할 수 있기 때문에 고전적인 방법을 능가하는 CBO(Combinatorial Bayesian Optimization) 방법과 달리 투자 및 거래의 고전적인 방법이 어떻게 고정되고 적응적이지 않은지 설명합니다. 더 나은 성능. CBO는 기존 포트폴리오에 이미 관련 거래 비용이 있더라도 거래를 최적화하고 권장하도록 설계되었습니다. CBO는 추가 거래 비용을 발생시키지 않으며 특정 주식을 더 많이 또는 더 적게 매수하도록 권장합니다. 그런 다음 발표자는 CBO 방법을 채택하고 포트폴리오 성능이 개선된 고객의 예를 인용합니다.

  • 00:40:00 이 섹션에서 Ernest는 각 주식에 대해 0~25%의 제약 조건에도 불구하고 주식 포트폴리오에서 긍정적인 수익을 달성할 수 있었던 사례 연구에 대해 이야기합니다. 포트폴리오는 기술주로 구성되었고 2022년에 심하게 폭락할 것으로 예상되었지만, 그 기간 동안 현금에 50%를 할당한 방식이 수익 창출에 도움이 되었습니다. 방법의 재현성에 대해 질문을 받았을 때 Ernest는 옵션의 순 델타와 같은 일부 기능이 중요한 입력 기능이지만 웹 사이트에 이에 대한 높은 수준의 설명을 공개했다고 설명합니다. 그는 또한 기계 학습을 위한 그래디언트 프로세스 의사 결정 트리 및 기타 알고리즘을 사용하는 것에 대해 언급하며 시장 체계를 정의하는 접근 방식은 수백 가지 기능을 사용하여 표현하는 것입니다.

  • 00:45:00 이 섹션에서 Chan은 샤프 비율과 같은 반응 변수를 구성하고 각 시장 상태에 대한 제어 변수의 다양한 시나리오에 대해 함수 F를 피팅하여 기계 학습을 최적화에 사용할 수 있는 방법을 설명합니다. 감독 학습 알고리즘의 레이블은 샤프 비율과 같이 최대화할 변수이며 각 포트폴리오 제안은 최고의 성과를 내는 포트폴리오를 찾을 때까지 예측 공식에 입력됩니다. Chan은 문제의 복잡성이 포트폴리오의 자산 수에 따라 선형적으로 확장되지 않지만 그의 팀은 문제를 관리하는 알고리즘을 개발했다고 말합니다. 그들이 사용한 가장 큰 포트폴리오 유니버스는 S&P 500입니다.

  • 00:50:00 이 섹션에서 Ernest Chan은 기계 학습 모델이 현금 할당을 지표로 사용하여 체제 변화에 어떻게 대응하는지에 대한 예를 제공합니다. 2022년 약세장이 시작되었을 때 이 모델은 대부분 현금으로 유지되어 마이너스 수익률로부터 포트폴리오를 구했습니다. 그는 또한 학습 알고리즘과 최적화 알고리즘의 비선형 특성으로 인해 목적 함수가 기존의 최대 샤프 비율이나 수익률뿐만 아니라 무엇이든 설정할 수 있으며 가중치, ESG 및 회전율과 같은 제약 조건이 가능하다고 언급합니다. 에 쓰이는. 이 소프트웨어는 유연하며 클라이언트가 제공하는 모든 시장 기능을 수용할 수 있습니다. 또한 Chan은 모델이 포트폴리오의 구성 요소 추가 및 삭제를 허용하고 각 재조정으로 모델을 재훈련할 수 있기 때문에 짧은 이력을 가진 주식을 처리할 수 있다고 언급합니다.

  • 00:55:00 이 섹션에서 Chan은 S&P 500 지수 및 그 구성요소의 수익률 계산에 대해 설명합니다. 그는 기계 학습 알고리즘이 주식 수익률이 아닌 시계열 기능을 입력으로 사용하기 때문에 포트폴리오의 수익률을 계산하기 위해 기계 학습 알고리즘을 사용하는 것은 Markowitz 기법을 사용하는 것과 다르다고 설명합니다. Chan은 또한 제도 변경이 180개의 변수로 정의되며 일별, 월별 및 분기별 측정값이 포트폴리오의 미래를 예측하는 데 유용한 최상위 기능을 선택하는 기계 학습 알고리즘에 입력되는 기능으로 사용된다는 점에 주목합니다. 마지막으로 Chan은 문제를 회귀 문제가 아닌 순위 문제로 재구성하고 분류 문제로도 재구성할 수 있습니다.

  • 01:00:00 이 섹션에서 발표자는 하나의 최적 포트폴리오 대신 포트폴리오 앙상블을 사용할 가능성에 대해 논의하지만 연구팀은 더 자세히 조사해야 합니다. 또한 포트폴리오 조합이 100만 개 있는 경우 매일 과거 데이터의 100만 개 조합에 대해 모델을 교육해야 함을 확인했습니다. 그러나 그들은 그러한 계산 능력의 필요성을 제거하는 "비밀 소스"를 언급합니다. 연사는 또한 제도를 예측한 다음 해당 제도의 수익 분포를 조건으로 하는 2단계 프로세스를 사용하지 않고 대신 시각적 요소를 사용하여 포트폴리오의 성과를 직접 예측한다고 설명합니다. 그들은 모델에 해당 교육 샘플을 많이 포함하면 예상 수익이 과거에 발생한 것과 비슷할 것이라고 말하면서 토론을 끝냅니다.
Ernest Chan (Predictnow.ai) - "How to Use Machine Learning for Optimization"
Ernest Chan (Predictnow.ai) - "How to Use Machine Learning for Optimization"
  • 2023.03.01
  • www.youtube.com
Abstract: Conditional Portfolio Optimization is a portfolio optimization technique that adapts to market regimes via machine learning. Traditional portfolio...
 

금융 기계 학습 - Ernest Chan 박사의 실무자의 관점



금융 기계 학습 - Ernest Chan 박사의 실무자의 관점

이 유익한 비디오에서 Dr. Ernest Chan은 금융 머신 러닝의 영역을 탐구하고 몇 가지 주요 측면을 탐색하고 중요한 고려 사항을 조명합니다. 그는 과적합 방지의 중요성을 강조하고 모델의 투명성을 옹호합니다. 또한 Chan 박사는 비선형 모델을 활용하여 시장 행동을 예측할 때의 이점을 강조합니다. 그러나 그는 또한 반사성과 시장의 끊임없이 변화하는 역학과 같은 금융 시장에서 기계 학습의 한계에 대해서도 논의합니다.

Chan 박사가 강조하는 한 가지 중요한 점은 금융 데이터 과학에서 도메인 전문성의 중요성입니다. 그는 모델의 결론에 영향을 미치는 필수 변수를 더 잘 이해하기 위해 기능 선택의 필요성을 강조합니다. 이러한 중요한 입력을 식별함으로써 투자자와 거래자는 손실에 대한 통찰력을 얻고 특정 결정이 내려진 이유를 이해할 수 있습니다.

Dr. Chan은 또한 위험 관리 및 자본 할당에 기계 학습을 적용하는 방법에 대해서도 다룹니다. 그는 틈새 시장을 찾고 자금이 풍부한 조직과의 직접적인 경쟁을 피하라고 제안합니다. 그렇게함으로써 실무자는 이러한 영역에서 성공할 가능성을 높일 수 있습니다.

비디오 전반에 걸쳐 Dr. Chan은 다양한 모델 및 전략과 관련된 장점과 문제점을 강조합니다. 그는 선형 모델과 같은 기존의 정량적 전략이 이해하기 쉽고 과대적합될 가능성이 적지만 예측 변수 간의 비선형 종속성 때문에 어려움을 겪고 있다고 지적합니다. 대조적으로 기계 학습 모델은 비선형 관계를 처리하는 데 탁월하지만 그 복잡성과 불투명도는 결과를 해석하고 통계적 유의성을 평가하는 데 문제가 될 수 있습니다.

Chan 박사는 또한 기계 학습을 사용하여 금융 시장을 예측하는 것의 한계에 대해 논의합니다. 그는 시장이 지속적으로 진화하고 있어 정확한 예측이 어렵다고 강조합니다. 그러나 그는 기계 학습이 거래 전략과 같은 개인 정보를 예측하는 데 성공할 수 있다고 제안합니다. 여기서는 동일한 매개변수로 경쟁할 가능성이 적습니다.

또한 Dr. Chan은 범주형 데이터를 포함한 기본 데이터를 기계 학습 모델에 통합하는 방법을 다룹니다. 그는 기계 학습 모델이 실제 값과 범주형 데이터를 모두 처리할 때 선형 회귀 모델보다 이점이 있다고 지적합니다. 그러나 그는 효과적인 기능을 만들고 데이터를 정확하게 해석하려면 깊은 도메인 전문 지식이 여전히 중요하다는 점을 강조하면서 기계 학습에만 의존하는 것에 대해 경고합니다.

자본 배분 영역에서 Dr. Chan은 기계 학습이 어떻게 더 정교한 기대 수익을 제공할 수 있는지 강조하고 과거 성과를 미래 성공의 유일한 지표로 사용하는 것에 도전합니다. 그는 또한 고전적인 통계의 정적인 확률 분포와 달리 매일 변하는 확률로 기계 학습이 제공할 수 있는 시장 이해의 뉘앙스에 대해 논의합니다.

Chan 박사는 도메인 전문 지식이 필요한 다양한 단면 기능을 생성하는 데 있어 딥 러닝의 한계를 설명하면서 결론을 내립니다. 그는 재무 모델에서 강화 학습의 적용 가능성에 대한 자신의 생각을 공유하며 높은 빈도에서는 잠재적인 효과가 있지만 더 긴 시간 규모에서는 한계가 있음을 지적합니다.

금융 기계 학습에 관심이 있는 사람들을 위해 Dr. Chan은 자신의 회사인 PredictNow.ai를 코드 없는 금융 기계 학습 전문 지식을 위한 귀중한 리소스로 추천합니다.

  • 00:00:00 더 널리 사용되고 있다는 사실. 비디오의 이 섹션에서 Dr. Ernest Chan은 기계 학습에 대한 그의 오랜 역사와 이를 금융에 적용하여 가치를 발견한 방법에 대해 이야기합니다. 그는 단일 요인 및 선형 모델과 같은 간단한 모델과 전략을 지지하며 수십 년 동안 퀀트 트레이더에게 효과적이었습니다. 퀀트 거래가 증가함에 따라 이러한 모델의 수익성이 떨어지고 있으며 Chan은 대부분의 사람들이 하지 않는 방식으로 기계 학습에서 가치를 추출할 수 있었던 방법을 설명합니다.

  • 00:05:00 이 섹션에서는 Dr. Ernest Chan이 금융 기계 학습의 과적합 문제에 대해 논의합니다. 모델이 여러 매개변수에 맞아야 하는 경우 특히 일일 재무 시계열과 같이 빈도가 낮은 재무 데이터로 작업할 때 과적합의 위험이 매우 높습니다. 그러나 수년에 걸쳐 기계 학습, 특히 딥 러닝의 발전으로 과적합을 극복할 수 있게 되었습니다. 랜덤 포레스트, 교차 검증, 드롭아웃 등과 같은 기술은 과적합을 줄이는 데 도움이 되었으며 알고리즘과 같은 다른 도구는 기계 학습을 투명하게 만들었습니다. 블랙박스 거래의 문제점과 투명성 부족은 특정 거래를 한 이유를 설명할 수 없는 것은 돈을 벌더라도 용납되지 않는다는 것입니다.

  • 00:10:00 이 섹션에서는 Dr. Ernest Chan이 기계 학습에서 기능 선택의 개념에 대해 설명합니다. 이를 통해 거래자와 투자자는 특정 기계 학습 모델의 결론으로 이어지는 중요한 변수를 더 잘 이해할 수 있습니다. 기능 선택은 투자자가 손실을 본 이유나 모델이 잘못된 결정을 내린 이유에 대한 통찰력을 얻는 데 도움이 될 수 있습니다. Chan 박사는 또한 시장 예측이 반사성의 영향을 받아 과거에는 패턴을 감지하기 어려웠기 때문에 기계 학습이 기본 신호 생성기보다 위험 관리 및 자본 할당에 더 효과적으로 사용될 수 있다고 강조합니다.

  • 00:15:00 이 섹션에서 Dr. Ernest Chan은 끊임없이 진화하고 암과 같은 질병을 예측하는 것과 비교할 수 없는 금융 시장을 예측하기 위해 기계 학습을 사용하는 한계에 대해 논의합니다. 그러나 그는 기계 학습을 사용하여 거래 전략과 같은 개인 정보를 예측하는 것이 성공적인 접근 방식이 될 수 있다고 설명합니다. 다른 헤지 펀드는 정확히 동일한 매개변수로 경쟁하지 않기 때문입니다. 그는 또한 기존의 정량적 전략을 기계 학습 기반 전략과 비교하면서 기계 학습이 비선형 모델을 통해 대안 및 대규모 데이터 세트를 모델링하는 데 도움이 될 수 있다고 언급합니다.

  • 00:20:00 이 섹션에서는 Dr. Ernest Chan이 시장 행동을 예측하기 위해 비선형 모델을 사용할 때의 이점에 대해 설명합니다. 전통적인 퀀트 모델은 이해하기 쉽고 선형적이어서 과대적합하기 어렵지만 예측 변수 간의 비선형 종속성을 처리할 수 없습니다. 반면 기계 학습 모델은 비선형 종속성을 쉽게 처리할 수 있으며 복잡성과 불투명성으로 인해 복제하기 어렵습니다. 또한 기계 학습 모델은 성공 확률을 제공하여 정보에 입각한 자본 할당을 가능하게 합니다. 그러나 과적합은 기계 학습 모델의 문제이며 통계적 유의성을 평가하기 어려울 수 있습니다. 백 테스트를 시뮬레이션하는 것은 불완전한 솔루션이며 시장의 뉘앙스를 시뮬레이션에서 완전히 포착할 수 없습니다.

  • 00:25:00 이 섹션에서는 Dr. Ernest Chan이 전통적인 양적 전략과 기계 학습 기반 전략의 차이점에 대해 설명합니다. 그는 시장을 시뮬레이션하고 전통적인 전략에 대한 정확한 오차 막대를 생성하는 것이 훨씬 더 어려워서 그 효과를 평가하기 어렵다고 설명합니다. 반면에 기계 학습 모델은 무작위 시드를 전환하는 것만으로 여러 개의 백 테스트를 쉽게 생성할 수 있으며 모든 백 테스트는 잠재적으로 다른 결과를 제공합니다. 이 임의성은 백 테스트의 통계적 중요성을 더 쉽게 평가할 수 있게 하여 거래에서 기계 학습을 사용하는 주요 이점이 됩니다. 하지만 재무 데이터 사이언스는 전략을 수립하는 과정에서 가장 어렵고 시간이 많이 걸리는 단계입니다. 일반적으로 평판이 좋은 벤더의 재무 데이터에도 많은 문제가 있기 때문입니다.

  • 00:30:00 이 섹션에서 Ernest Chan 박사는 감정 데이터 사용과 관련된 몇 가지 문제를 설명합니다. 그는 뉴스를 처리하는 회사가 이전으로 돌아가 보기 좋게 매개변수를 변경할 수 있기 때문에 정서 데이터를 항상 신뢰할 수는 없다고 지적합니다. 데이터가 편향적으로 검토되었는지 여부를 알 수 없기 때문에 원시 뉴스레터를 새로운 정서로 처리해야 하므로 위험이 따릅니다. 게다가, 데이터는 응답을 자동화하는 데 있어 중요한 과제를 제시합니다. 금융 데이터 과학 단계는 금융 기계 학습 문제에서 역설적인 문제인 도메인 전문 지식을 통한 인간 지능이 필요하기 때문에 도전적입니다. 두 번째 단계는 기술 산업이 이미 해결한 기계 학습입니다. 마지막 단계는 예측을 일관된 전략으로 통합하고 통계적 유의성을 평가해야 하는 거래 전략을 구성하고 백테스팅하는 것입니다.

  • 00:35:00 이 섹션에서 Dr. Ernest Chan은 재무 교과서에서 찾을 수 있는 표준 루틴에 따라 예측을 포트폴리오로 변환하는 방법에 대해 설명합니다. 그러나 이를 위해서는 일부 도메인 전문 지식이 필요하며 완전히 자동화되지는 않습니다. 그는 또한 기능을 정지시키는 것과 같은 금융 데이터 과학의 어려움과 메타 라벨링을 사용하여 시장을 예측하는 대신 전략이 수익성이 있는지 여부를 예측하는 것의 중요성을 강조합니다. Chan 박사는 자세한 내용은 금융에 적용되는 메타 라벨링에 대한 그의 블로그 게시물을 읽어볼 것을 권장합니다. 그는 또한 Random Forest가 비선형성을 잘 포착하고 적절한 복잡성을 가지고 있기 때문에 금융 기계 학습을 위한 가장 인기 있는 모델 선택이라고 언급합니다.

  • 00:40:00 이 섹션에서는 Dr. Ernest Chan이 시장 추세를 예측하고 손실을 방지하는 데 있어 기계 학습의 중요성에 대해 이야기합니다. 그는 기계 학습 모델을 사용하여 세계 경제에서 테러 활동의 존재를 감지한 개인적인 경험을 공유하고 화이자 백신 발표의 경우처럼 조언을 따르지 않을 위험에 대해 경고합니다. 그는 또한 투자자에게 손실을 설명할 때 특성 선택의 중요성을 강조하고 초보자를 위한 기계 학습에 관한 자신의 책을 추천합니다. 또한 Chan 박사는 올바른 예측을 수행하는 데 있어 데이터 청결성과 정상성의 중요성을 강조하며, 비정상 시계열이 모델의 정확한 예측 능력에 어떻게 부정적인 영향을 미칠 수 있는지에 대한 예를 공유합니다.

  • 00:45:00 이 섹션에서 Dr. Ernest Chan은 기본 데이터, 특히 범주형 데이터를 기계 학습 모델에 통합하는 방법에 대해 설명합니다. 선형 회귀 모델은 범주형 데이터를 처리할 수 없지만 기계 학습 모델은 실제 값과 범주형 데이터를 모두 처리할 수 있습니다. 그러나 Chan 박사는 기계 학습이 인간 트레이더를 완전히 대체할 수는 없다고 강조합니다. 금융 기계 학습에는 기능을 생성하고 데이터를 올바르게 해석하기 위해 깊은 도메인 전문 지식이 필요하기 때문입니다. 또한 그는 딥 러닝에 대한 맹목적인 숭배에 대해 경고하고 관련 데이터가 충분하지 않으면 만능 솔루션이 될 수 없다고 강조합니다. 마지막으로 그는 젊은 실무자들에게 틈새 시장을 찾고 자금이 풍부한 조직과의 직접 경쟁을 피하라고 조언합니다.

  • 00:50:00 이 섹션에서 Dr. Ernest Chan은 자본 할당과 기계 학습이 어떻게 자본 자산 할당 모델에 대한 입력으로 보다 정교한 기대 수익을 제공할 수 있는지에 대해 설명합니다. 그는 미래의 성공을 보장하지 않는 기대 수익으로 과거 실적을 사용하는 것의 모순에 의문을 제기합니다. 기계 학습은 또한 정적 분포 확률만 제공하는 기존 통계와 달리 매일 다양한 확률로 시장에 대한 미묘한 이해를 제공할 수 있습니다. Recurrent Convolutional Neural Network와 같은 딥 러닝 방법의 경우 Chan 박사는 비시계열 입력 및 기능 선택에 유용하지 않을 수 있다고 생각합니다.

  • 00:55:00 이 섹션에서 Dr. Ernest Chan은 도메인 전문 지식이 필요한 성공적인 예측을 수행하는 데 필요한 다양한 단면 기능을 만드는 데 있어 딥 러닝의 한계에 대해 설명합니다. 그는 또한 다양한 시간 척도에서 재무 모델의 강화 학습 위치에 대한 자신의 의견을 제공합니다. 그는 강화 학습이 주문서에 주문하는 사람들에게 반응할 수 있기 때문에 고주파 거래에 대해 매우 높은 빈도로 작동할 수 있지만 더 긴 시간 척도에서는 실패한다고 믿습니다. 마지막으로 그는 자신과 같은 사람의 전문 지식에 관심이 있는 사람들을 위한 코드 없는 금융 기계 학습을 위한 훌륭한 리소스로 회사 PredictNow.ai를 추천합니다.
Financial Machine Learning - A Practitioner’s Perspective by Dr. Ernest Chan
Financial Machine Learning - A Practitioner’s Perspective by Dr. Ernest Chan
  • 2020.11.12
  • www.youtube.com
QUANTT and QMIND came together to offer a unique experience for those interested in Financial Machine Learning (ML). Unifying these two clubs is Dr. Ernest C...
 

심층 강화 학습을 통한 거래 | 토마스 스타크 박사


심층 강화 학습을 통한 거래 | 토마스 스타크 박사

거래를 위한 심층 강화 학습 분야의 전문가인 Thomas Starke 박사는 통찰력 있는 프레젠테이션을 제공하고 청중과 Q&A 세션에 참여했습니다. 다음은 그의 연설에 대한 확장된 요약입니다.

Dr. Starke는 기계가 직접적인 감독 없이 작업을 해결할 수 있도록 하는 기능을 강조하면서 거래를 위한 심층 강화 학습을 도입하는 것으로 시작했습니다. 그는 컴퓨터 게임을 하기 위해 머신 러닝의 비유를 사용했는데, 컴퓨터 게임은 화면에서 본 것을 기반으로 결정을 내리는 법을 배우고 일련의 결정에 따라 성공 또는 실패를 달성합니다.

그런 다음 상태가 시장 매개 변수와 연결되고 작업이 한 상태에서 다른 상태로 프로세스를 전환하는 거래에서 Markov 결정 프로세스의 개념에 대해 논의했습니다. 목표는 특정 정책과 상태에서 예상되는 보상을 최대화하는 것입니다. 시장 매개변수는 기계가 취할 조치에 대해 정보에 입각한 결정을 내리는 데 중요합니다.

거래의 의사 결정 프로세스에는 시스템 상태를 알려주는 다양한 지표를 기반으로 매수, 매도 또는 보유 여부를 결정하는 과정이 포함됩니다. Dr. Starke는 잘못된 예측으로 이어질 수 있으므로 각 주에 대한 즉각적인 손익 레이블에만 의존하지 않는 것이 중요하다고 강조했습니다. 대신 기계는 처음에 거래에 반대하더라도 거래를 유지해야 하는 시점을 이해하고 거래가 종료되기 전에 평균 라인으로 되돌아갈 때까지 기다려야 합니다.

거래의 이익과 손실의 모든 단계에 라벨을 붙이는 어려움을 해결하기 위해 Dr. Starke는 소급 라벨을 도입했습니다. 이 접근법은 Bellman 방정식을 사용하여 즉각적인 이익을 가져오지 않더라도 각 행동과 상태에 0이 아닌 값을 할당합니다. 이는 평균 및 궁극적인 이익으로 되돌아갈 가능성을 허용합니다.

심층 강화 학습은 미래 결과를 기반으로 거래 결정을 내리는 데 도움이 될 수 있습니다. 전통적인 강화 학습 방법은 과거 경험을 기반으로 테이블을 작성하지만 거래에서는 상태와 영향의 수가 방대합니다. 이러한 복잡성을 처리하기 위해 심층 강화 학습은 신경망을 활용하여 이러한 테이블을 근사화하여 막대한 테이블을 생성하지 않고도 가능하게 만듭니다. Dr. Starke는 상태를 정의하기 위한 올바른 보상 기능과 입력을 찾는 것의 중요성에 대해 논의하여 궁극적으로 거래를 위한 더 나은 의사 결정을 가능하게 합니다.

거래에서 입력의 중요성이 강조되어 예측 가치를 가질 필요성을 강조했습니다. Dr. Starke는 알려진 동작에 대해 시스템을 테스트하고 선택한 보상 함수를 기반으로 신경망의 적절한 유형, 크기 및 비용 함수를 선택하는 것이 중요하다고 강조했습니다. 그는 과거 및 현재 가격, 기술 보호 데이터 및 대체 데이터 소스가 국가를 구성하고 보상이 거래의 손익(P&L)인 거래에서 게임화가 어떻게 사용되는지 설명했습니다. 기계는 Bellman 방정식을 사용하여 소급하여 관찰에 레이블을 지정하고 의사 결정을 개선하기 위해 신경망에 의해 근사화된 테이블을 지속적으로 업데이트합니다.

강화 학습을 사용한 교육과 관련하여 Dr. Starke는 다양한 지점에서 무작위로 들어가고 나가는 것을 포함하여 가격 시리즈를 구성하는 다양한 방법에 대해 논의했습니다. 그는 또한 보상 함수를 설계하는 문제를 해결하고 순수 P&L 비율, 틱당 이익, 샤프 비율과 같은 예와 장거리 또는 손실을 방지하는 방법을 제공했습니다.

거래 입력과 관련하여 Dr. Starke는 시가-고가-저가-종가 및 거래량 값, 캔들스틱 패턴, 상대 강도 지수, 시간/주/연도와 같은 기술 지표, 입력 가격 및 기술적 지표를 포함한 다양한 옵션을 언급했습니다. 다른 악기에 대한 지표. 정서 또는 위성 이미지와 같은 대체 데이터 소스도 고려할 수 있습니다. 핵심은 이러한 입력을 복잡한 상태로 구성하는 것입니다. 이는 컴퓨터 게임에서 결정을 내리기 위해 입력 기능이 사용되는 방식과 유사합니다.

Dr. Starke는 강화 학습기가 거래에 사용되기 전에 거쳐야 하는 테스트 단계를 설명했습니다. 그는 깨끗한 사인파, 추세 곡선, 구조가 없는 무작위 계열, 다양한 유형의 순서 상관 관계, 깨끗한 테스트 곡선의 노이즈 및 반복 패턴을 포함한 다양한 테스트를 설명했습니다. 이러한 테스트는 기계가 지속적으로 수익을 창출하는지 확인하고 코딩의 결함을 식별하는 데 도움이 됩니다. Starke 박사는 또한 표준, 컨볼루션 및 장단기 기억(LSTM)과 같은 사용되는 다양한 유형의 신경망에 대해 논의했습니다. 그는 과도한 계산 노력 없이 자신의 필요를 충족하는 더 간단한 신경망을 선호한다고 밝혔습니다.

그런 다음 Dr. Starke는 거래에 강화 학습을 사용하는 문제를 탐구했습니다. 그는 특히 시끄러운 금융 시계열에서 신호와 잡음을 구별하는 것이 어렵다는 점을 인정했습니다. 그는 또한 시장 행동의 변화에 적응하기 위한 강화 학습의 어려움을 강조하여 새로운 행동을 배우는 것을 어렵게 만듭니다. 또한 그는 강화 학습에는 상당한 양의 훈련 데이터가 필요하지만 시장 데이터는 부족한 경우가 많다고 언급했습니다. 과적합은 강화 학습이 기본 시장 패턴에 작용하는 경향이 있고 쉽게 과적합될 수 있기 때문에 또 다른 문제입니다. 더 복잡한 신경망을 구축하면 이 문제를 완화할 수 있지만 시간이 많이 걸리는 작업입니다. 전반적으로 Dr. Starke는 강화 학습이 수익성 있는 결과를 보장하는 솔루션이 아니며 거래에서 성공을 달성하기 위해서는 시장 경험과 도메인별 지식을 갖추는 것이 중요하다고 강조했습니다.

Q&A 세션에서 Dr. Starke는 심층 강화 학습을 통한 거래와 관련된 다양한 질문에 답했습니다. 그는 Bellman 방정식이 예측 편향을 도입하지 않는다는 점을 명확히 하고 신중한 분석 후 기술 지표를 입력으로 사용할 가능성에 대해 논의했습니다. 그는 또한 주가 예측을 위해 위성 이미지를 활용할 수 있는 가능성을 탐색했으며 신경망 계산 시간에 따라 작은 시간 프레임에서 강화 거래가 수행될 수 있다고 설명했습니다. 그는 강화 거래 알고리즘이 시장 이상 현상에 민감하다고 경고하고 강화 학습을 사용하여 무작위 결정 트리를 훈련해도 의미 있는 결과가 나오지 않는 이유를 설명했습니다.

Dr. Starke는 문제에 대한 적합성 때문에 의사 결정 트리 또는 지원 벡터 머신 대신 거래에 신경망을 사용할 것을 권장했습니다. 그는 사용된 보상 함수를 기반으로 손실 함수를 조정하는 것이 중요하다고 강조했습니다. 고주파 거래에 강화 학습을 적용하려는 일부 시도가 있었지만 Starke 박사는 실시간 시장에서 응답성이 부족한 느린 신경망의 문제를 강조했습니다. 그는 금융 업계에서 거래 경력을 추구하는 데 관심이 있는 개인에게 시장 지식을 습득하고 실제 거래에 참여하며 경험을 통해 배울 것을 조언했습니다. 마지막으로 그는 작업의 복잡성을 인식하면서 신경망과 옵션 거래를 결합하는 문제에 대해 논의했습니다.

결론적으로 Thomas Starke 박사는 심층 강화 학습을 통해 거래에 대한 귀중한 통찰력을 제공했습니다. 그는 거래의 의사 결정 프로세스, 소급 레이블 지정, Bellman 방정식, 입력의 중요성, 테스트 단계 및 거래를 위한 강화 학습과 관련된 문제와 같은 주제를 다루었습니다. 토크 및 Q&A 세션을 통해 Dr. Starke는 금융 시장에서 심층 강화 학습을 활용하기 위한 지침과 실질적인 고려 사항을 제공했습니다.

  • 00:00:00 Thomas Stark 박사가 몇 년 동안 관심을 가져왔던 주제인 거래를 위한 심층 강화 학습을 소개합니다. RL(강화 학습)은 기계가 감독 없이 작업을 해결하도록 허용하고 유리한 결과를 생성하기 위해 수행해야 할 작업을 스스로 학습하는 기술입니다. 그는 컴퓨터 게임을 플레이하는 방법을 배우려는 기계가 게임 시나리오에서 시작하여 화면에 표시되는 내용에 응답하면서 한 단계에서 다음 단계로 이동하는 방법을 설명합니다. 마지막으로 게임이 종료되고 기계는 자신이 내린 일련의 결정에 따라 성공 또는 실패를 결정합니다.

  • 00:05:00 Thomas Starke 박사가 심층 강화 학습을 통한 거래에 대해 논의하고 Markov 결정 프로세스의 개념을 설명합니다. 이 프로세스에서 상태는 특정 시장 매개변수와 연관되며 조치는 한 상태에서 다음 상태로 프로세스를 전환합니다. 전환에 따라 에이전트는 긍정적이거나 부정적인 보상을 받습니다. 목표는 특정 정책과 상태에서 예상되는 보상을 최대화하는 것입니다. 거래에서 시장 매개변수는 에이전트가 어떤 상태에 있는지 식별하고 어떤 조치를 취해야 하는지 결정하는 데 도움이 되는 데 사용됩니다.

  • 00:10:00 Thomas Starke 박사는 시스템 상태를 알려주는 다양한 지표를 기반으로 매수, 매도 또는 보유 여부를 결정하는 거래와 관련된 의사 결정 프로세스에 대해 설명합니다. 목표는 거래의 이익 또는 손실인 최상의 가능한 보상을 받는 것입니다. 그러나 상태에 즉각적인 이익 또는 손실과 같은 특정 레이블을 지정하는 전통적인 기계 학습 접근 방식은 거래가 가까운 미래에 우리에게 불리하게 진행될 경우 잘못된 레이블로 이어질 수 있습니다. 따라서 기계는 처음에 우리에게 불리하게 작용하더라도 거래에 머무를 시기를 이해하고 거래가 평균선으로 되돌아가 거래를 종료할 때까지 기다려야 한다는 확신을 가져야 합니다.

  • 00:15:00 Thomas Starke 박사가 소급 라벨링과 거래 손익의 모든 단계에서 라벨링의 어려움을 해결하기 위해 강화 학습에 사용되는 방법에 대해 설명합니다. 그는 전통적인 기계 학습이 거래의 모든 단계에 레이블을 지정하기 때문에 손실이 발생할 경우 미래에 거래가 수익성이 있을지 예측하기 어렵다고 설명합니다. 소급 라벨링은 Bellman 방정식을 사용하여 즉각적인 이익을 창출하지 않더라도 각 행동과 상태에 0이 아닌 값을 할당하여 평균 및 최종 이익으로 되돌릴 수 있습니다.

  • 00:20:00 Thomas Starke 박사가 거래에서 만족 지연 문제를 해결하기 위해 강화 학습을 사용하는 방법을 설명합니다. Bellman 방정식은 행동의 보상을 계산하는 데 사용되며 "r"은 즉각적인 보상을 나타내고 "q"는 누적 보상을 나타냅니다. 감마는 이전 결과와 비교하여 미래 결과에 가중치를 할당하는 할인 요소입니다. 강화 학습을 사용함으로써 거래 결정은 즉각적인 보상뿐만 아니라 더 높은 미래 보상을 위한 포지션 보유에도 기반합니다. 이를 통해 욕심 많은 의사 결정에 비해 더 많은 정보에 입각한 의사 결정이 가능합니다.

  • 00:25:00 Thomas Starke 박사가 심층 강화 학습이 미래 결과를 기반으로 거래 결정을 내리는 데 어떻게 도움이 되는지 설명합니다. 전통적인 강화 학습은 과거 경험을 기반으로 테이블을 구축하는 것을 포함하지만 거래에서는 많은 양의 상태와 영향으로 인해 복잡해집니다. 따라서 해결책은 심층 강화 학습과 신경망을 사용하여 막대한 테이블을 생성하지 않고 이러한 테이블을 근사화하는 것입니다. 그는 거래의 게임화를 사용하고 올바른 보상 기능과 상태를 정의하기 위한 입력을 찾는 구현에 대해 설명합니다. 전반적으로 심층 강화 학습을 사용하면 거래 의사 결정에 도움이 될 수 있습니다.

  • 00:30:00 이 섹션에서 Dr. Starke는 거래에서 입력의 중요성과 입력이 일종의 예측 가치를 가져야 하는 방법에 대해 논의합니다. 그렇지 않으면 시스템이 올바른 거래 결정을 내릴 수 없습니다. 그는 알려진 동작에 대해 시스템을 테스트하고 선택한 보상 함수에 따라 신경망의 적절한 유형, 크기 및 비용 함수를 선택해야 할 필요성을 강조합니다. 그런 다음 거래에서 게임화가 어떻게 작동하는지 설명합니다. 상태는 과거 및 현재 가격, 기술 보호 데이터 및 대체 데이터 소스이고 보상은 거래의 손익입니다. 강화 학습자는 Bellman 방정식을 사용하여 소급하여 관측값에 레이블을 지정하고 신경망에 의해 근사화된 테이블을 지속적으로 업데이트함으로써 기계는 더 나은 거래 결정을 내리는 방법을 학습합니다.

  • 00:35:00 이 섹션에서는 Thomas Starke 박사가 강화 학습을 사용하여 교육용 가격 시리즈를 구성하는 방법에 대해 설명합니다. 그는 가격 시리즈를 순차적으로 실행하는 대신 다른 지점에서 무작위로 진입 및 퇴장할 수 있으며 어떤 방법을 선택할지는 사용자가 결정해야 한다고 설명합니다. 그는 또한 보상 함수 설계의 어려움에 대해 논의하고 순수한 백분율 손익, 틱당 이익, 샤프 비율 및 다양한 유형의 처벌을 사용하여 교육에 사용할 수 있는 보상 함수를 구성하는 다양한 예와 방법을 제공합니다. 장거리 운송 시간이나 손실을 피하십시오.

  • 00:40:00 Thomas Starke 박사에 따르면 시가 고가 저가 종가 및 거래량 값, 캔들스틱 패턴, 상대 강도 지수와 같은 기술 지표, 시간/주/년, 다양한 시간 세분화, 입력 등 다양한 옵션이 있습니다. 다른 상품에 대한 가격 및 기술 지표, 감정 또는 위성 이미지와 같은 대체 데이터. 그런 다음 이러한 입력은 컴퓨터 게임이 입력 기능을 사용하여 결정을 내리는 방식과 유사하게 복잡한 상태로 구성됩니다. 궁극적으로 핵심은 거래 스타일에 맞는 올바른 보상 기능을 찾고 그에 따라 시스템을 최적화하는 것입니다.

  • 00:45:00 Thomas Starke 박사는 강화 학습자가 금융 시장 거래에 사용되기 전에 거쳐야 하는 테스트 단계를 설명합니다. 그는 깨끗한 사인파, 추세 곡선, 구조가 없는 무작위 시리즈, 다양한 유형의 순서 상관 관계, 깨끗한 테스트 곡선의 노이즈 및 반복 패턴을 포함한 일련의 테스트를 적용하여 기계가 일관된 수익을 내고 있는지 확인하고 코딩의 결함을 찾습니다. . 또한 그는 표준, 컨볼루션, 장기 단기 기억(LSTM)을 포함하여 그가 사용하는 다양한 유형의 신경망과 필요에 충분하고 과도한 계산 노력이 필요하지 않은 단순한 신경망에 대한 선호도에 대해 설명합니다.

  • 00:50:00 이 섹션에서 Thomas Starke 박사는 신호와 노이즈를 구별하는 어려움과 로컬 최소값 문제를 포함하여 강화 학습을 사용한 거래의 문제에 대해 설명합니다. 그는 강화 학습이 시끄러운 재무 시계열과 변화하는 규칙 및 시장 체제가 있는 동적 재무 시스템과 어려움을 겪고 있음을 보여줍니다. 그러나 그는 단순한 이동 평균으로 가격 곡선을 매끄럽게 하면 강화 학습 기계의 성능을 크게 향상시킬 수 있음을 보여주어 수익성 있는 거래 결정을 내릴 수 있는 성공적인 기계 학습 시스템을 구축하는 방법에 대한 통찰력을 제공합니다.

  • 00:55:00 이 섹션에서는 Thomas Starke 박사가 거래에 강화 학습을 사용하는 데 따른 문제에 대해 설명합니다. 첫째, 강화 학습은 시장 행동의 변화에 적응하는 데 어려움을 겪기 때문에 새로운 행동을 배우기가 어렵습니다. 또한 많은 훈련 데이터가 필요하지만 시장 데이터는 부족한 경우가 많습니다. 강화 학습은 효율적이지만 쉽게 과대적합될 수 있으며 기본 시장 패턴에만 실제로 작용합니다. 더 복잡한 신경망을 구축하면 이를 극복할 수 있지만 시간이 많이 걸리는 작업입니다. 궁극적으로 강화 학습은 수익성 있는 결과를 생성하기 위한 묘책이 아니며 성공적인 거래 결과를 달성하기 위해 우수한 시장 경험과 도메인별 지식을 보유하는 것이 중요합니다. Dr. Starke는 Quant NC 강의를 제공하고 이러한 시스템을 코딩하는 데 관심이 있는 모든 사람이 잘 구성된 질문으로 LinkedIn에서 그에게 연락할 것을 권장합니다.

  • 01:00:00 Thomas Starke 박사는 심층 강화 학습을 통해 거래와 관련된 다양한 질문에 답변합니다. 그는 Bellman 방정식이 미리 예측 편향을 도입하지 않으며 기술적 지표가 신중한 분석 후 입력으로 사용될 수 있다고 설명합니다. 위성 이미지는 주가 예측에 유용할 수 있으며 신경망 계산 시간에 따라 작은 시간 프레임에서 강화 거래가 수행될 수 있습니다. 그는 또한 강화 거래 알고리즘이 시장 이상 현상에 얼마나 민감한지 논의하고 강화 학습을 사용하여 무작위 결정 트리를 훈련하는 것이 왜 이치에 맞지 않는지 설명합니다.

  • 01:05:00 이 섹션에서 Thomas Starke 박사는 문제에 대한 적합성 때문에 의사 결정 트리 또는 지원 벡터 머신보다는 거래에 신경망을 사용할 것을 권장합니다. 그는 사용된 보상 함수를 기반으로 손실 함수를 튜닝하는 것이 필수적이라고 설명합니다. 그는 사람들이 고주파 거래에 강화 학습을 사용하려고 시도했지만 실시간 시장에서 응답성이 부족한 느린 신경망으로 끝났다고 언급합니다. 그는 시장 지식을 얻는 것이 금융 업계에서 거래 경력을 쌓고 실제 거래를 하고 그 과정에서 많은 것을 배우는 데 크게 도움이 될 것이라고 제안합니다. 마지막으로 그는 신경망을 사용하여 옵션 거래에서 좋은 결과를 얻을 수 있는지에 대해 논의하고 신경망과 옵션 거래를 결합하는 데 따르는 어려움을 설명합니다.

  • 01:10:00 이 섹션에서 Dr. Thomas Starke는 기술 지표에만 의존하는 대신 옵션 데이터를 기본 상품 거래의 입력으로 사용할 수 있는 방법에 대해 설명합니다. 그는 또한 매수 또는 매도할 로트 수를 결정하기 위해 신경망을 사용하는 방법과 슬리피지 모델을 구축하고 이러한 요소를 보상 기능에 통합하여 알고리즘에 스프레드, 커미션 및 슬리피지를 통합하는 방법에 대한 질문에 답변합니다. 그는 신경망을 사용하여 거래량을 결정할 때 주의를 기울이고 출력 값을 사용하여 그에 따라 포트폴리오 가중치를 조정할 것을 권장합니다. 그는 질문을 던지고 자신의 연설에 참석해 준 청중에게 감사를 표하며 연설을 마칩니다.
Machine Learning Trading | Trading with Deep Reinforcement Learning | Dr Thomas Starke
Machine Learning Trading | Trading with Deep Reinforcement Learning | Dr Thomas Starke
  • 2020.09.23
  • www.youtube.com
Dr. Thomas Starke Speaks on Machine Learning Trading with Deep Reinforcement Learning (DRL). In this captivating video, join Dr. Thomas Starke as he unravels...
 

Harrison Waldon(UT Austin): "알고리즘 학습 방정식"


Harrison Waldon(UT Austin): "알고리즘 학습 방정식"

UT Austin의 연구원인 Harrison Waldon은 강화 학습(RL) 알고리즘의 상호 작용 및 잠재적 공모에 중점을 두고 금융 시장의 알고리즘 공모에 대한 연구를 발표했습니다. 그는 자율 알고리즘 거래와 명시적인 의사 소통 없이 담합을 통해 가격을 부풀릴 가능성에 대한 규제 기관의 우려를 언급했습니다.

Waldon의 연구는 금융 환경에서 RL 알고리즘의 동작을 이해하고 그들이 공모하는 방법을 배울 수 있는지 확인하는 것을 목표로 했습니다. 그는 알고리즘 학습 방정식(ALE)을 활용하여 특정 조건에서 알고리즘의 진화를 근사화하는 상미분 방정식(ODE) 시스템을 도출했습니다. 이러한 ALE는 Q-러닝 알고리즘에서 결탁 행동을 검증할 수 있었고 알고리즘 진화에 대한 좋은 근사치를 제공하여 결탁 결과에 대한 큰 매력을 보여주었습니다.

그러나 정상 분포를 계산하고 진정한 담합과 합리적인 자기 보존 행동을 구별하는 데 어려움이 있습니다. 고정된 분포를 결정하는 데 수치적 어려움이 발생하며 진정한 담합과 이기심에 의한 행동을 구별하는 것은 여전히 어려움입니다.

Waldon은 동적 상호 작용에 적용될 때 정적 게임 균형의 한계를 강조하면서 행동을 규제하는 포괄적인 접근 방식의 필요성을 강조했습니다. 당사자 간의 직접적인 의사소통 없이 알고리즘에 의해 촉진되는 담합 행위는 신중한 고려가 필요합니다. 강연은 Waldon이 참석자들에게 감사를 표하며 봄 학기 시리즈의 끝을 알리는 것으로 마무리되었습니다.

  • 00:00:00 이 섹션에서는 UT Austin의 Harrison Walden이 금융 업계의 알고리즘 공모에 대한 최근 작업에 대해 설명합니다. 그는 전자 시장에서 대부분의 거래가 알고리즘에 의해 실행되며, 그 중 다수는 강화 학습(RL)과 같은 기계 학습 기술을 사용하여 거래 전략을 학습한다고 지적합니다. RL은 심층 헤지 및 최적의 실행에서 실질적인 성공을 거두었지만 규제 당국은 명시적인 의사 소통 없이 시장에서 작업 담합 및 부풀려진 가격으로 이어질 수 있기 때문에 완전히 자율적인 알고리즘 거래에 의존하는 회사에 대해 우려를 표명했습니다. Walden의 작업은 알고리즘 공모와 금융 산업에 대한 잠재적 영향을 연구하기 위한 도구를 제공하는 것을 목표로 합니다.

  • 00:05:00 이 섹션에서 Harrison Waldon은 금융 환경에서 강화 학습 알고리즘의 동작에 대한 기존 연구의 한계에 대해 논의합니다. 일부 실험적 증거는 특정 강화 학습 알고리즘이 특정 시나리오에서 복잡한 결탁 전략을 학습할 수 있음을 보여주지만 이러한 실험에는 이론적 엄밀성이 부족합니다. 또한 RL 알고리즘의 설명 가능성 부족은 특히 금융 시장과 같은 다중 에이전트 및 비정적 환경에서 AFM과 같은 조직의 우려 사항입니다. Waldon의 연구를 주도하는 주요 질문은 다음과 같습니다. 금융 환경에서 상호 작용하는 강화 학습 알고리즘의 동작을 어떻게 이해할 수 있으며 이러한 알고리즘이 결탁을 증명할 수 있습니까?

  • 00:10:00 이 섹션에서 Harrison Waldon은 강화 학습(RL)에서 함수 F 또는 학습 규칙이 이전 매개변수 값, 현재 상태, 현재 작업 및 정보를 통합하기 위한 후속 상태를 취한다고 설명합니다. 새로운 매개변수 세트. 목표는 최적의 정책에 근접한 일련의 매개변수를 찾는 것입니다. RL에서 인기 있는 알고리즘 중 하나는 비동기식 테이블 형식 Q-러닝으로, 각 상태-동작 쌍에 하나의 매개변수 값을 연결하고 비동기 방식으로 업데이트합니다. Q-러닝은 단일 에이전트 설정에서 잘 작동하지만 시장에서 흔히 볼 수 있는 다중 에이전트 및 비정적 설정에서는 더 어려워집니다. 금융의 상태 공간은 다른 에이전트의 게시된 가격 벡터로 정의되며 행동 공간에는 구매, 판매 또는 보유가 포함될 수 있습니다.

  • 00:15:00 이 섹션에서 우리는 팀 작업에서 한 가지 흥미로운 발견은 알고리즘이 관련 없는 시장 요인에 조건을 지정하기 시작하면 태양 흑점 거래를 학습할 수 있다는 것입니다. 화자는 Q 학습이 다른 Q 학습자와 상호 작용하는 방식을 설명하고 Markov 결정 프로세스의 다중 에이전트 아날로그를 확률적 게임으로 정의합니다. 에이전트가 시간이 지남에 따라 정책을 학습하고 조정하여 전환 기능이 고정된 경우에도 상태 프로세스의 진정한 역학을 고정되지 않게 만드는 방법에 대해 논의합니다. 대화에서 사용된 주요 예는 죄수의 딜레마로, 경쟁하는 두 유동성 공급자가 있는 정형화된 시장으로 해석됩니다.

  • 00:20:00 알고리즘이 장착된 다른 플레이어와 반복되는 죄수의 딜레마 게임을 학습하는 알고리즘의 동작 이해. 이를 달성하기 위해 상태 프로세스에 상태 개념이 제공되어야 하며 우리가 도달한 시스템을 알고리즘 학습 방정식이라고 합니다. 이 시스템을 유도하기 위해 확률적 근사에서 ode 방법을 사용하여 매개변수의 진화를 근사화하여 정책을 직접 분석할 수 있습니다. 이 모델에는 제한 사항이 있지만 제시된 도구는 일반적이며 이러한 제한 사항을 해결할 수 있습니다.

  • 00:25:00 이 섹션에서 Harrison Waldon은 고전적인 확률적 근사 및 ODE를 활용하여 매개변수의 진화를 근사화하는 알고리즘 학습 방정식에 대해 설명합니다. 고정 분포와 관련하여 학습 규칙을 조정하고 고정 매개변수를 유도함으로써 학습 알고리즘을 모방하는 ODE 시스템을 도출합니다. 이러한 알고리즘 학습 방정식은 비퇴화 학습률 및 매개변수의 소형화와 같은 특정 조건이 주어지면 알고리즘의 진화를 근사화할 수 있습니다. 고정 배포 및 정책은 Lipschitz 연속적이며 이는 또한 중요합니다. 역학이 변화하는 비정상 프로세스로 인해 사용된 확률적 근사가 필요합니다.

  • 00:30:00 이 섹션에서는 Harrison Waldon이 알고리즘 학습 방정식과 해당 속성에 대해 설명합니다. 비디오에서 논의된 Q-러닝 예제는 컴팩트 세트의 매개변수 유지, 에르고딕 마르코프 체인, 정책 및 학습 규칙의 Lipschitz 연속성을 포함하여 이러한 방정식의 모든 속성을 충족합니다. Waldon은 적절한 시간 스케일링 하에서 알고리즘이 높은 확률로 모든 유한 시간 범위에 대해 ODE의 솔루션에 근접하고 학습 속도가 충분히 빠르게 감소하는 경우 거의 확실하게 국부적으로 점근적으로 안정적인 솔루션으로 수렴할 것임을 보여줍니다. Waldon은 소프트맥스 액션 선택과 함께 Q-러닝을 사용하여 반복되는 죄수의 딜레마에 적용하여 이러한 방정식을 검증함으로써 결론을 내립니다.

  • 00:35:00 이 섹션에서는 알고리즘 학습 방정식이 알고리즘의 진화를 근사화하는 데 필요한 조건에 대해 설명합니다. 이 시나리오에서는 상태가 하나뿐이므로 에르고딕성을 위한 상태 프로세스 조건이 즉시 충족됩니다. 학습 알고리즘의 궤적은 큰 학습률과 작은 학습률 모두로 시뮬레이션되며, 이는 알고리즘 학습 방정식에 의한 근사가 작은 학습률에서 양호함을 보여줍니다. ALE는 또한 담합 결과를 얻을 확률을 분석하는 데 유용하며, 이러한 결과로 이어지는 큰 유인 분지(Basin of Attraction)가 있습니다. 비디오의 다음 부분에서 각 에이전트는 이전 기간의 상대 스프레드에 따라 자신의 스프레드를 조정할 수 있는 기능이 제공됩니다.

  • 00:40:00 비디오의 이 섹션에서 Harrison Waldon은 분석 중인 시뮬레이션에서 특정 동작을 재생할 확률과 소음의 원인을 설명합니다. 그는 에르고틱 상태 프로세스, 정책의 고정적 분배, 일련의 정책이 담합 결과를 유도하는 빈도를 조사하기 위해 처벌 측면에서 각 에이전트의 정책 구성 요소를 해석하는 방법에 대해 논의합니다. 그는 또한 궤도가 수치적으로 수렴될 때까지 다양한 초기 조건에 대한 상태 종속 Q 학습을 위한 알고리즘 학습 방정식의 플롯을 제공합니다.

  • 00:45:00 비디오의 이 섹션에서 Harrison Waldon은 알고리즘 학습 방정식과 함께 Q-러닝을 사용하여 확률적 게임에서 공모 행동을 학습한 결과에 대해 논의합니다. 에이전트는 높은 담합 확률로 시작하지 않았더라도 거의 100%의 시간 동안 담합 스프레드를 플레이하는 방법을 배울 수 있었습니다. 그 결과 담합 결과에 대한 유인도 크지만, 담합 결과와 경쟁 결과 사이를 오가는 의외의 행태도 보였다. 이 연구에 사용된 방법론은 다양한 종류의 상태 종속 강화 학습 알고리즘의 동작을 근사화할 수 있는 최소한의 제한적인 충분한 조건을 제공했습니다. 그러나 고정분포를 산정하는데 수치적인 어려움으로 인해 몇 가지 한계가 있었다. 전반적으로 Q-러닝은 이러한 확률적 게임에서 담합 행동을 성공적으로 학습했습니다.

  • 00:50:00 이 섹션에서 Harrison Waldon은 고정 분포를 처리해야 하기 때문에 어려운 Lyapunov 함수의 존재를 보여줌으로써 알고리즘 학습 방정식이 알고리즘의 점근적 동작을 근사화하도록 보장하는 방법을 설명합니다. 이 문제를 해결하기 위해 Waldon은 State Dependent Smooth Fictitious Play라는 고전적인 가상 플레이를 일반화한 새로운 알고리즘을 도입했습니다. 이 알고리즘은 시스템의 모든 에이전트가 고정 정책에 따라 플레이하고 이러한 전략의 신념이 경험적 플레이 빈도를 통해 형성된다고 가정합니다. 이 알고리즘은 시스템에 임의성을 추가하고 결정론적 학습 규칙의 문제를 해결하기 위해 소프트 맥스 분포에 따라 조치를 취합니다.

  • 00:55:00 이 섹션에서 Harrison Waldon은 알고리즘 학습 방정식을 사용하여 연속 시간 시스템을 분석하고 원활한 가상 플레이 알고리즘이 시스템의 휴지점으로 수렴되도록 보장할 수 있다고 설명합니다. 이 중 일부는 담합 전략일 수 있습니다. . 할인 요인이 커질수록 담합 결과를 학습할 확률이 높아집니다. Waldon은 또한 보다 현실적인 시장 역학의 필요성과 평형 및 가격 연구를 위한 심층 강화 학습 알고리즘에 알고리즘 학습 방정식을 적용할 가능성에 대해 논의합니다. 마지막으로, 그는 담합 탐지의 어려움과 진정한 담합과 합리적 자기보존 행동을 구별하는 어려움을 인정합니다.

  • 01:00:00 이 섹션에서 Harrison Waldon은 정적인 게임의 균형이 사람들 사이의 역동적인 상호 작용의 현실을 좁게 반영하는 방법에 대해 설명합니다. 그는 특히 합리적으로 보일 수 있고 당사자 간의 직접적인 의사 소통 없이 알고리즘을 통해 도달할 수 있는 담합적 행동 측면에서 규제할 균형 행동을 고려할 때 전체론적 접근의 필요성을 강조합니다. 세션은 Waldon이 참석자들에게 감사를 표하고 봄 학기 시리즈를 마치는 것으로 끝납니다.
Harrison Waldon (UT Austin): "The Algorithmic Learning Equations"
Harrison Waldon (UT Austin): "The Algorithmic Learning Equations"
  • 2023.04.26
  • www.youtube.com
Abstract: Recently there has been concern among regulators and legal theorists about the possibility that pricing algorithms can learn to collude with one a...
 

Irene Aldridge(AbleBlox 및 AbleMarkets): "암호화 생태계 및 AMM 설계"



Irene Aldridge(AbleBlox 및 AbleMarkets): "암호화 생태계 및 AMM 설계"

AbleMarkets의 설립자이자 전무이사인 Irene Aldridge는 블록체인 기술, 자동화된 시장 조성(AMM), 전통 시장과 AMM 세계의 융합의 다양한 측면을 탐구합니다. 그녀는 재무에서 이러한 주제의 중요성을 강조하고 이와 관련된 잠재적인 문제 및 솔루션을 탐구합니다.

Aldridge는 금융 산업에서의 배경과 시장 운영 이해에 중점을 둔 미세 구조에 대한 전문 지식에 대한 개요를 제공하는 것으로 시작합니다. 그녀는 처음에는 암호화폐 시장에서 두드러졌지만 현재는 전통적인 시장으로 확장되고 있는 자동화된 시장 조성 모델의 채택이 증가하고 있음을 강조합니다. 그녀는 입문 블록체인 개념, 금융 및 프로그래밍 분야의 블록체인 적용, 시장 조성 및 전통 시장에 미치는 영향에 대한 실제 사례 연구를 다루는 프레젠테이션의 구조를 설명합니다.

블록체인 기술을 탐색하면서 Aldridge는 이를 각 행이 이전 행의 암호화 요약을 전달하여 데이터 무결성을 보장하는 고급 데이터베이스라고 설명합니다. 그녀는 제안된 콘텐츠가 검증되고 체인에 추가되는 블록체인과 관련된 마이닝 프로세스에 대해 설명하여 서류 작업 및 결제 시스템의 투명성과 분산성을 높입니다.

Aldridge는 암호화 생태계의 탈중앙화로의 전환에 대해 논의하고 프라이버시와 서버에 데이터베이스의 여러 복사본을 갖는 견고성 사이의 절충점을 강조합니다. 그녀는 블록 정의 및 암호화 서명 생성에서 해킹 시도에 대한 보안을 보장하는 작업 증명 및 마이닝의 핵심 혁신에 이르기까지 블록체인 프로세스를 설명합니다.

그러나 Aldridge는 채굴 비용 증가, 채굴자 수 감소 및 잠재적인 취약성을 포함하여 작업 증명 채굴 시스템과 관련된 문제를 인정합니다. 그녀는 Ethereum의 블록 집계 및 Coinbase의 마이닝 수수께끼 제거와 같은 대체 솔루션을 강조합니다.

연사는 이해 관계자가 네트워크 운영을 지원하기 위해 자금을 투입하는 암호화폐 생태계의 스테이킹을 탐색합니다. 그녀는 시장을 조작하는 암호 화폐 과두주의의 잠재적인 문제를 인정하고 이 문제에 대응하기 위해 오프체인 검증 및 자동화된 시장 조성이 어떻게 구현되었는지 설명합니다. Aldridge는 암호화 시장에서 조작을 방지하는 자동화된 시장 조성의 중요성을 파악하기 위해 이러한 개념을 이해하는 것이 중요하다고 강조합니다.

Aldridge는 AMM(Automated Market Makers)의 원리를 탐구하여 암호화폐 거래에 대한 혁신적인 영향을 강조합니다. 그녀는 유동성 관련 불변량에 의해 형성된 AMM 곡선이 유동성 풀의 나머지 재고를 기반으로 가격을 결정하는 방법을 설명합니다. 그녀는 24/7 유동성, 공식적인 슬리피지 추정, 볼록 곡선을 통한 공정 가치 결정 등 AMM의 이점을 강조합니다. 그러나 그녀는 또한 AMM이 불안정한 조건에서 손실에 직면할 수 있으며 거래 수수료의 도입으로 이어질 수 있다고 언급합니다.

AMM을 기존 시장과 비교하면서 Aldridge는 지속적인 유동성, 예측 가능한 미끄러짐 및 공정 가치 결정과 같은 자동화된 시장 조성의 이점에 대해 논의합니다. 그녀는 UniSwap이 사용하는 지속적인 제품 시장 조성 방법을 설명하고 실행 중개인이 매개변수화된 데이터를 기반으로 유동성 및 실행을 위한 플랫폼을 선택할 수 있는 방법을 설명합니다.

연사는 거래량 변화의 계산과 공공 유동성 풀과 민간 유동성 풀의 차이에 대해 논의합니다. 그녀는 서로 다른 거래소의 비트코인과 이더리움을 사용한 실증적 예를 제시하고, 곡선의 차이를 지적하고 특정 플랫폼에 대한 잠재적인 문제를 제안합니다.

Aldridge는 시장 안정성을 보장하기 위해 볼록한 모양을 사용하여 AMM 곡선을 설계하는 것이 중요하다고 강조합니다. 그녀는 시스템에서 유동성 공급자와 거래자의 역할과 그들이 거래 수수료로 얻는 이점에 대해 설명합니다. 그녀는 또한 전통적인 시장에서 AMM 시스템이 사용될 가능성을 제기하여 IBM 주식과 같은 자산에 대한 적용을 고려하도록 촉구합니다.

Aldridge는 전통적인 시장 조성자가 이미 유사한 시스템을 구현하고 있다는 점에 주목하면서 자동화된 시장 조성과 전통 시장의 융합을 탐구합니다. 그녀는 시장 상호 작용, 거래 전략, 실행 방법 및 투명성에서 예상되는 변화를 강조합니다. 자동화된 마켓 메이커가 시장의 미세 구조에 미치는 영향에 대해서도 논의합니다.

Aldridge는 암호화폐 시장과 같은 연중무휴 거래 환경에서 자동화된 유동성 구현 가능성을 언급하면서 자동화된 시장 조성이 전통적인 시장 조성 방법과 관련된 위험을 제거할 수 있고 이 기술을 쉽게 사용할 수 있다고 설명합니다. 그러나 그녀는 모든 암호화폐 거래소가 자동화된 시장 조성을 활용하는 것은 아니라고 경고하며 위험 관리 및 외부 효과를 해결하기 위한 연구의 필요성을 강조합니다. Aldridge는 자동화된 시장 조성 기술이 2002년 비트코인과 같은 암호화폐와 거의 같은 시기에 등장했다고 지적합니다.

개인 정보에 접근할 수 있는 자동화된 마켓 메이킹 딜러의 잠재적인 불공평한 이점에 대해 질문을 받았을 때, Aldridge는 그것이 문제를 야기한다고 인정했습니다. 그러나 그녀는 다양한 플랫폼에서 자동화된 시장 조성 곡선을 쇼핑하고 정량화하면 이 문제를 완화하는 데 도움이 될 수 있다고 제안합니다. 그녀는 채굴자들이 주문 블록에 액세스하고 유효성을 검사함으로써 이익을 얻는 사람들이기 때문에 작업을 계속하도록 인센티브를 받는다고 지적합니다. 그럼에도 불구하고 사적인 인센티브가 없다면 이 공간에서 이익을 창출하기가 점점 더 어려워지고 과점을 형성하게 됩니다. Aldridge는 보험이 채굴자들이 거의 무료로 일하도록 하는 자연스러운 인센티브 역할을 할 수 있다고 제안합니다. 그러나 보험 회사는 블록체인을 업계에 대한 주요 위협으로 인식하여 이러한 시스템 설계에 대한 저항을 초래합니다. 그녀는 또한 IBM 곡선의 잠재적인 조작을 강조하면서 사기 계획의 가능성을 언급합니다.

중앙 집중식 지정가 주문서의 맥락에서 Aldridge는 시장 참여자가 비용 효율적이고 자동화된 방식으로 유동성을 제공하여 잠재적으로 수익을 창출하는 AMM과 같은 자동화된 시장 조성 모델을 활용하는 방법을 설명합니다. 그러나 AMM을 사용하는 거래자와 수동으로 지정가 주문을 하는 거래자를 구별하는 것은 여전히 어려운 일입니다. Aldridge는 미세 구조 데이터 분석을 통해 악의적인 사용자를 식별하는 것이 잠재적 솔루션을 제공할 수 있다고 제안합니다. 그녀는 AMM이 계속해서 시장을 지배한다면 더 효율적이고 능률적인 모델이 등장할 것이라고 믿습니다.

요약하면 Irene Aldridge의 논의는 블록체인 기술, 자동화된 시장 조성, 전통 시장과 AMM 세계의 수렴의 다양한 측면을 다룹니다. 그녀는 블록체인의 기본 사항을 탐구하고 작업 증명 마이닝 시스템과 관련된 문제 및 잠재적 솔루션에 대해 논의하며 기존 시장에 비해 AMM의 이점을 강조합니다. Aldridge는 또한 자동화된 유동성 구현의 타당성, 딜러가 개인 정보에 접근할 수 있는 자동화된 시장 조성 문제, 채굴자에 대한 인센티브로서의 보험의 잠재적 역할에 관한 우려를 해결합니다. 그녀의 통찰력을 통해 그녀는 금융 및 자동화된 시장 조성의 세계에서 현재 상황과 미래 가능성에 대한 귀중한 관점을 제공합니다.

  • 00:00:00 이 섹션에서 Irene Aldridge는 금융 산업에서의 배경과 시장 작동 방식에 초점을 맞춘 미세 구조에 대한 관심에 대해 설명합니다. 그런 다음 그녀는 자동화된 시장 조성이라는 주제와 그것이 암호화폐 시장에서 어떻게 시작되었지만 현재는 전통적인 시장에 배치되고 있는지를 소개합니다. 그녀는 블록체인 101 소개, 금융 분야의 블록체인 응용 프로그램, 프로그래밍, 실제 시장 조성 사례 연구 및 기존 시장으로의 파급 효과를 포함하는 프레젠테이션의 개요를 제공합니다. Aldridge는 전기 공학에 대한 배경 지식을 가지고 있으며 거래, 위험 관리 및 연구를 포함하여 금융 산업의 다양한 영역에서 근무했습니다.

  • 00:05:00 이 섹션에서는 Irene Aldridge가 블록체인 기술의 기본 사항을 설명합니다. 그녀는 각 행이 이전 행의 암호화 요약을 전달하는 멋진 데이터베이스라고 설명하므로 계산상으로 이전 데이터를 변경하기가 어렵습니다. 또한 그녀는 블록체인의 마이닝 프로세스와 블록의 제안된 콘텐츠를 검사하고 메모리에 커밋하는 방법에 대해 설명합니다. Aldridge는 블록체인이 서류 작업과 지불을 블록체인으로 옮기는 데 도움이 되어 더 많은 투명성과 탈중앙화를 가능하게 한다고 믿습니다.

  • 00:10:00 이 섹션에서 Irene Aldridge는 트랜잭션이 공개되고 Oracle 서버에 중앙 집중화되지 않고 여러 서버에 저장되는 암호화 생태계의 분산형 모델로의 이동에 대해 설명합니다. 이것은 프라이버시가 희생된다는 것을 의미하지만 서버에 데이터베이스의 여러 복사본을 갖는 견고성이 증가하는 것은 공정한 절충안으로 간주됩니다. Aldridge는 블록체인 프로세스가 블록을 정의하고 암호화 서명 또는 해시를 생성하는 것으로 시작하여 다음 블록으로 인코딩되는 비교적 간단하다고 설명합니다. 그런 다음 체인을 다시 계산하는 계산 복잡성을 너무 크게 만들어 해킹 시도에 대한 보안을 보장하기 위해 작업 증명 및 마이닝 절차의 핵심 혁신에 대해 논의합니다.

  • 00:15:00 이 섹션에서 Irene Aldridge는 암호화폐 작업 증명 마이닝 시스템을 괴롭히는 문제에 대해 논의합니다. 그녀는 채굴 비용이 대부분의 사람들에게 너무 비싸지고 있어 특정 그룹의 개인만이 비용을 감당할 수 있고 나머지는 채굴할 수 없는 균형을 이루고 있다고 설명합니다. 또한 시간이 지남에 따라 채굴자 수가 줄어들어 잠재적인 해킹에 시스템이 취약해집니다. 분산형 모델의 강점은 가장 긴 체인이 코어 엔진에 의해 자동으로 선택되어 공모자가 따라잡아 해킹된 블록을 시스템에 도입하는 것을 방지한다는 것입니다. 하지만 거래하는 채굴자와 채굴하는 채굴자 간의 이해관계 문제, 블록 채굴에 걸리는 시간 등 작업 증명 시스템에 대한 우려가 커지고 있다. 이제 이더리움의 12초마다 블록 집계, 코인베이스가 사람들이 광산에 수수께끼를 풀도록 요구하지 않기로 한 결정과 같은 새로운 솔루션이 개발되고 있습니다.

  • 00:20:00 이 섹션에서 연사는 채굴을 위해 시스템에 자금을 투입하는 것과 관련된 암호화폐 생태계에 스테이킹하는 과정에 대해 논의합니다. 이해 관계자는 특정 기간 동안 지분 또는 담보를 잠글 수 있으며 사기 행위가 있는 경우 지분으로 비용을 지불합니다. 그러나 이것은 시장을 조작하는 암호 과두주의 과점을 만듭니다. 이를 방지하기 위해 오프체인 검증 및 자동화된 마켓 메이킹이 사용되었습니다. 후자는 암호화폐 생태계에서 더욱 대중화되었고 누구나 접근할 수 있는 다양한 오픈소스 제품을 보유하고 있어 이해하기 쉽습니다. 발표자는 스테이킹 및 오프체인 유효성 검사와 같은 배경 정보를 이해하는 것이 자동화된 시장 조성의 중요성과 암호화 시장에서 조작을 방지하기 위해 작동하는 방식을 이해하는 데 필수적이라고 강조합니다.

  • 00:25:00 이 섹션에서는 Irene Aldridge가 암호화폐 거래 세계에 혁명을 일으킨 다양한 자동 시장 조성자(AMM)의 기본 원리에 대해 논의합니다. 곡률과 오프셋이 다른 AMM 곡선은 유동성과 관련된 불변량에 의해 형성되며 가격은 유동성 풀에 남아 있는 재고의 함수라고 설명합니다. AMM의 이점 중 하나는 매수-매도 스프레드가 없기 때문에 스프레드 없이 24/7 거래가 가능하고 변화하는 시장 조건에 자동으로 적응할 수 있다는 것입니다. 그러나 AMM은 변동성이 큰 상황에서 돈을 잃을 수 있기 때문에 전통적인 시장에는 없는 거래 수수료를 부과합니다.

  • 00:30:00 이 섹션에서 Irene Aldridge는 AMM(Automated Market Making)과 지속적인 24/7 유동성, 사전에 추정할 수 있는 공식적인 미끄러짐, 볼록한 곡선. Aldridge는 수량 1과 수량 2 사이의 볼록 곡선을 따르는 대중적인 시스템인 UniSwap에서 사용하는 일정한 제품 시장 조성 방법을 설명합니다. Aldridge는 여러 거래소에서 데이터를 수집하고 이 일정한 제품 방법을 기반으로 매개변수화함으로써 실행 브로커가 유동성 및 실행을 위해 어떤 플랫폼을 선택할지 결정할 수 있는 방법을 강조합니다.

  • 00:35:00 이 섹션에서 Irene Aldridge는 거래량과 통화의 각각의 변화 계산에 대해 논의하고 거래량이 매수인지 매도인지를 결정하기 위해 미세 구조의 걸 틱 규칙을 사용하여 매우 간단한 시뮬레이션을 시뮬레이트합니다. 그녀는 또한 두 가지 유형의 유동성 풀인 퍼블릭 및 프라이빗과 그 사이에서 진행되는 차익 거래에 대해 설명하면서 충분히 유동적인 플랫폼에서는 차이가 없어야 함을 강조합니다. 그런 다음 Aldridge는 Bitfinex 및 Bitstamp와 같은 다양한 거래소에서 비트코인 및 이더리움을 사용하는 경험적 예를 제시하고 곡선을 강조하여 FTX가 자동화된 시장 조성 관점에서 기대하는 것과 전혀 닮지 않았으며 Ponzi였을 수도 있음을 시사합니다. 내내 계획.

  • 00:40:00 이 섹션에서 Irene Aldridge는 AMM(Automated Market Making) 곡선의 설계에 대해 논의하고 이를 다양한 암호화폐 거래소의 예와 비교합니다. 그녀는 AMM 설계에서 볼록 곡선을 사용하여 시장 안정성을 보장하고 재고 매진 시 급격한 가격 상승을 방지하는 것이 중요하다고 강조합니다. 또한 그녀는 시스템에서 유동성 공급자와 거래자의 역할과 그들이 거래 수수료로 얻는 이점에 대해 설명합니다. Aldridge는 또한 전통적인 시장에서 AMM 시스템이 사용되고 있다는 소문을 언급하고 이 디자인이 IBM 주식과 같은 제품에 대해 어떻게 작동할지 고려할 필요성을 강조합니다.

  • 00:45:00 이 섹션에서 Irene Aldridge는 전통 시장과 전통적인 시장 조성자가 이미 유사한 시스템을 배포하고 있는 자동화된 시장 만들기 세계의 융합에 대해 논의합니다. 그녀는 개인이 시장과 상호 작용하는 방식, 교육 전략이 구축되는 방식, 실행이 수행되는 방식 및 모든 것이 투명해지는 방식에 많은 변화가 예상된다고 지적합니다. 그녀는 또한 자동화된 마켓 메이커의 영향으로 인해 시장의 미세 구조가 변화하고 있다고 지적합니다. Irene은 일일 IBM 데이터가 AMM 곡선을 추정하는 데 사용되는 방법과 보다 세분화된 데이터가 어떻게 보다 명확한 추정치를 쉽게 얻을 수 있는지에 대한 기본적인 이해를 제공합니다.

  • 00:50:00 이 섹션에서 Irene Aldridge는 전통적인 시장 조성 방법이 효과적이지 않을 수 있는 암호화 시장과 같은 24/7 거래 환경에서 자동화된 유동성 구현 가능성에 대해 논의합니다. 그녀는 자동화된 시장 조성이 전통적인 시장 조성 방법과 관련된 위험을 제거할 수 있으며 이 기술이 널리 사용 가능하다고 설명합니다. 그러나 그녀는 모든 암호화폐 거래소가 자동화된 시장 조성을 사용하는 것은 아니며 위험 관리 및 외부 효과를 해결하기 위한 연구가 필요하다고 경고합니다. 그녀는 또한 이 기술이 2002년부터 있었고 비트코인과 같은 암호화폐의 출현과 동시에 발생했다고 지적합니다. Aldridge는 자동화된 마켓 메이킹 딜러가 개인 정보에 접근할 수 있는 잠재적인 불공평한 이점에 대해 질문했을 때 이것이 추가 연구가 필요한 미결 문제라고 지적합니다.

  • 00:55:00 이 섹션에서 Irene Aldridge는 AMM 딜러 또는 코인을 받고 자동화된 시장 조성 시스템(AMM)을 사용하는 사람들이 다른 사람들보다 먼저 주문 흐름을 보는 방법에 대해 논의하며, 이는 문제를 나타냅니다. 그러나 사용 가능한 플랫폼이 많기 때문에 자동화된 시장 조성 곡선을 둘러보고 정량화하면 이 문제를 완화하는 데 도움이 될 수 있습니다. Irene은 또한 이 문제로 인해 광부들이 주문 블록을 조사하고 검증함으로써 이익을 얻는 유일한 사람이기 때문에 계속 작업할 동기가 있다고 지적합니다. 하지만 사적인 인센티브가 없으면 점점 이 공간에서 돈을 벌기 어려워져 과점체제가 형성되고 있다. Irene은 보험이 채굴자들이 거의 무료로 혜택을 받고 일할 수 있는 자연스러운 인센티브가 될 수 있다고 제안합니다. 그러나 보험사들은 블록체인을 자신들의 존재에 대한 주요 위협으로 보고 있기 때문에 이런 종류의 시스템 설계에 대한 저항이 있습니다. 마지막으로 Irene은 사기 계획의 가능성에 대한 질문에 답하면서 IBM 곡선에 사기가 있을 수 있으며 바닥이 조작되고 있다고 주장할 수 있다고 말했습니다.

  • 01:00:00 이 섹션에서는 Irene Aldridge가 중앙 지정가 주문서에서 자동화된 시장 조성 모델을 사용하는 방법에 대해 설명합니다. 시장 참여자들은 비용이 저렴하고 자동화된 자체 AMM을 활용하여 시장에 유동성을 제공하고 수익을 창출할 수 있습니다. 그럼에도 불구하고 현재 AMM을 사용하는 거래자와 수동으로 지정가 주문을 하는 거래자를 구별하기가 어렵습니다. Aldridge는 미세 구조 데이터를 통해 불량 행위자를 식별하는 것이 미해결 문제일 수 있지만 AMM이 계속해서 시장을 지배한다면 보다 간소화된 모델이 나타날 것이라고 제안합니다.
Irene Aldridge (AbleBlox and AbleMarkets): "Crypto Ecosystem and AMM Design"
Irene Aldridge (AbleBlox and AbleMarkets): "Crypto Ecosystem and AMM Design"
  • 2023.03.29
  • www.youtube.com
Abstract: Assets on blockchain trade 24x7 with very thin liquidity. This demands new fully automated processes, including Automated Market Making (AMM). We d...
 

Agostino Capponi(Columbia): "개인 트랜잭션 풀이 선행 실행 위험을 완화합니까?"


Agostino Capponi(Columbia): "개인 트랜잭션 풀이 선행 실행 위험을 완화합니까?"

Columbia University의 연구원인 Agostino Capponi는 탈중앙화 거래소의 프론트 러닝 문제를 탐구하고 잠재적인 솔루션으로 프라이빗 트랜잭션 풀을 제안합니다. 이러한 프라이빗 풀은 오프체인에서 운영되며 퍼블릭 풀과 분리되어 있어 선행 실행에 관여하지 않는 검증인이 이를 처리할 수 있습니다. 그러나 Capponi는 모든 유효성 검사기가 개인 풀에 참여하지 않기 때문에 개인 풀을 사용하면 실행 위험이 수반된다는 점을 인정합니다. 개인 풀을 채택해도 실행에 필요한 최소 우선 순위 수수료가 반드시 줄어들지는 않을 수 있다는 점에 유의해야 합니다. 또한 Capponi는 선두 공격자 간의 경쟁이 최대 추출 가능 가치(MEV)를 통해 검증자에게 이익이 된다고 지적합니다. 궁극적으로 프라이빗 풀은 선행 실행 위험을 완화할 수 있지만 실행에 필요한 수수료를 증가시켜 할당의 비효율성을 초래할 수 있습니다.

Capponi는 프라이빗 풀을 통해 라우팅되는 트랜잭션의 비율과 최적의 할당을 복잡하게 만드는 선행 실행 가능성 사이의 상관관계를 강조합니다. 또한 억제 및 변위 공격을 포함한 다양한 유형의 선행 공격을 탐색하고 선행 실행으로 인해 발생하는 상당한 손실을 보여주는 데이터를 제시합니다. 이러한 위험을 해결하기 위해 Capponi는 사용자에게 거래 타이밍에 대해 교육하고 보다 공평한 시스템을 만들기 위해 거래 검증을 보다 결정론적으로 만들 것을 제안합니다.

토론은 개인 트랜잭션 풀의 역학, 채택의 문제 및 관련된 잠재적 트레이드 오프에 대해 다룹니다. Capponi는 프라이빗 풀이 프런트 러닝에 대한 보호 기능을 제공하는 방법을 설명하지만 그 효과는 프라이빗 풀에 참여하는 유효성 검사기의 수에 따라 달라집니다. 또한 그는 MEV 손실로 인해 개인 풀을 채택하지 않는 유효성 검사기 문제를 해결하고 채택을 장려하기 위한 사용자 보조금과 같은 잠재적 솔루션을 제안합니다.

프라이빗 트랜잭션 풀은 선행 실행 위험을 어느 정도 완화할 수 있지만, Capponi는 완벽하지 않으며 최적의 할당을 달성하지 못할 수도 있다고 강조합니다. 복잡성은 공격자 간의 경쟁, 프라이빗 풀의 유효성 검사기 채택률, 결과적으로 실행 수수료에 미치는 영향과 같은 요인에서 발생합니다. 이 논의는 선행 위험을 해결하고 공정하고 효율적인 분산형 교환 환경을 보장하는 블록체인 커뮤니티에 대한 중요한 고려 사항을 제기합니다.

  • 00:00:00 이 섹션에서 Agostino Capponi는 탈중앙화 거래소의 주제와 그들이 직면한 전면 실행 위험을 소개합니다. 그는 블록체인 아키텍처가 트랜잭션을 블록에 추가하고 사용자로부터 수수료를 받는 유효성 검사기가 액세스하는 메모리 풀에 트랜잭션을 제출함으로써 작동한다고 설명합니다. Capponi는 사용자가 더 높은 수수료를 제공하여 거래의 우선순위를 정할 수 있지만 이 시스템은 선행 실행으로 이어질 수 있다고 지적합니다. 그는 이 문제에 대한 잠재적인 해결책으로 개인 풀의 개념을 소개하고 그의 팀이 선행 실행을 완화하는 데 이러한 풀의 효과를 테스트하기 위해 게임 이론 모델을 구성한 방법에 대해 설명합니다.

  • 00:05:00 이 섹션에서 Agostino Capponi는 사용자가 거래를 보고 제출할 수 있는 공개 오픈 액세스 블록체인의 전면 실행 문제를 설명합니다. 전면 실행 공격은 사용자가 보류 중이거나 실행된 트랜잭션에 대한 실행 가능한 정보를 활용할 때 발생합니다. Capponi는 공격자가 사용자보다 먼저 거래를 실행하기 위해 더 높은 수수료를 부과하여 가격을 상승시킨 다음 이익을 위해 역 거래를 실행하는 샌드위치 공격에 대해 설명합니다. 공격자의 수수료가 충분히 높지 않으면 실패할 위험이 있지만 공격자는 일반적으로 성공 가능성을 높이기 위해 주문 시간을 잰다.

  • 00:10:00 이 섹션에서 Agostino Capponi는 공격자가 여러 트랜잭션을 제출하거나 다른 사용자의 트랜잭션을 대체하여 원하는 트랜잭션을 먼저 실행하는 억제 공격 및 변위 공격을 포함하여 여러 유형의 전면 실행 공격에 대해 설명합니다. Capponi는 프론트 러닝이 블록체인 채택을 제한하는 중대한 위험인지 질문하고 2020년 5월부터 2021년 3월까지 프론트 러닝 공격의 수와 수익을 보여주는 그래프를 제시합니다. 두 대 앞 달리기.

  • 00:15:00 이 섹션에서 Agostino Capponi는 이더리움 트랜잭션의 선행 실행 문제와 직간접적인 관련 비용에 대해 논의합니다. 그는 이 문제에 대한 한 가지 해결책은 개인 거래 풀을 사용하는 것이라고 설명합니다. 이 거래 풀은 기본적으로 오프체인이며 공용 풀과 분리된 병렬 채널이며 일부 검증자만 모니터링할 수 있습니다. 이러한 프라이빗 풀에 제출된 거래는 유효성 검사기가 정직하게 행동하는 한 선행 실행 위험이 없으며 선행 실행 트랜잭션으로 확인되면 풀에서 퇴출됩니다. 전반적으로 비공개 트랜잭션 풀은 선행 실행에 대해 걱정하고 선행 실행 없이 트랜잭션을 실행하려는 사람들에게 좋은 솔루션을 제공합니다.

  • 00:20:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀의 사용과 선행 실행의 위험을 완화할 수 있는지 여부에 대해 설명합니다. Capponi는 개인 풀이 검증자에게만 표시되며 오프체인이므로 공격자가 액세스할 수 없다고 설명합니다. 이것은 검증자가 선행 실행에 관여하지 않기로 약속하므로 선행 실행 가능성을 제거하고 보증을 제공합니다. Capponi는 또한 채택 문제와 사용자가 트랜잭션을 풀에 제출할지 여부를 다룹니다. 또한 그는 공격자들이 어떻게 여전히 서로 경쟁할 수 있는지 언급하지만 개인 풀은 차익 거래 봇에 의한 과소 투자 위험을 줄일 수 있습니다. 마지막으로 그는 개인 풀 채택이 관찰되는지 여부를 논의하기 위해 세 명의 에이전트가 있는 간단한 모델을 소개합니다.

  • 00:25:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀의 개념과 선행 실행 위험을 완화하는지 여부에 대해 설명합니다. 그는 트랜잭션을 제출할 수 있는 두 가지 가능한 장소가 있다고 설명합니다: 개인 풀과 공용 풀입니다. 유효성 검사기가 모니터링할 풀을 채택한 후 사용자는 우선 수수료를 능가하고 트랜잭션을 제출할 위치를 선택합니다. 그런 다음 공격자는 기회를 검색하고 트랜잭션을 제출하고 트랜잭션을 제출할 위치를 결정합니다. Capponi는 기회를 감지하는 데 있어서 확률의 중요성과 성공적인 선행을 달성할 확률을 강조합니다.

  • 00:30:00 이 섹션에서 발표자는 프라이빗 트랜잭션 풀의 개념과 선행 실행 위험을 완화할 수 있는지 여부를 설명합니다. 프라이빗 트랜잭션 풀은 블록을 추가한 검증자만 트랜잭션을 볼 수 있으므로 다른 중재자가 사용자보다 먼저 기회를 식별하는 것을 방지하므로 선행 실행 위험으로부터 보호할 수 있습니다. 그러나 비공개 풀을 통해 제출하면 모든 유효성 검사기가 비공개 풀에 있지 않고 트랜잭션이 표시되지 않아 실행되지 않을 가능성이 있으므로 실행 위험이 따릅니다. 프라이빗 풀 트랜잭션은 퍼블릭 풀 트랜잭션보다 우선 순위가 높지만 프라이빗 풀을 모니터링하는 유효성 검사기의 수는 실행 위험에 영향을 미치므로 프라이빗 풀을 통해 트랜잭션을 제출하기 전에 사용자가 고려해야 할 사항입니다.

  • 00:35:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀이 선행 실행 위험을 어느 정도 완화할 수 있지만 절대 안전한 것은 아니라고 설명합니다. 공격자는 주문을 실행하는 데 있어 우선권을 얻기 위해 군비 경쟁에 참여할 것이며 실행 위험을 줄이기 위해 비공개 풀과 공개 풀을 모두 사용할 수 있지만 여전히 우선 실행을 받을 수 있습니다. 한편, 선불이 가능한 사용자는 프라이빗 풀의 검증인 채택률과 선불 비용을 기준으로 프라이빗 풀 또는 퍼블릭 풀에 트랜잭션을 제출할지 여부를 결정합니다. 채택률이 높으면 프라이빗 풀을 사용하여 프런트런을 피하지만 낮으면 프런트런의 위험에도 불구하고 실행을 위해 너무 많은 블록을 기다리는 것을 피하기 위해 퍼블릭 풀을 선택할 수 있습니다.

  • 00:40:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀이 잠재적으로 선행 실행 위험을 완화할 수 있는 방법을 설명합니다. 사용자가 개인 풀에 제출하고 모든 유효성 검사기가 해당 풀에 참여하면 차익 거래 기회가 없기 때문에 선행 실행 위험이 제거됩니다. 그러나 선행 실행 위험이 낮은 경우 모든 유효성 검사기가 개인 풀을 채택하지는 않습니다. 즉, 사용자가 대신 공용 풀을 선택하여 다시 선행 실행 위험에 노출될 수 있습니다.

  • 00:45:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀이 선행 실행 위험을 완화하고 실행에 필요한 최소 수수료를 줄일 수 있는지 여부에 대해 논의합니다. 선행위험은 손실이 큰 경우에만 제거되며 일부 선행손실은 제거할 수 없다는 주장이 있다. 또한 선행 공격자 간의 경쟁은 최대 추출 가능 가치(MEV)를 통해 검증자 또는 채굴자에게 이익이 됩니다. 검증인은 더 높은 수수료를 받을 수 있는 경우에만 비공개 풀을 채택할 의향이 있기 때문에 프라이빗 풀을 채택한다고 해서 실행에 필요한 최소 우선 순위 수수료가 반드시 감소하지는 않을 수 있습니다. 또한 프라이빗 풀의 존재는 블록 공간에 대한 더 많은 수요로 이어질 수 있으며, 이는 실행에 필요한 수수료를 증가시킬 것입니다. 궁극적으로 프라이빗 풀은 선행 실행 위험을 항상 줄이는 것은 아니지만 실행에 필요한 수수료를 증가시켜 할당 비효율성을 초래할 수 있습니다.

  • 00:50:00 이 섹션에서 연사는 블록체인의 선행 위험으로 인한 비효율성에 대해 논의합니다. 첫 번째 비효율성은 선행 실행의 위험 때문에 트랜잭션을 제출하지 않기로 결정할 수 있는 사용자로 인해 발생하며, 이는 최적이 아닌 트랜잭션 할당으로 이어질 수 있습니다. 두 번째 비효율성은 공격자가 피해자보다 먼저 거래를 실행하여 가치 이전을 초래하는 선행 공격에서 비롯됩니다. 이러한 위험을 완화하기 위해 트랜잭션의 가치를 높이고 사용자가 선행 실행에 대한 두려움 없이 제출할 수 있도록 하는 개인 트랜잭션 풀이 제안됩니다. 그러나 잘못된 MEV와 결과적으로 검증자의 수익 손실로 인해 모든 검증자가 개인 풀을 채택하는 것이 항상 가능한 것은 아닙니다.

  • 00:55:00 이 섹션에서 Agostino Capponi는 사회적으로 최적의 결과가 되더라도 개인 풀을 채택하지 않는 검증인의 문제에 대해 논의합니다. 그 이유는 그들이 MEV(최대 추출 가능 가치)를 잃고 그들에게 이익이 없다면 전환하지 않을 것이기 때문입니다. 해결책은 프런트 실행 가능한 사용자가 프런트 실행을 하지 않았을 때 절약했을 금액과 동일한 금전적 비용을 지불하기로 약속함으로써 검증자에게 보조금을 지급하는 것입니다. 이 데이터는 가장 먼저 실행하기 위한 경쟁이 치열할 경우 플래시 봇 프라이빗 풀의 채택으로 인해 공격자의 비용 및 수익 비율이 상당히 낮아짐을 나타냅니다.
  • 01:00:00 이 섹션에서 Agostino Capponi는 프라이빗 트랜잭션 풀에 대한 연구와 선행 실행의 위험을 완화하는지 여부에 대해 논의합니다. 그는 프라이빗 풀이 대규모 선행 손실에 대해 어느 정도 완화를 제공할 수 있지만 상황을 악화시킬 수 있기 때문에 차익 거래 봇을 실행하는 공격자에게는 도움이 되지 않는다고 설명합니다. 프런트런이 될 확률은 프런트런에 지불해야 하는 가격과 비교하여 거래가 발생할 슬리피지를 살펴봄으로써 추정할 수 있습니다. Capponi는 프론트런 가능성과 프라이빗 풀을 통해 라우팅되는 트랜잭션의 비율 사이에 양의 상관관계가 있다고 지적합니다. 그는 모든 유효성 검사기가 풀을 모니터링하지 않기 때문에 프라이빗 풀이 최적의 할당을 달성할 수 없다는 결론을 내렸습니다. 그 결과 프런트런 위험 또는 블록 공간이 프런트런 가능한 트랜잭션에 할당되는 것과 같은 비효율이 발생했습니다.

  • 01:05:00 이 섹션에서는 Columbia University의 Agostino Capponi가 블록체인, 특히 이더리움 및 폴리곤에서 선행 실행 위험을 방지하기 위한 개인 트랜잭션 풀 사용에 대해 논의합니다. 그는 또한 현재 제공자 보상을 모두 받는 독점적인 주체가 존재하며, 이더리움은 이를 방지하기 위해 MEV(minor extractable value)를 소각하거나 재분배하는 등의 솔루션을 고려하고 있다고 지적했다. Capponi는 또한 블록체인 거래와 공식을 이해하지 못하는 사람들로부터 이해하는 사람들에게 가치를 이전하는 맥락에서 수학 파괴 무기라는 논쟁적인 문제를 제기합니다.

  • 01:10:00 이 섹션에서 연사는 프라이빗 트랜잭션 풀의 선행 실행 문제와 패밀리 오피스와 같은 순진한 사용자에게 어떤 영향을 미칠 수 있는지에 대해 논의합니다. 그들은 시스템을 보다 공평하게 만들기 위해 이러한 사용자들에게 선불용 거래를 피하기 위해 거래 시간을 더 잘 맞추는 방법을 교육할 방법이 필요하다고 제안합니다. 그들은 또한 선행 실행에 참여하는 봇이 매우 정교하고 복잡한 알고리즘을 사용하여 가장 많은 수익을 창출하면서 거래를 실행하는 최선의 방법을 결정한다는 점에 주목합니다. 연사는 트랜잭션 유효성 검사 시간이 더 결정적이라면 사용자가 트랜잭션 시간을 더 잘 지정하고 선행 실행의 위험을 줄이는 것이 더 쉬울 것이라고 제안합니다.
Agostino Capponi (Columbia): "Do Private Transaction Pools Mitigate Frontrunning Risk?"
Agostino Capponi (Columbia): "Do Private Transaction Pools Mitigate Frontrunning Risk?"
  • 2023.01.25
  • www.youtube.com
Abstract: Blockchain users who submit transactions through private pools are guaranteed pre-trade privacy but face execution risk. We argue that private poo...
 

Kevin Webster 박사: "더 적은 비용으로 더 많은 것을 얻으십시오 - 인과 정규화를 통한 더 나은 A/B 테스트"



Kevin Webster 박사: "더 적은 비용으로 더 많은 것을 얻으십시오 - 인과 정규화를 통한 더 나은 A/B 테스트"

이 비디오에서 Dr. Kevin Webster는 거래 실험 및 인과관계 기계 학습과 관련된 문제를 탐구하고 다양한 주요 주제를 확장합니다. 그가 다루는 한 가지 눈에 띄는 문제는 거래에서 관찰된 수익이 가격 영향과 예측된 가격 변동의 조합인 거래의 예측 편향입니다. 이러한 편향을 완화하기 위해 Dr. Webster는 무작위 거래 데이터의 사용과 인과 관계 정규화의 적용이라는 두 가지 접근 방식을 제안합니다. 거래를 유발한 거래 신호를 회귀 모델에 통합함으로써 편향을 제거할 수 있습니다.

Webster 박사는 거래의 알파, 거래 규모 및 거래 중 수익의 세 가지 변수를 포함하는 인과 관계 그래프의 개념을 소개합니다. 그는 알파를 관찰하지 않고 가격 영향을 정확하게 추정하는 것은 어려운 일이며 전통적인 계량 경제학 기법은 이와 관련하여 부족하다고 주장합니다. 그는 제한된 크기와 기간으로 인한 무작위 거래 실험의 한계를 강조하고 시뮬레이터를 사용한 신중한 실험 설계 및 비용 추정의 필요성을 강조합니다.

전통적인 계량 경제학의 단점을 극복하기 위해 Dr. Webster는 인과 관계 정규화를 옹호합니다. Amazon에서 파생된 이 방법은 편향된 데이터를 교육용으로, 편향되지 않은 데이터를 테스트용으로 활용하여 저편향, 저분산 추정치를 생성합니다. 사용 가능한 풍부한 조직 데이터를 활용하고 편향을 수정하여 보다 정확한 예측을 가능하게 합니다.

그 영향에 대한 지식 없이 알파를 추정하는 것은 특히 무역 데이터의 신뢰성이 부족한 경우에 상당한 어려움을 야기합니다. 웹스터 박사는 가격 책정 기술에 의존하지 않고 편향되지 않은 데이터를 얻기 위해 거래를 무작위로 제출할 것을 제안합니다. 그러나 이 접근 방식은 알파에 대한 신뢰 구간을 설정하기 위해 많은 거래를 포기해야 하며 이는 실용적이지 않을 수 있습니다. 또는 인과적 기계 학습을 활용하여 더 적은 데이터로 유사한 결과를 달성할 것을 제안합니다. 인과관계 머신 러닝은 거래 비용 분석, 가격 영향 평가 및 알파 연구와 같은 거래 애플리케이션에서 특히 가치가 있음을 입증했으며, 깊이 있고 편향된 거래 데이터의 가용성으로 인해 기존 계량 경제학을 능가합니다.

연사는 또한 A/B 테스트에서 통계 분석의 중요성에 대해 깊이 파고들어 가격 영향을 정의하고 예측 편향과 싸우기 위해 통계적 측정을 첨부해야 할 필요성을 강조합니다. 이 편견을 다루지 않으면 분석이 주관적이 되고 개별 해석에 의존하게 됩니다. Webster 박사는 관찰 공공 데이터가 제기하는 문제를 인정하고 개입 데이터에서 얻은 통찰력을 강조합니다. 채택할 접근 방식에 대한 질문에 대답하는 것은 복잡하지만 A/B 테스트는 여전히 은행 및 중개 업계에서 일반적인 관행입니다.

마지막으로 Webster 박사는 전이 학습과 인과 정규화 간의 관계에 대해 간략하게 설명합니다. 둘 다 하나의 데이터 세트에서 모델을 교육하고 다른 데이터 세트에 적용하는 것과 관련되지만 전이 학습에는 인과 관계 해석이 없습니다. 이 둘 사이의 유사점은 교차 유효성 검사가 중추적인 역할을 하는 유효성 검사 프로세스에 있습니다. 수학적 유사성에도 불구하고 Webster 박사는 접근 방식에서 인과적 해석의 참신함을 강조합니다.

  • 00:00:00 Kevin Webster가 실시간 거래 실험 및 인과관계 기계 학습에 대해 이야기합니다. 그는 헤지 펀드가 거래를 실행하고 최상의 실행을 보장하는 동시에 고객의 이익을 위해 행동했음을 증명하는 브로커를 통해 거래하는 시나리오를 설명합니다. 중개인은 고객이 알파 신호를 기반으로 무작위로 거래하지 않기 때문에 어려움에 직면하고 있으며 거래 중 관찰된 수익은 가격 영향과 거래로 인한 예상 가격 변동의 혼합입니다. Webster는 인과 정규화를 사용하여 이 문제를 해결하는 것을 목표로 하고 예측된 가격 변동이 주문 흐름과 어떻게 관련되는지 학습하는 모델을 제안합니다.

  • 00:05:00 발표자는 수익의 두 가지 구성 요소인 알파 신호와 가격 영향 간의 차이점에 대해 논의합니다. 알파 신호는 주식 거래 여부에 관계없이 발생할 가격 변동을 예측하는 반면 가격 영향은 거래로 인한 가격 변동을 설명합니다. 트레이더는 가격 책정 백놀을 사용하여 가격이 거래에 어떻게 반응하는지 시뮬레이션하고 가상 시나리오에 답합니다. 그러나 트레이더가 가격 변동을 일으켰는지 예측했는지 구분하기 어려워 예측 편향이 발생합니다. CFM의 독점 데이터 및 기타 기술은 회귀에서 거래를 유발한 거래 신호를 고려하여 편향을 제거하고 예측 편향을 수정하는 데 도움이 될 수 있습니다.

  • 00:10:00 비디오의 이 섹션에서 Dr. Kevin Webster는 거래의 예측 편향 문제와 이것이 중개인과 알파 연구원 모두에게 미치는 영향에 대해 논의합니다. 그는 알파 연구원이 알파 신호를 가지고 있을 수 있지만 좋은 가격 영향 모델을 가지고 있지 않아 알파를 과대평가하게 될 수 있다고 설명합니다. 반대로 중개인이 알파를 모르면 고객을 위해 너무 느리게 거래합니다. Webster 박사는 비용이 많이 드는 무작위 거래 또는 무작위 거래 데이터와 과거 데이터를 지능적으로 결합하여 기존 계량 경제학보다 더 나은 성과를 얻는 방법인 인과적 정규화를 사용할 것을 제안합니다. 그는 시뮬레이션을 사용하여 이러한 방법의 성능을 비교할 것이라고 말하면서 결론을 내립니다.

  • 00:15:00 Kevin Webster 박사는 세 가지 계량 경제학 테스트 방법에 대해 설명하고 인과 관계 추론의 중요성을 강조하며 기술 산업, 특히 기계 학습 커뮤니티에서 이미 활발하게 사용되고 있는 방법을 설명합니다. 그는 또한 이러한 비즈니스가 어떻게 인과적 기계 학습을 활용하여 팀이 실측에 신속하게 정렬하고, 놀라운 결과를 재조사하지 않고, 잘못된 실험을 다시 실행하지 않고, 중요한 결정에 대한 추측을 방지할 수 있는지 강조합니다. Webster 박사의 방법은 인과적 테스트와 계량경제적 테스트를 결합하여 5분의 1 적은 데이터를 기반으로 보다 정확한 예측을 가능하게 합니다.

  • 00:20:00 저자는 거래의 알파, 거래 규모 및 거래 중 수익의 세 가지 변수를 포함하는 인과 관계 그래프를 연구에 제안합니다. 그는 알파 모델의 기본 기능이 주식의 다양한 기본 가격 움직임을 주도하고 그의 거래 알고리즘이 알파 신호에 반응하여 거래를 유발한다고 가정합니다. 그는 또한 거래가 가격 영향으로 알려진 가격 변동을 유발한다고 가정합니다. 웹스터 박사에 따르면 거래자들이 어떤 멋진 회귀 기법을 사용하든 알파를 관찰하지 않고는 가격 영향을 예측할 수 없습니다. 트레이더는 이를 랜덤화하여 가격 영향을 추정할 수 있는데, 이는 금융 업계에서 활발하게 사용되는 랜덤화된 거래 비용으로 알려져 있습니다. 그러나 이러한 무작위화는 비용이 많이 들기 때문에 실질적인 주문에만 사용이 제한됩니다.

  • 00:25:00 발표자는 실험의 제한된 크기와 기간으로 인해 관찰 데이터와 비교하여 무작위 거래 실험의 한계에 대해 논의합니다. 합리적인 매개변수 집합의 경우 관찰 데이터 집합이 개입 데이터 집합보다 클 수 있으며 거래자는 실수로 인한 비용 때문에 실험을 배포하기 전에 실험을 설계해야 합니다. 무작위 거래를 제출하기 전에 시뮬레이터를 사용하여 실험의 비용과 신뢰 구간을 결정하는 것이 중요합니다. 바이어스를 고려하지 않고 알파를 무시하면 높은 바이어스와 낮은 분산이 발생합니다.

  • 00:30:00 Kevin Webster 박사는 기존 계량 경제학의 한계를 설명하고 인과 정규화의 개념을 소개합니다. 이 개념은 Amazon에서 나온 방법으로 편향 데이터를 훈련 데이터로 사용하고 비편향 데이터를 테스트 데이터로 사용하여 메타 매개변수를 조정합니다. 이 방법은 적은 양의 실험 데이터만 사용하는 기존 방법과 달리 바이어스가 낮고 분산이 낮은 추정기를 보장합니다. 인과 관계 정규화 알고리즘을 사용하면 사용 가능한 대규모 조직 데이터를 사용하고 편향을 수정하여 거래자에게 정확한 추정치를 제공할 수 있습니다.

  • 00:35:00 비디오의 이 섹션에서 Dr. Kevin Webster는 무역 데이터에 대한 신뢰가 없을 때 영향을 알지 못한 채 알파를 추정하는 문제에 대해 설명합니다. 그는 편향되지 않은 데이터를 얻기 위해 거래가 무작위로 제출되지 않는 솔루션을 제안합니다. 이는 모델이 없고 가격 책정 기술이 필요하지 않습니다. 그러나 단점은 Alpha에 대한 신뢰 구간을 얻기 위해 거래의 상당 부분을 포기해야 한다는 것입니다. 이는 거래자에게 실용적이지 않을 수 있습니다. 그런 다음 이 문제를 해결하고 더 적은 데이터로 동일한 결과를 얻을 수 있는 기계 학습 방법을 제안합니다. 인과관계 기계 학습은 거래 비용 분석, 가격 영향 및 Alpha 연구와 같은 거래 애플리케이션에 적용할 수 있으며 깊이 있고 편향된 거래 데이터의 가용성으로 인해 거래 데이터 체계에서 기존 계량 경제학을 능가합니다.

  • 00:40:00 발표자는 A/B 테스트와 관련된 근본적인 불확실성과 통계 분석이 거래 수준이 아닌 통계적으로 유의미한 사실을 찾는 데 어떻게 중요한 역할을 하는지에 대해 논의합니다. 그는 가격 영향을 정의하고 해당 정의에 통계 수치를 첨부하면 예측 편향을 방지하는 데 도움이 될 수 있다고 강조합니다. 그러나 예측 편향과 싸울 무언가가 없으면 분석이 주관적이 되고 보는 사람의 눈에 따라 달라집니다. Webster 박사는 또한 관찰 공공 데이터와 관련된 문제와 개입 데이터가 분석에 대한 더 많은 통찰력을 제공할 수 있는 방법에 대해 논의합니다. 그는 대답하기 어려운 질문이지만 A/B 테스트는 많은 은행과 중개인이 채택하는 일반적인 변환임을 인정합니다.

  • 00:45:00 Kevin Webster 박사가 전이 학습과 인과 정규화 간의 관계에 대해 간략하게 설명합니다. 그는 하나의 데이터 세트에서 모델을 훈련하고 다른 데이터 세트에서 잘 작동하기를 바라는 것과 관련되어 있기 때문에 둘 사이에 유사점이 있다고 지적합니다. 전이 학습에는 인과 관계 해석이 없지만 전이 학습의 증명은 인과 정규화에도 적용되는 교차 검증으로 인해 작동합니다. 수학적 유사성에도 불구하고 Webster 박사는 접근 방식의 인과적 해석이 상당히 참신하다고 주장합니다.
Dr. Kevin Webster: "Getting More for Less - Better A/B Testing via Causal Regularization"
Dr. Kevin Webster: "Getting More for Less - Better A/B Testing via Causal Regularization"
  • 2022.11.09
  • www.youtube.com
Abstract: Causal regularization solves several practical problems in live trading applications: estimating price impact when alpha is unknown and estimating...
 

Yuyu Fan(Alliance Bernstein): "인사이트 추출을 위한 텍스트 마이닝 활용"



Yuyu Fan(Alliance Bernstein): "인사이트 추출을 위한 텍스트 마이닝 활용"

Alliance Bernstein의 연구원인 Yuyu Fan은 수익 결산 기록을 분석하고 효과적인 거래 전략을 생성하는 데 있어 자연어 처리(NLP) 및 기계 학습의 적용에 대한 귀중한 통찰력을 제공합니다.

Fan의 팀은 감정 분석, 회계 분석, 가독성 점수 등 다양한 기술을 사용하여 수익 보고서 기록에서 추출한 200개 이상의 기능을 선별했습니다. 그들은 BERT(Bidirectional Encoder Representations from Transformers)와 같은 고급 모델을 활용하여 CEO의 감정과 분석가의 감정을 비교하여 연사의 감정을 평가했습니다. 흥미롭게도 그들은 분석가의 감정이 더 신뢰할 수 있는 경향이 있다는 것을 발견했습니다.

분석은 개별 섹션과 녹취록의 결합된 섹션 모두에 대해 수행되었으며, 팀은 컨텍스트 기반 접근 방식이 배경 단어를 기반으로 하는 순진한 접근 방식을 능가한다는 사실을 발견했습니다. 특히 미국 소형주에 대한 정서 신호는 좋은 성과를 보였고 투자 팀의 추천을 받았습니다.

방법론을 설명하면서 Fan은 팀이 다양한 기능의 성능을 평가하기 위해 분위수 선별 및 백테스팅을 어떻게 사용했는지 설명합니다. 그들은 사전 기반 접근 방식과 BERT를 사용한 컨텍스트 기반 접근 방식을 기반으로 감정 점수를 조사했습니다. 팀은 또한 텍스트 이해의 용이성을 측정하는 가독성 점수를 조사했으며 회사 성과와의 잠재적 상관 관계를 식별하기 위해 CEO 의견에 중점을 두었습니다.

Fan은 주어진 단어의 왼쪽과 오른쪽에서 컨텍스트 정보를 캡처하는 양방향 인코더 표현을 강조하면서 BERT 작업에 대한 통찰력을 제공합니다. 팀은 자체 레이블 지정 및 외부 데이터 세트를 통해 감정 레이블을 추가하여 감정 분석을 위해 BERT 모델을 미세 조정했습니다. 결과는 BERT 기반 정서 분석이 사전 기반 정서 분석보다 우수한 것으로 나타났습니다.

또한 Fan은 감정 분석을 위한 정확도 임계값을 설정하는 문제에 대해 논의하고 실제 성능은 정확도 수준 간에 크게 다르지 않을 수 있음을 강조합니다. 그녀는 투자 팀의 추천으로 이어진 미국 소형주에 대한 그들의 심리 신호의 성공을 강조합니다. Fan은 또한 데이터 확대를 통해 모델을 개선하기 위한 지속적인 노력과 함께 효율적인 거래 전략을 만들기 위한 정량적 신호 역할을 할 수 있는 NLP 기능을 자세히 설명하는 논문의 출판에 대해 언급합니다.

토론은 NLP 기능과 기존의 기본 및 정량적 기능 간의 상관 관계를 다루도록 확장되어 가독성 및 정서 회계에서 관찰된 적당한 상관 관계를 강조합니다. Fan은 재조정 전에 사용 가능한 최신 정보를 기반으로 회사를 선택하는 것을 포함하여 수익 방법론을 명확히 합니다.

마지막으로 Fan은 CO2 차익 거래, BERT와 FinBERT의 차이점, 특히 금융 관련 보고, 수익 및 뉴스에 맞게 조정된 BERT의 금융 사용 모델 개발과 같은 주제를 다룹니다. 전사 서비스 및 공급업체 솔루션을 사용하여 오디오 데이터를 분석을 위한 전사로 변환하는 프로세스도 언급됩니다.

요컨대, Yuyu Fan의 연구는 수입 통화 기록을 분석하는 데 NLP 및 기계 학습 기술의 힘을 보여줍니다. 감성 분석, 회계 분석, 가독성 스코어링을 적용하고 BERT와 같은 고급 모델을 활용하여 효율적인 거래 전략을 생성할 수 있습니다. 상황 중심 접근 방식은 순진한 접근 방식을 능가하며 정서 신호는 특히 Alliance Bernstein의 투자 팀이 권장하는 미국 소규모 기업에 가치가 있음이 입증되었습니다.

  • 00:00:00 Yuyu Fan은 자연어 처리(NLP)를 사용하여 재무에서 수익 보고서를 분석하는 방법에 대해 이야기합니다. 회사는 투자 커뮤니티와 재무 및 비즈니스 정보를 공유하기 위해 실적 발표를 사용하고 분석가는 일반적으로 회사의 실적과 주가에 영향을 미칠 수 있는 정보에 대한 기록을 분석합니다. 그러나 대규모 회사의 성적표를 수동으로 분석하는 것은 노동 집약적이며 NLP 및 기계 학습 기술이 사용됩니다. 이러한 기술은 재무 문서를 분석하고 효율적인 거래 전략을 수립하는 데 효율적인 것으로 입증되었습니다. Yuyu Fan의 연구는 미국 대형주에 대한 일반적인 테스트를 넘어 미국 소형주 및 신흥 시장을 포함한 다양한 유니버스 캡을 포함하도록 확장됩니다. 또한 분석은 개별 섹션과 녹취록의 통합 섹션에 대해 수행되며 체계적인 비교를 통해 컨텍스트 기반 접근 방식이 배경 단어 순진한 접근 방식보다 우수함을 보여줍니다.

  • 00:05:00 Yuyu Fan은 텍스트 마이닝 분석에 사용된 데이터에 대해 논의하고 프레젠테이션과 Q&A 섹션의 두 섹션으로 구성된 수입 통화 기록의 구조를 설명합니다. 그들은 이러한 각 개별 섹션과 결합된 섹션에서 NLP 기능을 생성했습니다. 생성된 NLP 기능의 세 가지 범주는 정서, 회계 및 가독성 점수입니다. 또한 분석을 위한 간단한 백 테스트 방법을 제공합니다. 감정 기능은 다시 두 가지 범주로 나뉩니다. 하나는 사전 기반이고 다른 하나는 컨텍스트 기반입니다.

  • 00:10:00 Alliance Bernstein의 Yuyu Fan이 텍스트 마이닝을 사용하여 강력하고 우수한 성과를 내는 투자 신호를 찾기 위해 생성된 200개 이상의 기능을 선별하는 방법을 설명합니다. 그들은 데이터 마이닝뿐만 아니라 근본적인 분석과 경제적 직관, 선행 연구도 고려합니다. 기능 값별로 구성요소의 순위를 매기고 각 분위수에 대한 월별 수익을 추적하여 성능을 평가합니다. 첫 번째 범주는 단순한 단어 수이며, 기능 중 하나는 애널리스트 질문 단어 수로, 행동 양식이 다른 신흥 시장을 제외하고는 일반적으로 이전 기대치와 일관된 성과를 보입니다. 그들은 연간 수익률 및 월과 같은 기본 메트릭을 사용하여 성과를 평가하고 이 신호가 그다지 좋지는 않고 괜찮다는 것을 발견합니다.

  • 00:15:00 발표자가 가독성 점수의 개념과 그녀의 팀이 CEO 댓글을 분석하기 위해 이를 어떻게 사용하는지 설명합니다. 가독성 점수는 어려운 단어의 수와 문장 길이를 고려하여 텍스트를 읽고 이해하는 것이 얼마나 어려운지를 측정하는 데 사용되는 척도입니다. 점수가 높을수록 텍스트가 이해하기 어렵다는 의미이고 점수가 낮을수록 이해하기 쉽다는 의미입니다. Fan의 팀은 이해하기 쉬운 댓글이 회사의 투명하고 좋은 성과로 이어질 가능성이 높다는 가설을 가지고 CEO 댓글의 가독성 점수를 계산하기 위해 "텍스트 통계"라는 오픈 소스 Python 패키지를 사용했습니다. 그런 다음 팀은 분위수 선별을 사용하여 다양한 기능을 평가하고 최고의 성능을 투자 팀에 추천했습니다.

  • 00:20:00 Alliance Bernstein의 Yuyu Fan이 감정 분석을 사용하여 CEO 연설 기록에서 통찰력을 추출하는 방법에 대해 설명합니다. Fan은 금융 연구를 위해 특별히 설계된 일반 사전 또는 독점 사전을 사용하는 것과 같은 사전 기반 접근 방식을 사용하여 감정 점수를 계산할 수 있다고 설명합니다. 결과는 LM 사전을 기반으로 한 정서 분석이 특히 미국 소규모 기업에 대해 더 많은 투자 신호를 전달한다는 것을 보여줍니다. 월별 재조정이 사용되며 기업은 업종 중립적 5분위수로 순위가 매겨집니다. 각 5분위에 대한 결과는 정서 분석을 사용할 때 더 차별화할 수 있으며, 이는 정서가 높을수록 더 나은 성과를 가져온다는 것을 나타냅니다.

  • 00:25:00 Alliance Bernstein의 Yuyu Fan은 팀이 텍스트 마이닝을 활용하여 인사이트를 추출하고 화자의 감정을 평가한 방법을 설명합니다. 이들은 CEO 정서와 애널리스트 정서의 차이를 분석한 결과, CEO가 자신의 발언에 대해 분석 결과를 왜곡할 가능성이 있기 때문에 애널리스트 정서가 더 신뢰할 수 있는 지표일 수 있다는 점을 발견했다. 그들은 또한 특히 BERT라는 Transformer 모델을 활용하여 자연어 이해에 대해 탐구했습니다. BERT는 양방향 인코더 표현을 활용합니다. 즉, 컨텍스트 내에서 특정 단어의 의미를 더 잘 예측하기 위해 왼쪽과 오른쪽의 주변 정보를 고려합니다.

  • 00:30:00 Yuyu Fan이 감정 분석을 위해 BERT(Bidirectional Encoder Representations from Transformers) 모델이 작동하는 방식을 설명합니다. 모델의 인코더 부분은 측면 언어 이해(번역이 필요 없는 언어 이해)에 사용됩니다. 모델의 이 부분에서 임베딩은 전체 문장의 정보를 나타낼 수 있으며 미세 조정하여 감정 분류 모델을 생성할 수 있습니다. 사전 훈련된 BERT 모델을 사용하고 다운스트림 감정 분류 작업을 추가하면 미세 조정이 훨씬 쉬워집니다. 감정 레이블은 자체 레이블 지정을 통해 추가되고 외부 데이터 세트를 통해 레이블이 지정되며 모델은 -1에서 1까지의 범위에서 감정 점수를 예측하도록 훈련됩니다. 마지막으로 Fan은 BERT 기반 감정 분석이 사전 기반 감정 분석보다 성능이 우수함을 보여줍니다. 수입 통화 기록의 예를 사용한 감정 분석.

  • 00:35:00 Alliance Bernstein의 Yuyu Fan이 텍스트 마이닝과 사전 학습된 BERT 모델을 특정 레이블 문장으로 미세 조정하여 금융 텍스트의 분류를 개선하는 방법에 대해 설명합니다. 사전 훈련된 모델의 영어 토큰에 대한 광범위한 어휘 범위는 조합을 캡처하고 단어를 생성할 수 있지만 특정 금융 언어를 캡처하지 못할 수 있습니다. 긍정적인 단어와 부정적인 단어가 모두 포함된 문장의 성능에 대해 묻는 질문에 Yuyu Fan은 분석가의 해석과 기대에 따라 분류가 달라질 수 있지만 수익이 10% 증가했다고 보고하면 문장 자체는 긍정적으로 분류될 수 있다고 설명합니다.

  • 00:40:00 Alliance Bernstein의 Yuyu Fan은 감정 분석의 정확성에 대한 엄격한 임계값을 갖는 것이 어렵다고 설명합니다. 학계에서는 큰 차이를 만들 수 있지만 실제 응용에서는 90% 정확도와 92% 정확도가 평균 또는 표준 편차를 사용하여 섹션 수준으로 집계될 때 유사한 성능으로 이어질 수 있으므로 큰 차이가 없을 수 있습니다. Fan은 그들의 모델이 모든 문장에 대해 약 90%의 정확도를 가지고 있으며 그들의 정서 신호가 미국 소형주 회사에서 잘 작동하여 투자 팀이 사용할 것을 권장하는 신호라고 설명합니다. Fan은 또한 효율적인 거래 전략을 형성하기 위해 수량 신호로 사용할 수 있는 NLP 기능에 대한 자세한 내용이 포함된 논문을 발표했으며 현재 모델을 개선하기 위해 데이터 증강 작업을 하고 있다고 공유합니다.

  • 00:45:00 Alliance Bernstein의 데이터 과학자 Yuyu Fan이 NLP 기능이 기존의 기본 및 정량적 기능과 어떻게 관련되는지 설명합니다. 그들은 상관관계가 일반적으로 낮고 가독성이 높으며 대형주 모멘텀에 대해 0.54 정도의 중간 상관관계를 갖는 정서를 설명합니다. 그녀는 또한 세금 통계와 같은 패키지를 사용하여 가독성을 측정하고 용도에 맞게 사용자 정의하는 방법을 설명합니다. Fan은 한 달의 수익을 추적하고 재조정일 이전에 사용 가능한 최신 정보가 있는 회사만 포함하는 수익 방법론을 더 명확히 설명합니다. 마지막으로, 그녀는 CO2 차익 거래에 대한 질문에 답하고 그들의 방법에서 사용하는 BERT와 FinBERT의 차이점을 명확히 합니다.

  • 00:50:00 Yuyu Fan이 텍스트 마이닝을 사용하여 인사이트를 추출하는 방법에 대해 설명합니다. 그녀는 BERT 모델의 재무 사용 모델 개발에 대해 언급하며, 특히 재무와 관련된 신고, 수입 및 뉴스에 중점을 둡니다. 이 모델은 양수, 음수 및 중립 출력 확률에 대한 레이블을 사용하여 사전 훈련된 버전과 미세 조정된 버전을 구분합니다. Fan은 모델의 정확도가 분야에 따라 다르며 특정 주제에 대한 감정 분류를 개선하기 위해 데이터 증강을 위한 방법을 모색하고 있다고 말합니다. 이 섹션은 분석을 위해 오디오 데이터를 대본으로 변환하는 프로세스에 대한 논의로 끝납니다.

  • 00:55:00 Alliance Bernstein의 Yuyu Fan이 텍스트 마이닝을 사용하여 인사이트를 추출하는 방법에 대해 설명합니다. 이 회사는 고품질 공급업체 데이터뿐만 아니라 협업을 위한 전사 서비스 및 공급업체 솔루션에 SMT를 사용합니다. 그들은 또한 Open AI의 Whisper라는 모델을 실험하고 있습니다. 이 모델은 다국어 전사를 포함하여 오디오 전사에 대규모 변환기 모델을 사용합니다. 그러나 시간 제약으로 인해 Q&A 세션은 여기서 끝납니다.
Yuyu Fan (Alliance Bernstein): "Leveraging Text Mining to Extract Insights"
Yuyu Fan (Alliance Bernstein): "Leveraging Text Mining to Extract Insights"
  • 2022.10.26
  • www.youtube.com
Welcome to the first of the UBS and CFEM AI, Data and Analytics Speaker Series!Yuyu Fan of Alliance Bernstein spoke about "Leveraging Text Mining to Extract ...
 

Ciamac Moallemi(콜롬비아): "유동성 제공 및 자동화된 시장 조성"



Ciamac Moallemi(콜롬비아): "유동성 제공 및 자동화된 시장 조성"

이 포괄적인 토론에서 Columbia University의 교수인 Ciamac Moallemi는 다양한 각도에서 유동성 제공 및 자동화된 시장 조성(AMM)의 복잡성을 탐구합니다. 그는 블록체인 플랫폼이 직면한 계산 및 저장 문제를 해결하는 AMM의 관련성과 유동성 공급자에게 긍정적인 수익을 창출할 수 있는 능력을 강조합니다. 개념을 설명하기 위해 Moallemi는 UniSwap V2의 변동성에 대한 역선택 비용을 제시하여 1억 2,500만 달러 풀에서 연간 약 39,000달러의 비용을 공개합니다. 그는 유동성 공급자의 수익을 결정하는 데 있어서 변동성과 거래량의 중요성을 강조하고 AMM이 차익 거래자와 정보에 입각한 거래자를 처리하는 방법을 설명합니다.

Moallemi는 블록체인에서 AMM을 활용하는 이점을 강조하고 풀링된 가치 기능과 본딩 기능의 역할을 탐구합니다. 그는 재조정 전략과 관련된 위험 및 비용 헤지의 중요성을 강조합니다. 또한 Moallemi는 이더리움 블록체인의 실제 데이터와 비교하여 유동성 제공 및 자동화된 시장 조성을 위한 자신의 모델을 소개합니다. 그는 자신의 모델이 중개자에게 지불하는 비용을 줄임으로써 AMM을 잠재적으로 향상시킬 수 있는 방법에 대해 설명합니다. Moallemi는 Oracle을 데이터 소스로 활용하고 승인된 참가자에게 차익 거래 권한을 판매하여 수수료 없이 풀과 거래할 수 있도록 하는 등 차선의 가격으로 인한 비효율성을 완화하기 위한 다양한 접근 방식을 제안합니다.

또한 Moallemi는 특히 단순성과 접근성 측면에서 전통적인 지정가 주문장에 비해 AMM의 이점을 설명합니다. 그는 AMM이 복잡한 알고리즘과 광범위한 리소스의 필요성을 제거하여 덜 정교한 참가자를 위해 경쟁의 장을 평준화하는 방법을 강조합니다. Moallemi는 더 넓은 범위의 참여자에게 혜택을 주는 더 나은 구조의 잠재력에 대한 낙관론을 표현하면서 결론을 내리고 AMM을 올바른 방향으로 나아가는 단계로 포지셔닝합니다.

  • 00:00:00 이 섹션에서는 Columbia University의 Ciamac Moallemi가 암호화폐 세계의 자동화된 시장 조성자를 중심으로 유동성 공급 및 자동화된 시장 조성에 대해 논의합니다. 그는 거래의 문제는 전통적인 금융에서 전자 지정가 주문 장부로 대부분 해결되지만 암호화폐에서 이 구조를 도매로 채택하는 데는 몇 가지 문제가 있다고 설명합니다. Moallemi는 거래에 블록체인을 사용하는 계산 및 저장 비용과 자동화된 마켓 메이커가 가격 알고리즘을 사용하여 자산의 구매 및 판매 가격을 인용함으로써 이러한 문제를 해결하고 시장에 유동성을 제공하는 방법에 대해 논의합니다.

  • 00:05:00 이 섹션에서 연사는 높은 업데이트 속도와 제한된 계산 및 저장 환경에서 거래를 위해 지정가 주문장을 사용하는 문제에 대해 논의합니다. 시장 조성에는 적극적인 시장 조성자의 참여가 필요하며 특히 새로운 토큰의 경우 암호화폐 세계에서 부트스트랩하기 어려울 수 있습니다. 이러한 문제를 해결하기 위해 사람들은 유동성 공급자를 사용하여 ETH 및 미국 달러와 같은 자산 풀을 풀에 넣는 자동 시장 조성자(AMM)를 개발했습니다. 이러한 AMM은 계산적으로 효율적이며 정렬이나 비교가 필요하지 않으므로 블록체인 환경에 이상적입니다. 유동성 공급자는 풀에 대한 거래에 대해 수수료를 받고 가격은 풀에 있는 기능으로 설정됩니다.

  • 00:10:00 이 섹션에서 Ciamac Moallemi는 유동성 공급자의 관점에서 유동성 제공 및 자동화된 시장 조성(AMM)에 대해 논의하고 UniSwap과 같은 AMM 시스템을 사용하는 비용과 이점을 간략하게 설명합니다. Moallemi는 수동적 유동성 공급자가 AMM 시스템을 통해 수수료를 받을 수 있지만 항상 역선택과 같은 시장 조성 비용이 발생한다고 설명합니다. Moallemi는 UniSwap V2의 구체적인 예를 사용하여 변동성에 대한 역선택 비용이 일반적으로 3bp이며, 그 결과 1억 2500만 달러 상당의 풀에서 연간 약 39k의 비용이 발생한다는 것을 보여줍니다. 비용에도 불구하고 Moallemi는 AMM 시스템이 유동성 공급자에게 긍정적인 수익을 창출할 수 있지만 관련된 위험과 비용을 정확하게 평가하는 것이 필수적이라고 지적합니다.

  • 00:15:00 이 섹션에서는 Columbia University의 Ciamac Moallemi가 유동성 공급 및 자동화된 시장 조성에 대해 논의합니다. Moallemi는 유동성 공급자 수익률의 동인, 특히 변동성과 거래량의 중요성을 강조합니다. 그는 또한 헤지 수익, 거래 수수료 및 레버 비용을 포함하는 LP 수익 분해에 대한 봉투 뒷면 계산을 설명합니다. Moallemi는 레버 비용이 중앙 집중식 거래소에서 가격이 책정되고 AMM이 부정확한 가격으로 거래되어 슬리피지를 겪으면서 발생하는 역선택 비용이라고 설명합니다. 이는 차익 거래 기회로 이어지고, 차익 거래자는 풀에서 이익을 얻어 제로섬 게임이 됩니다. 정보에 입각한 트레이더와 차익 거래자의 차이점에 대해서도 설명합니다.

  • 00:20:00 이 섹션에서 Ciamac Moallemi는 고전적인 역선택 모델을 사용하여 정보에 입각한 거래 측정의 어려움과 변동성이 발생하는 방식에 대해 설명합니다. 그는 또한 옵션 가격 해석과 폐쇄형 포럼 공식을 사용하여 지속적으로 작업하는 편의성에 대해 이야기합니다. Moallemi는 예측 시장 및 자동화된 마켓 메이커와 같은 마켓 메이킹 세계에서 다른 인기 있는 주제를 언급합니다. 그런 다음 블록체인이 컴퓨터로 작동하여 전환 및 지불을 추적하는 방법을 설명합니다. 이더리움은 시스템의 더 복잡하고 값비싼 버전입니다. 느리고 비용이 많이 들지만 블록체인은 여전히 거래 및 예측 시장의 중요한 부분입니다.

  • 00:25:00 이 섹션에서 Ciamac Moallemi는 느린 컴퓨터 활용, 특히 소액 트랜잭션이나 간단한 계산 작업이 필요한 시나리오에서 금융의 중요성에 대해 논의합니다. 그는 거래가 가장 큰 하위 범주이고 Uniswap이 가장 중요한 프로토콜 또는 스마트 계약인 금융 관련 응용 프로그램에서 Ethereum 시스템에 사용되는 리소스의 비율을 반영하는 차트를 보여줍니다. 대부분의 암호화폐 거래는 거래소에서 이루어지지만 Uniswap과 같은 탈중앙화 거래소도 총 거래액이 약 1조 달러에 달하는 중요한 거래소입니다. Moallemi는 "x"로 표시되는 위험 자산과 "y"로 표시되는 무위험 자산(시장 가격이 가격임)을 거래하기 위한 모델로 확률적 변동성이 있는 연속 시간 Black-Scholes 설정을 제시합니다. 분자 측면에서 위험 자산의.

  • 00:30:00 비디오의 이 섹션에서 Ciamac Moallemi는 금융 산업에서 유동성 제공 및 자동화된 시장 조성의 개념과 작동 방식을 설명합니다. 그는 이 프로세스의 수익이 어떻게 랜덤 워크인지, 그리고 이 개념이 금융에서 매우 표준적인 모델인지에 대해 이야기합니다. 그런 다음 자동화된 마켓 메이커의 개념을 일정한 기능의 마켓 메이커로 설명합니다. 여기서 기능은 본딩 기능에 의해 일정하게 유지됩니다. 유동성 공급자는 준비금을 제공하고 거래자는 기능을 일정하게 유지하는 곡선의 다른 지점으로만 이동할 수 있습니다. 대각선의 기울기는 순간 가격을 나타냅니다. 메커니즘은 불변성을 만족시키고 거래에 대해 예 또는 아니오를 말하기 위해 어떤 재고가 있는지 알고 있습니다.

  • 00:35:00 이 섹션에서 Ciamac Moallemi는 Binance와 같은 기존 거래소와 달리 블록체인에서 AMM(Automated Market Making)을 사용할 때의 이점에 대해 설명합니다. 블록체인에 있으면 담보 대출 또는 포트폴리오 최적화와 같은 다양한 서비스가 가능하며 이는 기존 거래소에서는 불가능합니다. 또한 블록체인 거래는 컴퓨터 프로그램의 서브루틴이 될 수 있으며, 이는 기존 거래소에서는 사용할 수 없는 기능입니다. AMM의 수수료는 수량에 비례하지만 유동성 공급자의 수준은 시간이 지남에 따라 변경되어 수수료 분배에 영향을 미칠 수 있습니다. 시장 모델에는 두 가지 유형의 거래자가 포함됩니다. 중앙 집중식 거래소와 외부 시장을 지속적으로 모니터링하는 차익 거래자와 블록체인에서 유용성을 얻는 노이즈 거래자입니다. 이 분석에서는 일정한 유동성 공급자, 수수료에 대한 현금 지불을 가정하고 블록체인의 불연속 시간 대 연속 시간을 무시합니다.

  • 00:40:00 이 섹션에서 Ciamac Moallemi는 유동성 제공 및 자동화된 시장 조성의 개념을 설명합니다. 그는 x를 y로 거래하는 예를 사용하고 가장 느린 부분은 거래할 수 있는 비율입니다. 그는 초평면을 지원하는 가격인 이중 변수로 이동하여 문제를 더 잘 설명하는 방법을 설명합니다. 그는 풀 가치 함수가 중요한 객체이며 함수가 매끄럽고 두 번 연속 미분 가능하다고 가정한다고 설명합니다. Moallemi는 또한 arbitragers가 균형을 유지하도록 장려하는 본딩 기능의 속성과 지속적인 제품 케이스에 대해 논의합니다. 차익 거래자는 지속적으로 시장을 모니터링하여 최대한의 돈을 벌기 위해 풀의 최소 가치를 남겨둡니다.

  • 00:45:00 이 섹션에서는 Columbia University의 Ciamac Moallemi가 재조정 전략 및 차익 거래 사용을 포함하여 유동성 제공 및 자동화된 시장 조성에 필요한 핵심 요소에 대해 논의합니다. 리밸런싱 전략은 중재자와 동일한 방식으로 위험한 자산을 사고 파는 것을 포함하지만 공정한 시장 가격으로 중앙 집중식 거래소에서 거래합니다. 레버 손실 대 재조정 정리는 프로세스를 음수가 아닌, 감소하지 않는, 예측 가능한 것으로 특징지어 풀 준비금 값이 거래소에서 거래하는 것과 비교하여 체계적으로 손실을 입는다는 것을 보여줍니다. 이러한 핵심 요소는 효과적인 유동성 제공 및 시장 조성에 중요합니다.

  • 00:50:00 이 섹션에서 Ciamac Moallemi는 재조정 전략과 관련된 위험 및 비용과 이를 잠재적으로 헤지할 수 있는 방법에 대해 논의합니다. 그는 포트폴리오 가치의 즉각적인 변화에는 두 가지 구성 요소가 있다고 설명합니다. 첫 번째 구성 요소는 시장 위험으로 이는 시장에 노출되어 있음을 의미하며 두 번째 구성 요소는 국부적으로 위험이 없고 예측 가능하지만 체계적인 운영 비용이 있습니다. Moallemi는 순간 레버에 대한 공식과 현재 가격 수준에서 사용할 수 있는 유동성의 양과 순간 변동에 의해 어떻게 영향을 받는지 분석합니다. 그는 또한 이 공식이 지속적인 제품 시장 조성자에게 어떻게 적용될 수 있는지 보여줍니다.

  • 00:55:00 이 섹션에서 Moallemi는 풀의 가치가 결코 0이 되지는 않지만 대안보다 가치가 떨어질 수 있다고 설명합니다. 재조정 전략은 가격이 오를 때 팔고 가격이 내릴 때 사므로 시간이 지남에 따라 체계적으로 돈을 벌 수 있습니다. 또한 Moallemi는 대부분의 유동성 풀의 경우 외부 시장을 가정하는 것이 합리적이지만 롱테일의 경우 이는 좋은 가정이 아니라고 모델의 가정에 대해 논의합니다. 그러나 이 모델은 여전히 예측 모델로 유용하며 일관된 가격을 제공합니다. 그런 다음 Moallemi는 모델을 예측 모델로 사용하는 방법을 설명하고 LP에서 수집한 수수료와 풀 가치의 변화를 살펴보고 금융에 대한 부정적인 재조정 거래로 시장 위험을 헤지합니다.

  • 01:00:00 이 섹션에서는 Columbia University의 Ciamac Moallemi가 유동성 공급 및 자동화된 시장 조성에 대한 모델의 경험적 결과에 대해 논의합니다. 그는 자신의 공식을 사용한 헤지 손익(P&L)과 이더리움 블록체인의 실제 데이터를 비교하고 두 값이 유사하다는 것을 발견하여 그의 모델이 정확함을 나타냅니다. 그런 다음 2억 달러의 코인이 있는 예시 Uniswap 풀의 일일 변동성과 손익 변동을 살펴봅니다. P&L 변동은 시장 위험으로 인한 것이며 Moallemi는 거래 및 자금 조달 비용으로 인해 반드시 돈을 버는 전략이 아닐 수도 있지만 그의 공식을 사용하여 헤지할 수 있음을 보여줍니다. 그는 이 도구를 사용하여 중개자에게 지불하는 비용을 줄임으로써 자동화된 마켓 메이커를 개선할 수 있다고 제안합니다.

  • 01:05:00 이 섹션에서 Ciamac Moallemi는 유동성 제공 및 자동화된 시장 조성에서 나쁜 가격으로 인한 비효율성을 완화하는 방법에 대해 논의합니다. 그는 오라클을 데이터 소스로 사용하여 Binance와 같은 거래소에서 가격을 가져와 외부 가격을 스마트 계약에 통합하고 장외 거래를 방지할 것을 제안합니다. 또한 Moallemi는 수수료를 지불하지 않고 풀에 대해 거래할 수 있는 승인된 참가자에게 차익 거래 권리를 판매하는 아이디어를 제시하여 더 작은 가격 차이를 활용하고 돈을 벌 수 있는 우선 순위를 부여합니다. 이 참여자들은 나쁜 가격을 완화하고 LP와 노이즈 트레이더 모두 전략의 혜택을 받을 수 있도록 수익의 일부를 LPS에 돌려줄 것입니다. Moallemi는 또한 Binance에서 거래하기 위해 AMM을 구현하고 암호화 시장에서 공매도하는 것에 대한 질문을 다룹니다. 그는 공매도는 자금 조달 비용으로 인해 비용이 많이 들 수 있고 거래량과 변동성은 높은 상관관계가 있기 때문에 거래량이 많지만 변동성이 짧은 전략을 위험하게 만들 수 있다고 지적합니다.

  • 01:10:00 이 섹션에서 Moallemi는 스마트 계약의 견적 요청(RFQ) 프로토콜과 관련된 문제를 설명합니다. 이는 스마트 계약의 원자성을 깨는 다른 사람의 응답을 기다려야 하기 때문입니다. 그러나 적시 유동성이라고 하는 인기 있는 간접 대안을 사용하여 대규모 주문이 처리되기 전에 선행 실행하고 유동성을 제공할 수 있습니다. Moallemi는 또한 전통적인 시장 조성자가 어떻게 위험을 헤지하고 주식을 매도하기 전에 짧은 기간 동안 보유하는 반면 유동성 공급자도 시장 위험을 관리하기 위해 헤지해야 하는지 설명합니다. 유동성 풀 모델은 컴퓨터 속도가 느리고 사용 가능한 코인이 많기 때문에 암호화폐에서 가장 잘 작동합니다.

  • 01:15:00 이 섹션에서 연사는 특히 단순성과 접근성 측면에서 지정가 주문장에 비해 자동 시장 조성자(AMM)의 이점에 대해 논의합니다. 지정가 주문서의 복잡한 특성으로 인해 마켓 메이커와 심지어 트레이더가 알고리즘과 PHD 군대 없이는 사용하기 어려워 알고리즘을 사용하는 기관 투자자를 위한 보다 공정한 경쟁의 장을 만들 수 있다고 설명합니다. 그러나 AMM은 프로세스를 단순화하여 일반 참가자가 광범위한 지식이나 리소스 없이도 혜택을 누릴 수 있습니다. 연사는 덜 숙련된 참여자에게 도움이 되는 더 나은 구조의 가능성을 보고 AMM을 올바른 방향으로 나아가게 합니다.
Ciamac Moallemi (Columbia): "Liquidity Provision and Automated Market Making"
Ciamac Moallemi (Columbia): "Liquidity Provision and Automated Market Making"
  • 2022.09.14
  • www.youtube.com
Abstract: In recent years, automated market makers (AMMs) and, more specifically, constant function market makers (CFMMs) such as Uniswap, have emerged as t...
 

Andreea Minca(Cornell ORIE): 이기종 금융 네트워크 클러스터링



Andreea Minca(Cornell ORIE): 이기종 금융 네트워크 클러스터링

Cornell ORIE의 금융 네트워크 분야에서 저명한 전문가인 Andreea Minca 교수는 이기종 금융 네트워크 클러스터링의 복잡성을 탐구하는 데 연구를 바쳤습니다. 그녀는 이러한 네트워크가 제기하는 고유한 문제, 특히 임의의 연결 패턴을 가진 이상값의 존재를 해결하기 위해 혁신적인 정규화 용어를 도입합니다. 이러한 이상값은 스펙트럼 클러스터링 알고리즘의 성능을 방해하고 클러스터링을 NP 하드 조합 문제로 알려진 계산적으로 어려운 문제로 변환합니다.

연결 패턴을 기반으로 이러한 이상값을 식별하기 위해 Minca는 확률적 블록 모델과 정도 보정된 확률적 블록 모델을 활용합니다. 이러한 모델은 숫자를 아는 것을 제외하고 이상치 노드에 대한 가정 없이 정확한 복구에 대한 이론적 보증을 제공합니다. 금융 네트워크에 내재된 이질성은 노드 차수만을 기반으로 하는 이상치 탐지를 더욱 복잡하게 만듭니다.

Minca는 분할 행렬과 노드 순열을 구성하여 네트워크를 클러스터와 이상값으로 분할하는 과정을 자세히 살펴봅니다. 그녀는 한국 은행 시스템을 분석하기 위해 이를 적용하여 이러한 접근 방식을 예시합니다. 또한 Minca는 Gibbs 샘플러를 사용하여 네트워크의 격차를 메우고 강점과 중복 정도에 따라 중복 포트폴리오를 클러스터링하여 효율적인 위험 할당 및 투자 분산을 가능하게 합니다.

그녀의 작업에서 Minca는 연결성이 없는 클러스터보다 의미 있는 상호 연결성을 나타내는 클러스터를 생성하는 것의 중요성을 강조합니다. 그녀는 금융 네트워크에서 다각화를 달성하기 위해 클러스터링 알고리즘을 사용할 때 신중한 고려의 필요성을 강조하면서 클러스터 위험 패리티 프레임워크에서 다각화를 위한 5가지 대안을 제공하는 접근 방식을 제안합니다. Minca는 표준 투자 범주를 사용하여 클러스터링 알고리즘의 성능을 정량화하도록 조언하고 이러한 기술을 활용할 때 정보에 입각한 의사 결정의 중요성을 강조합니다.

전반적으로 Andreea Minca 교수의 연구는 이기종 금융 네트워크 클러스터링의 복잡성에 대한 귀중한 통찰력을 제공하고 이러한 네트워크와 관련된 문제를 해결하기 위한 혁신적인 접근 방식과 실용적인 솔루션을 제공합니다. 그녀의 작업은 위험 분석, 포트폴리오 선택 및 금융 시스템의 구조적 역학 이해의 발전에 기여합니다.

  • 00:00:00 Andreea Minca 교수가 두 가지 다른 예를 기반으로 금융 네트워크를 클러스터링하는 알고리즘 개발 작업에 대해 설명합니다. 첫 번째 예는 포트폴리오 선택에서 응용 프로그램과 겹치는 포트폴리오의 네트워크에 대한 것이고 두 번째 예는 시스템 위험 분석 및 네트워크의 위험 수준 이해와 관련된 노출 네트워크에 대한 것입니다. 목표는 클러스터링 알고리즘을 금융 네트워크에 일치시키고 한 기관에서 비유동성 또는 채무 불이행에 취약한 의미 있는 클러스터를 만드는 것입니다. 클러스터가 클수록 해당 클러스터의 구성원에 대한 스트레스의 잠재적 영향이 커져 금융 네트워크 구조를 이해하는 것이 중요합니다.

  • 00:05:00 Andreea Minca는 모든 실제 네트워크에서 공통적인 금융 네트워크 클러스터링의 문제에 대해 논의합니다. 클러스터링 문제는 노드가 그룹 내 연결성이 그룹 간 연결보다 큰 그룹을 형성하는 경향이 있기 때문에 존재합니다. 다양한 클러스터링 알고리즘이 있지만 금융 네트워크의 이질성은 정도, 가중치 및 다양한 커뮤니티 간 연결성 측면에서 이질성을 나타내기 때문에 문제를 제기합니다. 또한 이상치의 존재로 인해 기성 알고리즘을 인라인 노드와 동일한 연결 패턴을 가질 수 있지만 자체적으로 하나의 클러스터로 취급할 수 없기 때문에 기성 알고리즘을 적용하기가 어렵습니다. 여러 가지 문제가 금융 네트워크의 클러스터링에 영향을 미치므로 기존 알고리즘을 적용하기 어렵습니다.

  • 00:10:00 Cornell ORIE의 Andreea Minca가 이기종 금융 네트워크를 클러스터링할 때 직면하는 문제와 이를 극복하기 위한 새로운 정규화 용어의 도입에 대해 논의합니다. 주요 문제 중 하나는 임의의 연결 패턴을 갖고 적으로 행동하는 이상치가 존재하여 스펙트럼 클러스터링과 같은 클러스터링 알고리즘의 성능을 방해한다는 것입니다. 클러스터링 문제 자체는 다루기 쉬운 알고리즘이 있는 준정의 프로그램에 대해 완화될 수 있는 NP 하드 조합 문제입니다. 목표는 실제 클러스터의 복구를 위해 특정 조건이 유지되고 도입된 정규화 용어가 비정상적인 연결 패턴으로 이상값에 페널티를 준다는 것을 증명하는 것입니다.

  • 00:15:00 Andreea Minca는 이기종 금융 네트워크에서 클러스터링 패턴을 감지하기 위해 확률적 블록 모델과 정도 보정된 확률적 블록 모델의 적용에 대해 논의합니다. 목표는 연결 패턴을 기반으로 이상값을 감지하는 것입니다. 제공되는 이론적인 보장은 해당 수를 아는 것을 제외하고 이상치 노드에 대한 가정 없이 정확한 복구를 보장합니다. 밀도 갭 조건은 클러스터 간 에지 밀도와 클러스터 내 에지 밀도 간의 차이를 기반으로 합니다. 결과는 이상값의 수와 무관하고 inlier의 수에만 의존하기 때문에 이전 문헌보다 더 강력합니다. 금융 네트워크의 이질성으로 인해 동일한 클러스터의 노드 구조로 인해 노드가 높은 등급을 가질 수 있으므로 등급을 기준으로 이상값을 감지하기 어렵습니다.

  • 00:20:00 Andreea Minca는 금융 네트워크의 이질성 개념과 이것이 클러스터링 알고리즘에 미치는 영향을 설명합니다. 그녀는 한국 은행 시스템의 예를 사용하여 동일한 부문의 은행과 보험 회사가 어떻게 이질성을 나타낼 수 있으며 특이치로 분류되어서는 안 되는지 설명합니다. Minca는 금융 네트워크의 꼬리가 두꺼운 학위 분포는 각 노드의 학위 범위 경계에 대한 연결 패턴 및 기여도를 주의 깊게 살펴봐야 한다고 지적합니다. 그녀는 또한 모든 노드에 대해 균일한 페널티를 사용할 수 없기 때문에 정도를 설명하는 알고리즘에서 페널티 용어의 필요성을 강조합니다. 마지막으로 Minca는 각 클러스터에 대한 이질성 매개변수 및 연결 매트릭스 지정을 포함하는 클러스터링 모델의 기본 사항을 설명합니다.

  • 00:25:00 Andreea Minca가 기성 클러스터링 방법을 사용할 때 이상값이 있을 때 클러스터링의 문제에 대해 설명합니다. 이상값을 감지하는 목표는 클러스터링 자체를 방해하거나 계층 내 메모의 분류를 실수로 방해하지 않고 빨간색 경고를 발생시키는 것입니다. 이질성 매개변수를 통해 연결성을 조정함으로써 첫 번째 이상치의 인접행렬에 해당하는 방식으로 인접행렬을 작성하여 관찰된 그림에서 군집 및 이상치의 기본 구조로 매핑되는 순열행렬을 찾을 수 있습니다. 이러한 조정은 금융 네트워크에서 많은 모델링 선택을 수용하는 데 도움이 됩니다.

  • 00:30:00 비디오의 이 섹션에서 Andreea Minca는 금융 네트워크에서 클러스터 및 이상값의 구조를 식별하기 위해 분할 행렬과 노드의 순열을 찾는 프로세스를 설명합니다. 이 알고리즘은 어떤 노드가 동일한 클러스터에 속하는지 나타내는 분할 행렬 찾기를 기반으로 하며 임의의 항목은 이상값을 나타냅니다. 개념을 설명하기 위해 Minca는 알고리즘의 목표가 네트워크에 있는 각 부문의 올바른 식별을 결정하는 한국 금융 네트워크의 예를 보여줍니다.

  • 00:35:00 Cornell ORIE의 교수인 Andreea Minca가 반합성 네트워크를 만들고 알고리즘을 테스트하는 작업에 대해 설명합니다. 한국은행이 공표한 모든 금융기관의 자산·부채 규모 데이터를 바탕으로 네트워크를 만들고, 보험사에서 은행으로의 집계 흐름을 기반으로 연결한다고 설명한다. 그런 다음 모듈성 최대화 알고리즘을 사용하여 관찰된 연결 패턴을 기반으로 어떤 금융 기관이 어떤 부문에 속하는지 식별합니다. 이 알고리즘은 또한 모듈성 차이를 최소화하기 위해 조정 매개변수와 분할 행렬 제약 조건을 도입합니다.

  • 00:40:00 Andreea Minca는 이기종 금융 네트워크 클러스터링에서 특정 제약 조건으로 인해 다루기 힘든 문제인 파티션 매트릭스 검색의 문제를 설명합니다. 이를 극복하기 위해 행렬의 항목이 0과 1 사이이고 양의 준정부호인 문제의 완화가 도입되었습니다. 문제의 이질성은 페널티 항을 통해 해결되며, 여기서 대각선 항에 대한 페널티는 정도가 정상 변동을 초과하는 잠재적 이상치에 페널티를 줍니다. 두 개의 조정 매개변수는 대각선 페널티의 강도를 제어하고 관찰된 노드의 정도에 따라 결정되어 이상값과 강력한 커뮤니티 구성원을 식별할 수 있습니다. 동영상에 사용된 한국 산업 예시는 한국 네트워크의 노출 스냅샷이며 시계열 구성 요소가 없습니다.

  • 00:45:00 Cornell ORIE의 Andreea Minca가 이기종 금융 네트워크 클러스터링과 Gibbs 샘플러를 사용하여 격차를 메워 집계 값과 일치하는 샘플 네트워크를 재생성하는 방법에 대해 설명합니다. 알고리즘의 성능은 오분류율과 복구 확률을 통해 테스트할 수 있으며 샘플 크기가 커짐에 따라 특정 속도에서 1이 되는 경향이 있습니다. Minca는 한국 섹터를 예로 들어 연결성 매트릭스가 서로 다른 섹터 간의 연결 확률을 어떻게 나타낼 수 있는지, 매트릭스에서 클러스터링 결과를 얻는 방법을 보여줍니다.

  • 00:50:00 Andreea Minca는 연결 패턴을 기반으로 네트워크의 각 기관에 대한 올바른 금융 부문을 식별하는 문제에 대해 논의합니다. 그녀는 알고리즘이 연결성의 이질성에 대해 견고해야 하며 오분류 비율이 성능 기준으로 사용된다고 설명합니다. Minca는 자신이 제시한 알고리즘과 기존의 다른 알고리즘의 오분류율을 비교하여 스펙트럼 클러스터링 기반 알고리즘이 가장 성능이 좋지 않음을 강조합니다. 이는 금융 네트워크에서 발생하는 문제를 설명하기 위해 기존 알고리즘을 조정할 필요성을 강조합니다. 또한 Minca는 투자 포트폴리오 관리에 알고리즘을 적용하는 방법에 대해 간략하게 설명합니다. 겹치는 포트폴리오의 네트워크를 다시 생성함으로써 기관의 상호 작용 강도는 포트폴리오 보유를 기반으로 측정할 수 있으며 잠재적으로 투자 의사 결정에 도움이 될 수 있습니다.

  • 00:55:00 Andreea Minca가 클러스터링 알고리즘과 이 알고리즘을 중복되는 재무 포트폴리오에 적용하여 위험을 효율적으로 할당하고 투자를 다각화하는 방법에 대해 설명합니다. 강점과 중첩 수준을 기반으로 포트폴리오를 클러스터링함으로써 알고리즘은 10년 동안 더 커진 5개의 클러스터를 복구할 수 있어 중첩이 증가했음을 나타냅니다. 이는 기존의 다른 클러스터링 방법보다 더 효과적인 클러스터 생성 도구를 제공합니다. 또한 Minca는 추가 알고리즘이 한국 사례의 공백을 메우고 정부의 집계 데이터와 일치하는 개별 네트워크를 생성하는 방법에 대해 설명합니다.

  • 01:00:00 Andreea Minca가 금융 네트워크용 클러스터링 알고리즘을 통해 다각화를 달성하는 문제에 대해 논의합니다. 그녀는 클러스터 간 연결성이 매우 높은 하나의 클러스터와 연결성이 없는 다른 클러스터가 있으면 다각화를 달성할 수 없음을 보여줍니다. 대신, 그녀는 클러스터 위험 패리티 접근 방식에서 다각화를 위한 다섯 가지 대안을 식별하는 접근 방식을 제시합니다. 그녀는 또한 작업의 사전 인쇄, 도구의 가용성 및 클러스터 수에 대한 알고리즘의 민감도에 대한 질문에 답하는 동시에 클러스터링 알고리즘의 성능을 정량화하기 위해 표준 투자 범주의 사용을 제안합니다.

  • 01:05:00 Andreea Minca가 5가지 투자 전략에서 5개의 클러스터를 복구하는 예를 사용하여 클러스터링 알고리즘 및 클러스터 복구 주제에 대해 논의합니다. 그녀는 또한 좋은 도메인 지식이나 클러스터 수에 대한 가정 없이 다른 선택의 클러스터링 결과를 비교하기 어려울 수 있다고 지적합니다. 그러나 클러스터링 알고리즘을 사용할 때 정보에 입각한 결정을 내리는 것이 중요하다는 점을 강조하는 이 문제에 대한 이론적인 결과는 없습니다.
Andreea Minca (Cornell ORIE): Clustering Heterogeneous Financial Networks
Andreea Minca (Cornell ORIE): Clustering Heterogeneous Financial Networks
  • 2022.04.27
  • www.youtube.com
Abstract: For the degree corrected stochastic block model in the presence of arbitrary or even adversarial outliers, we develop a convex-optimization-based c...