양적 거래 (Quantitative trading) - 페이지 32

 

Two Sigma, 양적 금융 시퀀스에 대한 딥 러닝 제공 David Kriegman


Two Sigma, 양적 금융 시퀀스에 대한 딥 러닝 제공 David Kriegman

프레젠테이션 중 발표자는 이벤트를 소개하고 과학적 방법을 금융 분야에 적용하는 유명한 금융 과학 회사인 Two Sigma에 대한 배경 정보를 제공합니다. 그들은 Two Sigma가 양적 헤지 펀드, 브로커-딜러 서비스, 개인 투자, 보험 및 투자자 솔루션을 포함하여 금융 부문 내의 여러 비즈니스에서 운영된다는 점을 강조합니다. 연사는 청중의 다양한 배경을 강조하면서 강의가 모든 수준의 전문 지식을 갖춘 개인을 대상으로 하며 딥 러닝이 양적 금융에 어떻게 효과적으로 적용될 수 있는지 보여줄 것임을 나타냅니다. 특히 그들은 Two Sigma가 전 세계적으로 약 1600명의 전문가를 고용하고 있으며 그 중 600명은 고급 학위를, 200명은 박사 학위를 가지고 있다고 언급합니다.

계속해서 연사는 시퀀스에 대한 딥 러닝의 개념을 소개하고 지난 10년 동안 다양한 애플리케이션에 미치는 영향을 설명합니다. 감정 분류, 비디오 활동 인식 및 기계 번역과 같은 예를 제공합니다. 발표자는 시퀀스 처리 작업에는 시퀀스를 입력으로 취하고 시퀀스를 출력으로 생성하는 작업이 포함되며 길이가 다를 수 있다고 설명합니다. 특히 과거 시퀀스를 사용하여 주식 시장 가치를 예측하는 데 딥 러닝을 적용하는 방법에 대해 논의합니다. 화자는 수익성을 극대화하기 위해 고점과 저점을 모두 예측하는 것이 중요하다고 강조합니다.

다음으로 연사는 투자 결정을 내리는 데 관련된 일련의 프로세스를 포함하는 금융의 전형적인 정량적 투자 파이프라인에 대해 자세히 설명합니다. 파이프라인의 두 가지 주요 단계인 알파 모델링과 기능 추출에 대해 설명합니다. 알파 모델링은 평균회귀모형이나 모멘텀모형을 이용하여 주가의 방향을 예측하는 것입니다. 기능 추출은 가격, 거래량, 입찰-매도 스프레드와 같은 시장에서 기술적인 기능을 추출하는 데 중점을 둡니다. 연사는 이러한 과정이 궁극적으로 수익 창출과 손실 최소화라는 궁극적인 목표를 가지고 시장에서 구매 또는 판매에 관한 결정으로 이어진다고 강조합니다. 그들은 감정적인 의사 결정을 피하는 것의 중요성을 강조하고 금융 영역에서 포트폴리오 다각화의 중요성을 강조합니다.

이어서 Two Sigma의 David Kriegman이 무대에 올라 주식 거래에서 현명한 결정을 내리는 데 중요한 역할을 하는 요소에 대해 논의합니다. 첫 번째로 강조되는 요소는 기업의 직접적인 보고를 통해 얻거나 공개된 정보에서 추론할 수 있는 기본 데이터 수집입니다. 또한 뉴스, 소셜 미디어, 애널리스트 댓글 등의 소스에서 파생된 비정형 데이터를 해석하여 감정 분석을 수행할 수 있습니다. 연사는 특정 주식의 실적을 나타낼 수 있는 정보를 수집하기 위해 주차장의 차량 수나 항구의 컨테이너선 혼잡도와 같은 비전통적 소스를 활용하는 아이디어를 소개합니다. 알파 모델을 사용하여 주식 성과를 예측한 후 파이프라인의 다음 단계는 포트폴리오 최적화입니다. 이 단계에서는 종종 대규모 최적화 문제를 해결하고 현재 주식 보유량, 예측에 대한 신뢰도, 다양화 요구 사항 및 관련 거래 비용과 같은 요소를 고려합니다. 마지막으로, 실행 단계에는 이러한 조치의 잠재적 영향을 이해하기 위한 모델의 도움으로 주문 크기, 배치 및 유형에 대한 결정을 내리는 것이 포함됩니다.

딥 러닝이라는 주제로 돌아가서 연사는 양적 금융 의사 결정 파이프라인의 순차적 특성을 강조합니다. 그런 다음 초점을 딥 러닝으로 옮겨 여러 계층으로 특징지어지는 일종의 신경망이라고 설명합니다. 발표자는 1950년대 처음 도입된 이후 새로운 네트워크 아키텍처의 출현, 대규모 훈련 데이터 세트의 가용성 및 병렬 계산의 발전을 포함하여 신경망의 중요한 발전에 대해 논의합니다. 단일 퍼셉트론의 기본 아이디어를 설명하기 위해 스피커는 입력을 받고 가중치 합을 계산하고 그 결과를 비선형 함수에 전달하는 방법을 설명합니다. 그들은 기존의 활성화 함수인 임계값이 임계값 미만의 값에 대해 0을 출력하고 더 높은 값에 대한 실제 값을 출력하는 ReLU(rectified linear unit)라는 대안으로 대체되었다고 언급합니다.

신경망에 대한 주제로 계속해서 발표자는 다층 퍼셉트론의 개념을 소개합니다. 이 아키텍처에서 각 원은 고유한 활성화 함수와 가중치 집합이 있는 퍼셉트론을 나타냅니다. 이것은 한 쌍의 가중치 행렬로 나타낼 수 있으므로 더 큰 네트워크를 만들 수 있습니다. 연사는 계속해서 알파 모델링, 특히 과거 성과를 기반으로 주가를 예측하는 데 신경망을 적용하는 방법에 대해 논의합니다. 네트워크는 총 손실을 최소화하는 최적화 목표와 함께 기능과 가격 데이터를 모두 포함하는 훈련 데이터 세트를 사용하여 훈련됩니다. 이 교육 프로세스에는 역전파 및 확률적 경사 하강과 같은 다양한 기술이 포함됩니다.

알파 모델을 더욱 강화하기 위해 스피커는 가격이나 과거 기록과 같은 단일 신호에 의존하기보다는 여러 기능을 통합하는 것이 중요하다고 설명합니다. 모든 관련 기능을 결합하여 보다 강력하고 정확한 모델을 만들 수 있습니다. 그러나 이 접근 방식으로 완전히 연결된 네트워크를 사용하면 가중치의 수가 극도로 커지고 모든 가중치를 효과적으로 훈련할 수 없기 때문에 차원의 저주라는 문제가 발생할 수 있습니다. 이 문제를 극복하기 위해 발표자는 순환 신경망(RNN)이라는 또 다른 종류의 시퀀스 처리 네트워크를 소개합니다. 이러한 네트워크는 메모리 측면을 도입하고 정보를 거꾸로 공급하여 매 순간마다 상태를 구축합니다. 결과적으로 가중치가 과도하게 많은 문제가 완화됩니다. RNN에서 가중치는 각 요소 간에 공유되어 네트워크를 깊게 만들고 다루기 쉬운 솔루션을 제공합니다.

연사는 딥 네트워크 훈련의 어려움과 GRU(Gated Recurrent Unit) 및 LSTM(Long Short-Term Memory) 네트워크와 같은 게이트 네트워크가 이러한 문제를 해결하는 방법을 강조합니다. 게이티드 네트워크는 정보의 흐름을 제어하고 잠재적인 새 상태로 이전 상태를 업데이트할 수 있는 아날로그 게이트를 통합합니다. 이러한 네트워크의 구성요소는 미분 가능하므로 역전파를 사용하여 훈련할 수 있습니다. LSTM에 비해 GRU는 메모리 용량이 더 깁니다.

시퀀스에 대한 딥 러닝에 사용되는 다양한 아키텍처에 대해 논의하면서 연사는 LSTM 및 GRU 네트워크뿐만 아니라 CNN(컨볼루션 신경망), 어텐션 메커니즘 및 변환기와 같은 최신 개발을 소개합니다. 또한 거래 및 시장 상호 작용과 관련된 것과 같은 순차적 의사 결정 프로세스를 최적화하는 강화 학습에 대해서도 다룹니다. 강화 학습이 게임에서 성공을 거두는 동안 이를 금융에 적용하려면 적절한 시뮬레이터, 강력한 소프트웨어 인프라 및 상당한 계산 리소스가 필요합니다. 전반적으로 발표자는 논의된 다양한 아키텍처와 모델이 각각 고유한 장점과 과제가 있는 양적 금융을 위한 강력한 도구를 나타낸다고 강조합니다.

David Kriegman의 기여로 돌아가서 그는 양적 금융에 사용되는 파이프라인과 심층 신경망이 다른 부분을 구현하기 위해 어떻게 훈련될 수 있는지 조명합니다. 그는 수천 개의 주식을 거래하고 매일 수억 건의 결정을 내리는 Two Sigma의 광범위한 운영을 강조합니다. 이러한 방대한 양의 데이터를 처리하려면 상당한 컴퓨팅 성능, 강력한 소프트웨어 인프라 및 창의적인 개인 팀이 필요합니다. Kriegman은 심층 신경망과 관련된 설명 가능성 및 해석 가능성의 부족과 전략 개발에 미치는 영향에 대한 우려를 다루면서 특정 아키텍처가 해석 가능한 표현을 도입할 수 있다고 설명합니다. 그는 또한 급변하는 거래 시나리오에서는 다양한 분포가 필요하다고 강조합니다. 또한 Two Sigma는 극단적인 시장 이벤트 동안 시스템을 모니터링하고 구현하는 인간 트레이더를 통합합니다.

발표자는 딥 러닝 접근 방식이 양적 금융에서 효율적인 시장이라는 가설과 어떻게 상호 작용할 수 있는지에 대해 논의합니다. 시장은 일반적으로 효율적인 것으로 간주되지만 딥 러닝은 정보에 대한 신속한 대응을 촉진하고 데이터를 동화하는 대체 방법을 제공하여 잠재적으로 비효율성과 투자 기회를 식별할 수 있습니다. 또한 특히 구조화되지 않은 데이터에서 기능을 추출하는 초기 단계에서 재무 내 순차적 모델링에서 컴퓨터 비전 기술의 관련성을 강조합니다. Two Sigma는 엔지니어링 및 모델링 역할을 수행할 개인을 적극적으로 찾고 있으며, 다른 역할은 다른 팀과 일치하지만 딥 러닝의 적용은 전체 조직에 퍼져 있습니다. 최근 대학 졸업생 및 MSc 수준 지원자는 Two Sigma 웹사이트를 통해 지원할 것을 권장합니다.

Q&A 세션에서 연사는 퀀트 금융에 딥 러닝을 적용하는 것과 관련된 몇 가지 문제에 대해 설명합니다. 한 가지 주요 과제는 미래가 과거와 유사할 때 딥 러닝 모델이 가장 잘 수행되기 때문에 재무 시계열의 고정성이 부족하다는 것입니다. 이 문제를 해결하기 위해 연사는 도메인 이전 방법을 도입하여 모델이 변화하는 시장 조건에 적응할 수 있도록 시뮬레이션 및 예측의 중요성을 강조합니다. 또한 연사는 양적 금융의 오류율이 일반적으로 다른 분야에 비해 높으며 50%보다 약간 높더라도 거래에서 상당한 이점을 제공할 수 있다고 말합니다.

양적 금융에 대한 유망한 영향에 대해 질문을 받았을 때 연사는 딥 러닝 및 신경망의 거의 모든 연구 영역이 유망한 영향을 미친다고 언급했습니다. 특히 강화 학습과 영역 이전을 관심 영역으로 강조합니다. 또한 그들은 금융의 데이터 저장 문제를 인정하고 데이터 압축 기술이 이러한 문제를 해결하는 데 도움이 될 수 있다고 제안합니다.

연사는 양적 금융에서 딥 러닝 모델 구현을 담당하는 엔지니어링 팀의 주제를 확장하여 팀이 스토리지 관리, 물리적 시스템 및 이러한 시스템 위에 구축된 계층을 비롯한 다양한 작업을 수행한다고 설명합니다. 그들은 딥 러닝 모델과 통계 모델링 모두 특정 사용 사례에 따라 역할이 있음을 강조합니다. 그러나 그들은 심층 모델이 퇴화된 형태의 선형 회귀로 축소되면 본질적인 관심과 힘을 잃게 된다는 점에 주목합니다.

이 프레젠테이션은 특히 시퀀스 처리 및 의사 결정 파이프라인의 맥락에서 양적 금융 분야의 딥 러닝 적용을 강조합니다. 해석 가능성, 비정상성 해결, 다양한 아키텍처 활용 등 이 영역에서 심층 신경망을 활용할 때 발생하는 문제와 기회를 강조합니다. 프레젠테이션 전반에 걸쳐 Two Sigma는 운영에 딥 러닝 기술을 적극적으로 통합하고 팀에 합류할 유능한 인재를 적극적으로 찾고 있는 저명한 회사로 소개되었습니다.

  • 00:00:00 연사는 이벤트를 소개하고 금융에 과학적 방법을 적용하는 금융 과학 회사인 Two Sigma에 대한 배경 정보를 제공합니다. 퀀트 헤지 펀드, 브로커-딜러, 개인 투자, 보험, 투자자 솔루션 등 금융 부문에서 다양한 사업을 운영하고 있다고 설명합니다. 그들은 또한 청중의 다양한 배경에 대해 이야기하고 그들의 강의가 양적 금융에서 딥 러닝이 어떻게 적용될 수 있는지에 대한 모든 수준의 아이디어를 제공할 것이라고 강조합니다. 마지막으로 그들은 1600명의 사람들이 전 세계적으로 Two Sigma에서 일하고 있으며 600명은 고급 학위를, 200명은 박사 학위를 가지고 있다고 언급합니다.

  • 00:05:00 연사는 시퀀스에 대한 딥 러닝의 개념과 그것이 감정 분류, 비디오 활동 인식 및 기계 번역과 같은 지난 10년 동안 다양한 애플리케이션에 어떤 영향을 미쳤는지 소개합니다. 그는 시퀀스 처리 작업이 시퀀스를 입력으로 받아 길이가 같거나 다를 수 있는 출력으로 시퀀스를 생성한다고 설명합니다. 연사는 또한 과거 시퀀스를 사용하여 주식 시장 가치를 예측하는 것에 대해 이야기하고 더 많은 돈을 벌기 위해 고점과 저점을 모두 예측하는 것의 중요성을 강조합니다.

  • 00:10:00 연사는 투자 결정을 내리는 일련의 프로세스를 포함하는 금융 분야의 전형적인 양적 투자 파이프라인을 설명합니다. 여기에는 평균회귀모형이나 모멘텀모형을 통해 주가의 방향성을 예측하는 알파모형과 가격, 거래량, 호가 스프레드 등의 기술적 특징을 포함하는 특징추출이 포함된다. 파이프라인은 궁극적으로 돈을 잃지 않고 이익을 내는 것을 목표로 시장에서 구매 또는 판매에 대한 결정으로 이어집니다. 연사는 감정적인 의사 결정을 피하고 금융 분야에서 포트폴리오를 다양화하는 것의 중요성을 강조합니다.

  • 00:15:00 Two Sigma의 David Kriegman이 주식 거래에서 의사 결정을 내릴 때 고려해야 할 다양한 요소를 제시합니다. 첫 번째는 회사가 직접 보고하거나 공개된 정보를 기반으로 유추할 수 있는 기초 데이터를 수집하는 것입니다. 또한 뉴스, 소셜 미디어 및 분석가 의견과 같은 소스의 구조화되지 않은 데이터를 해석하여 감정 분석을 수행할 수 있습니다. 주차장에 있는 차량 수나 항구에 정박된 컨테이너선과 같은 비전통적인 출처도 특정 주식의 실적에 대한 정보를 제공할 수 있습니다. 알파 모델을 사용하여 주식 성과를 예측한 후 다음 단계는 포트폴리오를 최적화하는 것입니다. 이것은 종종 대규모 최적화 문제를 통해 처리되며 이미 보유하고 있는 주식의 양, 예측에 대한 확신, 분산 투자 방법 및 거래와 관련된 비용을 결정해야 합니다. 마지막으로 실행은 주문 크기, 배치 및 유형에 대한 결정이 내려지는 마지막 단계이며 취해진 조치의 영향을 이해하기 위해 모델이 사용됩니다.

  • 00:20:00 연사는 기능 추출, 알파 모델링 및 실행을 포함하여 양적 금융에서 구매 및 판매 결정을 내리는 파이프라인을 소개하고 프로세스의 순차적 특성을 강조합니다. 그런 다음 초점은 많은 수의 계층을 특징으로 하는 신경망 유형인 딥 러닝으로 이동합니다. 발표자는 1950년대 신경망이 처음 도입된 이후 발생한 새로운 네트워크 아키텍처, 방대한 양의 훈련 데이터, 대규모 병렬 연산 등 주요 변화에 대해 설명합니다. 그런 다음 화자는 비선형 함수를 통해 결과를 전달하기 전에 입력을 받아 가중 합계를 계산하는 단일 퍼셉트론의 기본 아이디어를 설명합니다. 전통적인 활성화 함수는 임계값이었지만 ReLU(Rectified Linear Unit)라는 대체 함수로 대체되었습니다. 이 함수는 임계값보다 작은 값에 대해서는 0을 출력하고 그렇지 않으면 실제 값을 출력합니다.

  • 00:25:00 발표자는 다층 퍼셉트론의 개념을 소개합니다. 여기에서 각 원은 고유한 활성화 기능과 가중치 세트가 있는 퍼셉트론을 나타냅니다. 이것은 한 쌍의 가중치 행렬로 나타낼 수 있으므로 더 큰 네트워크를 만들 수 있습니다. 다음으로 연사는 과거 성과를 기반으로 주식 가격을 예측하기 위해 알파 모델링에 신경망을 사용하는 방법에 대해 논의합니다. 네트워크는 총 손실을 최소화하는 최적화 목표와 함께 기능 및 가격 데이터를 포함하는 훈련 데이터 세트를 사용하여 훈련됩니다. 이는 역전파 및 확률적 경사 하강과 같은 일련의 훈련 기술을 통해 달성됩니다.

  • 00:30:00 발표자는 가격이나 과거 기록과 같은 하나의 신호 대신 여러 기능을 사용하여 알파 모델을 구축하는 방법에 대해 논의합니다. 모든 관련 기능을 취합하여 결합하면 보다 강력한 모델을 만들 수 있습니다. 그러나 이 접근 방식으로 완전히 연결된 네트워크를 사용하면 가중치 수가 매우 많을 수 있고 모든 가중치를 훈련할 수 없기 때문에 문제가 발생합니다. 이 문제를 해결하기 위해 화자는 순환 신경망으로 알려진 또 다른 종류의 시퀀스 처리 네트워크를 소개합니다. 이러한 네트워크는 메모리 측면을 도입하고 정보를 거꾸로 공급하여 매 순간 상태를 구축하고 결과적으로 너무 많은 가중치를 갖는 문제를 완화합니다. 이러한 네트워크의 가중치는 각 요소 간에 공유되어 이 네트워크를 깊게 만들고 다루기 쉬운 솔루션을 제공합니다.

  • 00:35:00 연사는 딥 네트워크 교육의 어려움과 GRU 및 LSTM과 같은 게이트 네트워크가 정보를 과거로 전파하여 이러한 문제를 해결할 수 있는 방법에 대해 논의합니다. 게이티드 네트워크는 아날로그 게이트를 사용하여 정보 흐름의 양을 제어하고 이전 상태를 잠재적인 새 상태로 업데이트합니다. 게이트 네트워크의 구성요소는 미분 가능하므로 역전파를 통해 훈련할 수 있습니다. GRU는 Long Short-Term Memory를 나타내는 LSTM에 비해 메모리가 더 깁니다.

  • 00:40:00 발표자는 LSTM 및 GRU 네트워크를 포함하여 시퀀스에 대한 딥 러닝에 사용되는 다양한 아키텍처와 컨벌루션 신경망, 어텐션 메커니즘 및 변환기와 같은 최신 개발에 대해 논의합니다. 또한 거래 및 시장과의 상호 작용과 같은 순차적 의사 결정 프로세스를 최적화하는 강화 학습을 도입합니다. 강화 학습은 게임에서 성공적이었지만 재무에 적용하려면 우수한 시뮬레이터, 소프트웨어 인프라 및 많은 계산이 필요합니다. 전반적으로 논의된 다양한 아키텍처와 모델은 각각 고유한 장점과 과제가 있는 양적 금융을 위한 강력한 도구를 나타냅니다.

  • 00:45:00 David Kriegman이 양적 금융에 사용되는 파이프라인과 그 일부를 구현하기 위해 심층 신경망을 훈련할 수 있는 방법에 대해 설명합니다. 그는 Two Sigma가 대규모로 운영되어 수천 개의 주식을 거래하고 하루에 수억 건의 결정을 내린다고 언급합니다. 이러한 양의 데이터를 처리하려면 많은 계산, 우수한 소프트웨어 인프라 및 창의적인 사람이 필요합니다. 깊은 네트워크와 관련된 설명 가능성 및 해석 가능성의 부족과 전략 개발에 미치는 영향에 대해 Kriegman은 일부 아키텍처가 해석 가능한 표현을 도입할 수 있으며 빠르게 발생하고 다른 배포가 필요한 일부 거래 결정이 있다고 설명합니다. 또한 Two Sigma에는 극단적인 시장 이벤트에서 시스템을 모니터링하고 구현하는 인간 트레이더가 있습니다.

  • 00:50:00 발표자는 딥 러닝 접근 방식이 양적 금융에서 효율적인 시장이라는 가설과 어떻게 상호 작용할 수 있는지에 대해 논의했습니다. 시장은 일반적으로 효율적이지만 딥 러닝은 정보에 보다 신속하게 대응하고 다른 방식으로 정보를 동화하여 잠재적으로 비효율성과 투자 기회를 식별하는 데 도움이 될 수 있습니다. 특히 구조화되지 않은 정보에서 기능을 추출하는 초기 단계에서 재무의 순차적 모델링과 관련될 수 있는 컴퓨터 비전의 측면도 있습니다. Two Sigma는 엔지니어링 및 모델링 역할 모두에 대해 적극적으로 채용하고 있으며, 다른 역할이 다른 팀에 매핑되는 동안 조직 전체에 딥 러닝이 명확하게 적용됩니다. 최근 대학 졸업자 및 MSc 수준 지원자는 Two Sigma 웹사이트를 통해 지원할 것을 권장합니다.

  • 00:55:00 연사는 양적 금융에 딥 러닝을 적용할 때의 어려움에 대해 질문합니다. 특히 재무 시계열의 정상성 부족은 미래가 과거와 많이 비슷할 때 가장 잘 작동하는 딥 러닝에 문제를 제기합니다. 이를 해결하기 위해서는 도메인 이전 방법을 시뮬레이션하고 예측하고 도입할 수 있는 정도가 중요합니다. 또한 화자는 이 분야의 오류율이 대부분보다 높으며 50% 이상이면 거래에서 우위를 점할 수 있다고 말합니다. 양적 금융에 대한 유망한 영향에 대해 질문을 받았을 때 연사는 딥 러닝 및 신경망의 거의 모든 연구 영역, 특히 강화 학습 및 도메인 이전이 유망한 영향을 미친다고 언급했습니다. 마지막으로 해결해야 할 데이터 저장 문제가 있으며 데이터 압축 기술이 이 프로세스에 도움이 됩니다.

  • 01:00:00 연사는 양적 금융을 위한 딥 러닝 모델 실행을 담당하는 엔지니어링 팀의 다양한 특성을 설명합니다. 이 팀은 스토리지, 물리적 시스템 및 이러한 물리적 시스템 위에 있는 계층을 비롯한 다양한 작업을 수행합니다. 또한 딥 러닝 모델과 통계 모델링의 경우 둘 다 용도에 따라 역할이 있으며 딥 모델이 퇴화된 형태의 선형 회귀로 바뀌면 더 이상 흥미롭지 않습니다.
 

Two Sigma Presents: 금융 데이터의 기계 학습 모델


Two Sigma Presents: 금융 데이터의 기계 학습 모델

Two Sigma Securities의 Justin Ceriano가 금융 분야의 기계 학습 모델 통합에 대한 포괄적인 프레젠테이션을 제공합니다. 그는 기계 학습을 활용하여 예측 기능과 의사 결정 프로세스를 향상시키는 금융 회사의 관심이 증가하고 있음을 강조하면서 시작합니다. 특히 기계 학습 알고리즘을 활용하여 금융 상품의 미래 가격을 예측하고 최적의 거래 전략을 결정할 수 있습니다.

Ceriano는 적절한 목적 함수를 최대화하기 위해 사용 가능한 데이터에서 직접 결정 정책을 학습할 수 있는 방법 클래스에 속하는 강화 학습의 개념을 도입했습니다. 강화 학습은 과거 데이터를 기반으로 결과를 최적화하는 것이 목표인 재무 분야에서 특히 유용합니다.

논의된 근본적인 측면 중 하나는 기계 학습 모델을 적용하여 전자 시장에서 지정가 주문서를 분석하는 것입니다. 이 시스템에서 구매자와 판매자는 특정 자산을 사거나 팔려는 가격을 지정하는 주문을 제출합니다. 그런 다음 이러한 주문은 사용 가능한 최상의 요청 또는 입찰 가격을 기준으로 일치됩니다. Ceriano는 주식에 대한 가시적인 공급과 수요를 나타내는 오더북 데이터가 기계 학습 모델을 사용하여 미래 가격 변화를 예측하는 데 효과적으로 활용할 수 있는 고차원 시퀀스를 형성한다고 강조합니다.

또한 Ceriano는 거래 전략에서 0이 아닌 스프레드를 고려하는 것의 중요성을 강조합니다. 이러한 스프레드는 가격 예측의 수익성에 영향을 미칠 수 있으므로 신중한 평가와 조정이 필요합니다.

기계 학습 모델의 실제 구현을 시연하기 위해 Ceriano는 빈도가 높은 금융 데이터를 사용하여 가격 변동을 예측하도록 설계된 순환 신경망의 구성을 설명합니다. 이 모델은 다음 가격 변화가 양수인지 음수인지 예측하도록 훈련되며 성능은 선형 반복 모델과 비교됩니다. 사용된 데이터 세트는 약 1,000개 주식에 대한 3년 간의 이벤트별 고주파 데이터로 구성됩니다. 목표는 순환 네트워크와 같은 비선형 기계 학습 모델이 데이터 내에서 비선형 관계를 캡처하는 데 있어 선형 통계 모델을 능가하는지 여부를 평가하는 것입니다. 모델 예측의 최적화는 예측 오류를 최소화하는 역전파 알고리즘을 통해 이루어집니다. 계산 비용을 줄이기 위해 시간 알고리즘을 통한 절단된 역전파가 활용됩니다.

반복 네트워크 최적화와 관련된 문제, 특히 잘 알려진 기울기 소실 문제가 프레젠테이션에서 해결됩니다. 그래디언트 소실 문제는 그래디언트가 네트워크의 하위 계층을 통해 전파됨에 따라 그래디언트가 극도로 작아지는 문제를 말합니다. 결과적으로 이것은 훈련 속도를 방해하고 네트워크가 시퀀스의 먼 부분에서 정보를 유지하기 어렵게 만들 수 있습니다. Ceriano는 가장 널리 사용되는 유형의 순환 네트워크 중 하나인 LSTM(Long Short-Term Memory) 네트워크를 소개합니다. 이 네트워크는 메모리 상태를 효율적으로 업데이트하여 이 문제를 해결하도록 특별히 설계되어 모델이 멀리서도 관련 정보를 유지할 수 있도록 합니다. 과거.

프레젠테이션은 빈도가 높은 주문서 데이터를 사용하여 기계 학습 모델의 교육 및 평가에 대해 논의합니다. 저자는 선형 모델의 정확도를 LSTM 순환 네트워크의 정확도와 비교하고 결과는 3개월의 표본 외 기간 동안 약 500개 주식에 대해 테스트했을 때 딥 러닝 모델의 우수한 성능을 명확하게 나타냅니다. 이 논의는 또한 오더북 데이터와 가격 움직임 간의 관계의 보편적인 특성을 탐구하여 여러 주식에 적용할 수 있는 보편적인 가격 형성 모델의 존재를 제안합니다. 이 발견은 계산 비용 절감 및 다른 주식의 데이터를 사용하여 한 주식에 대한 모델을 개선하는 능력과 같은 중요한 실질적인 의미를 담고 있습니다.

이 실험은 수많은 주식의 데이터를 풀링하고 주식별 모델과 비교하여 정확도를 평가하여 범용 모델을 교육하는 것을 목표로 합니다. 결과는 범용 모델의 우월성을 일관되게 보여 주며, 서로 다른 주식에 걸친 주문서 역학에서 공통된 보편성을 나타냅니다. 이는 과적합을 줄일 뿐만 아니라 모델의 정확도를 향상시킵니다. 또한 범용 모델은 비동기식 확률적 경사 하강과 함께 25개의 GPU를 활용하여 고성능 컴퓨팅의 도움으로 1년 이상의 안정성과 확장성을 보여줍니다.

프레젠테이션은 또한 최적의 실행을 위해 주문 제출 전략을 최적화하기 위한 강화 학습의 적용을 탐구합니다. 이산 시간 간격 내에서 예상되는 보상과 비용 절감을 극대화하는 것을 목표로 시장 주문 또는 한 주에 대한 제한 주문에 대한 정책을 개발하는 데 중점을 둡니다. 과거 오더북 데이터를 활용하여 소액 주문에 대한 실행 가격을 시뮬레이션하도록 강화 학습 모델을 훈련합니다. 이 모델은 지정가 주문서 데이터를 입력으로 사용하여 즉시 시장가 주문을 제출할지 또는 최적의 매도 가격이 하락할 때까지 기다릴지 여부를 결정합니다. 모델의 성능은 1년 데이터를 사용하여 평가한 다음 별도의 6개월 데이터 세트에서 테스트합니다.

시장 주문 전용 강화 학습 전략과 단순 제한 주문 전략 모두에 대해 10초와 60초의 시간 지평을 고려하여 100개 주식 유니버스에 대한 시뮬레이션 결과가 제시됩니다. 결과는 약간의 가변성이 있지만 50개 주식에 걸쳐 강화 학습 모델이 달성한 긍정적인 비용 절감을 일관되게 나타냅니다. 또한 비용 절감은 시간 범위가 길어질수록 증가하는 경향이 있습니다. 이 프레젠테이션에서는 제출된 지정가 주문이 특정 시간 간격 내에서 실행되는지 여부를 시뮬레이션하기 위해 과거 오더북 데이터를 사용하는 개념을 소개합니다. 강화 학습 모델은 예상 비용 절감을 극대화하기 위해 최적의 시간을 동적으로 선택하도록 훈련됩니다. 비용 절감은 주식마다 다르지만 강화 학습 전략은 지속적으로 긍정적인 결과를 가져오며 일부 주식은 다른 주식보다 훨씬 더 높은 비용 절감 효과를 나타냅니다.

프레젠테이션은 특히 금융 데이터에 맞게 조정된 고급 최적화 방법과 딥 러닝 아키텍처를 개발해야 할 필요성을 설명하면서 마무리됩니다. 금융 분야에서 기계 학습의 적용을 더욱 강화하기 위해 더 큰 주문 크기에 대한 정확한 시뮬레이션과 강화 학습을 병합하는 데 있어 지속적인 과제를 강조합니다. 논의된 개념을 효과적으로 파악하기 위해 Ceriano는 대규모 데이터 세트에서 기계 학습 기술을 구현하여 실습 경험을 쌓을 것을 권장합니다. 그는 근본적인 수학적 이론을 이해하고 TensorFlow 및 PyTorch와 같은 딥 러닝 라이브러리에 대한 숙련도를 갖는 것의 중요성을 강조합니다. 또한 모델 훈련 병렬화를 위한 고성능 컴퓨팅 기술이 강조됩니다.

또한 발표자들은 Two Sigma의 고용 정책과 원격 근무 기회에 대해 논의합니다. 풀타임 원격 근무 정책이 시행되지는 않았지만 Two Sigma는 전 세계 여러 국가에서 개인을 고용하고 원격 근무를 위해 Alpha Studio라는 온라인 팀을 운영합니다. 금융에서 기계 학습을 추구하는 데 관심이 있는 사람들을 위해 여러 과정을 통해 양적 금융, 확률 및 통계에 대한 지식 습득의 중요성을 강조합니다. 프레젠테이션에서는 Two Sigma의 코드베이스에서 TensorFlow 및 PyTorch와 같은 딥 러닝 라이브러리의 활용에 대해서도 언급합니다.

Two Sigma의 채용 프로세스에 대해 논의하며 특히 여름에 채용이 이루어짐을 강조합니다. 가을과 봄 채용에는 예외가 있으며 회사는 관심 있는 개인이 12월에 시작하더라도 가능한 한 일찍 시작할 것을 권장합니다. 발표자들은 인상적인 프로젝트에 실제 데이터의 패턴과 추세를 식별하고 기계 학습 접근 방식을 적용하여 실제 문제를 해결하는 작업이 포함된다고 제안합니다. 프로젝트에 대한 소유권과 프로젝트 내에서 자신의 기여를 강조하는 것은 채용 담당자가 추구하는 귀중한 자질로 강조됩니다. 엔지니어, 데이터 사이언티스트와 긴밀히 협업하는 투시그마의 펀더멘털 에퀴티 연구팀도 간략히 언급한다.

Two Sigma에서 데이터 과학자와 퀀트 연구원의 차이점이 설명됩니다. 두 직책 모두 모델링과 거래를 포함하지만 데이터 과학은 주로 데이터 과학 측면과 기능 엔지니어링에 중점을 두는 반면 퀀트 연구원은 처음부터 끝까지 전체 거래 프로세스를 고려합니다. 발표자들은 Two Sigma의 사무실 문화와 회의에 대해 언급하면서 회의가 주로 비공식적이라고 설명하고 공동 토론을 위한 화이트보드를 제공합니다. 특정 회의에서는 때때로 준비된 프레젠테이션이 필요합니다.

마지막으로 범용 모델과 주식별 모델을 사용하는 이점이 강조 표시됩니다. 전이 학습을 활용하고 과적합 문제를 완화하는 범용 모델의 기능이 주요 이점으로 강조됩니다. 녹음된 세션이 Two Sigma의 YouTube 채널에서 제공될 것이라고 언급하고 회사의 글로벌 고용 관행을 강조하며 프레젠테이션을 마무리합니다. 고용의 대부분은 미국에 기반을 두고 있습니다.

  • 00:00:00 Two Sigma Securities의 Justin Ceriano가 금융에서 기계 학습 모델의 개념을 소개합니다. 그는 금융 회사가 기계 학습을 사용하여 금융 상품의 미래 가격을 예측하고 최적의 거래 전략을 결정하는 것과 같은 예측 및 결정을 내리는 데 어떻게 관심이 있는지 설명합니다. Ceriano는 강화 학습이 적절한 목적 함수를 최대화하는 것을 목표로 데이터에서 직접 결정 정책을 학습할 수 있는 방법의 한 종류라고 지적합니다. 그는 불충분한 데이터로 인한 과적합 문제, 딥 러닝 모델의 이점, 빈도가 높은 금융 데이터 세트에서 대형 모델을 교육하는 고성능 컴퓨팅의 중요성에 대해 논의하면서 결론을 내립니다.

  • 00:05:00 전자 시장에서 지정가 주문서의 개념이 도입되어 구매자와 판매자가 구매 또는 판매할 의사가 있는 가격으로 주문을 제출하고 최상의 매도 또는 매수 가격에 따라 매칭됩니다. 주식에 대한 눈에 보이는 공급과 수요는 오더북 데이터를 통해 표현되며 기계 학습 모델을 사용하여 미래의 가격 변화를 예측하는 데 사용되는 고차원 시퀀스입니다. 거래 전략에서 0이 아닌 스프레드를 고려하는 것도 중요하며, 이는 가격 예측의 수익성을 떨어뜨릴 수 있습니다.

  • 00:10:00 빈도가 높은 금융 데이터의 가격 변동을 예측하기 위해 순환 신경망을 구현합니다. 모델은 다음 가격 변화가 양수인지 음수인지 예측하고 그 결과를 선형 반복 모델과 비교합니다. 데이터 세트는 약 1,000개 주식에 대한 3년 간의 이벤트별 고주파 데이터로 구성됩니다. 반복 네트워크와 같은 비선형 기계 학습 모델이 데이터의 비선형 관계를 학습할 때 선형 통계 모델을 능가할 수 있는지 확인하기 위해 딥 러닝 모델의 성능을 평가합니다. 역전파 알고리즘은 예측 오류를 최소화하기 위해 목적 함수를 최적화하는 데 사용됩니다. 계산 비용을 줄이기 위해 시간 알고리즘을 통한 잘린 역전파가 사용됩니다.

  • 00:15:00 이 비디오는 다층 피드포워드 네트워크를 최적화하는 것과 정신이 유사한 순환 네트워크를 최적화하는 방법에 대해 설명합니다. 그러나 그래디언트 소실 문제는 잘 알려진 문제로, 네트워크의 하위 계층에 비해 그래디언트의 크기가 작습니다. 이로 인해 훈련이 느려지고, 네트워크가 과거의 데이터를 기억하도록 훈련하기가 어려우며, 천천히 수렴하는 확률적 경사 하강으로 이어질 수 있습니다. 또한 성적표는 LSTM 네트워크를 순환 네트워크의 가장 인기 있는 유형 중 하나로 소개합니다. 이 네트워크는 모델이 시퀀스에서 먼 과거의 데이터를 기억하는 데 도움을 주기 위해 메모리 상태를 효율적으로 업데이트하도록 설계되었습니다.

  • 00:20:00 저자는 빈도가 높은 주문서 데이터에 대해 일련의 기계 학습 모델을 교육하고 테스트 데이터 세트에서 성능을 평가한 방법을 설명합니다. 저자는 선형 모델의 정확도를 LSTM 순환 네트워크와 비교했으며 딥 러닝 모델이 3개월의 샘플 외 테스트 기간 동안 약 500개 주식의 테스트 데이터 세트에서 선형 모델보다 확실히 뛰어난 성능을 보인다는 것을 발견했습니다. 그들은 주문서 데이터와 가격 변동 사이의 관계가 주식 전반에 걸쳐 보편적인지 또는 개별 주식에 자체 모델이 필요한지 여부에 대한 질문을 조사하고 주문 흐름을 가격 변동에 매핑하는 보편적인 가격 형성 모델에 대한 강력한 증거를 찾습니다. 그들은 또한 더 낮은 계산 비용과 다른 주식의 데이터를 사용하여 한 주식에 대한 모델을 개선하는 능력을 포함하여 이 발견의 실질적인 의미에 대해 논의합니다.

  • 00:25:00 이 실험은 수백 개의 주식에서 데이터를 풀링하고 그 정확도를 주식별 모델의 정확도와 비교하여 범용 모델을 교육하는 것을 목표로 합니다. 결과는 범용 모델이 지속적으로 주식 특정 모델보다 우수한 것으로 나타나 다양한 주식의 주문서 역학에서 공통된 보편성을 나타냅니다. 이를 통해 과적합을 줄이고 모델 정확도를 높일 수 있습니다. 또한 범용 모델은 새로운 주식으로 일반화할 수 있으며 비동기식 확률적 경사 하강과 함께 25개의 GPU를 사용하는 고성능 컴퓨팅의 도움으로 1년 이상의 모델 안정성과 모델 확장성을 입증합니다. 이 섹션에 제시된 두 번째 예는 강화 학습을 사용하여 주문 제출 전략을 개발하는 최적의 실행입니다. 그러나 마코프 결정 과정을 위한 최적의 정책은 알 수 없는 전이 확률로 인해 어렵습니다.

  • 00:30:00 비디오는 강화 학습을 사용하여 간단한 주문 실행 예제에 대한 최적의 정책을 학습하는 방법에 대해 설명합니다. 강화 학습 모델은 과거 오더북 데이터를 사용하여 소액 주문에 대한 실행 가격을 정확하게 시뮬레이션하도록 훈련됩니다. 초점은 시간 지평까지 각 이산 시간에 대한 예상 보상 및 비용 절감을 극대화하기 위해 시장 주문 또는 한 주에 대한 제한된 주문의 최적 실행에 있습니다. 강화 학습 모델은 시장가 주문을 제출할지 또는 최고의 매도 가격이 감소할 때까지 기다릴지를 선택합니다. 입력은 지정가 주문서 데이터이고 모델은 1년 데이터로 평가된 다음 6개월 데이터로 테스트됩니다.

  • 00:35:00 이 비디오는 시장 주문 전용 강화 학습 전략과 간단한 지정가 주문 전략에 대해 10초와 60초의 시간 지평을 가진 100개 주식의 우주에 대한 시뮬레이션 결과를 보여줍니다. 결과는 강화 학습 모델이 50개 주식에 걸쳐 상당한 변동성이 있지만 일관되게 긍정적인 비용 절감을 제공한다는 것을 보여줍니다. 비용 절감은 일반적으로 더 긴 시간 범위를 고려할 때 증가합니다. 비디오는 또한 과거 오더북 데이터를 사용하여 한 주에 대해 제출된 지정가 주문이 시간 간격에서 실행되는지 여부를 시뮬레이션하고 강화 학습 모델을 훈련하여 예상 비용 절감을 최대화하는 시간을 적응적으로 선택하도록 소개합니다. 결과는 강화 학습 전략이 지속적으로 긍정적인 비용 절감을 제공한다는 것을 보여줍니다. 비용 절감은 일부 주식에 따라 다르지만 다른 주식에서는 상대적으로 큽니다.

  • 00:40:00 비디오는 금융 데이터를 위해 특별히 설계된 더 나은 최적화 방법과 딥 러닝 아키텍처를 개발해야 할 필요성을 강조합니다. 금융 데이터에 기계 학습을 적용하기 위해 더 큰 주문 크기에 대한 정확한 시뮬레이션과 강화 학습을 병합하는 것과 같이 해결해야 할 공개 과제가 남아 있습니다. Justin은 기계 학습을 배우는 가장 좋은 방법은 대규모 데이터 세트에 직접 구현하고 그 배후의 수학적 이론을 이해하는 것이라고 권장합니다. 파이토치나 텐서플로우 같은 딥러닝 라이브러리와 금융 데이터에 머신러닝을 적용하기 위한 모델 훈련을 병렬화하기 위한 고성능 컴퓨팅 경험이 필수적이다. 마지막으로 세션 녹화본은 YouTube 채널에서 볼 수 있으며, Two Sigma는 전 세계적으로 직원을 채용하며 대부분의 직원은 미국에 기반을 두고 있습니다.

  • 00:45:00 Two Sigma 대표가 채용 및 원격 작업에 대한 정책에 대해 이야기합니다. 정규 원격 근무 정책은 없지만 전 세계 여러 국가에서 개인을 고용하고 원격 근무를 위해 Alpha Studio라는 온라인 팀을 보유하고 있습니다. 또한 이 분야의 기계 학습에 관심이 있는 사람들을 위해 양적 금융, 확률 및 통계에 대한 여러 과정을 수강하는 것의 중요성에 대해 논의합니다. 마지막으로 발표자는 코드에 딥 러닝 라이브러리인 TensorFlow 및 PyTorch가 포함되어 있음을 밝힙니다.

  • 00:50:00 연사는 Two Sigma의 채용 과정과 그들이 채용하는 연중 다른 시기, 여름에 초점을 맞추지만 가을과 봄에는 예외를 두는 것에 대해 논의합니다. 그들은 또한 그들이 수시로 고용하고 사람들이 12월에 시작하더라도 가능한 한 빨리 시작하도록 권장한다고 언급합니다. 채용 담당자가 관심을 가질 만한 프로젝트 측면에서 실제 데이터에서 패턴과 추세를 찾고 실제 문제에 기계 학습 접근 방식을 적용할 것을 제안합니다. 이때 프로젝트 소유권에 중점을 두고 작업한 프로젝트에서 개인이 소유한 항목을 강조 표시합니다. 에. 연사들은 또한 회사의 엔지니어, 데이터 과학자 및 기타 비즈니스 영역과 긴밀히 협력하는 Two Sigma의 기본 형평성 연구 팀에 대해 언급합니다. 마지막으로 자동 거래 실행을 최적화하기 위해 강화 학습을 사용하는 것에 대한 질문을 다룹니다.

  • 00:55:00 연사는 Two Sigma에서 데이터 과학자와 퀀트 연구원의 차이점에 대해 논의합니다. 두 직책 모두 모델링과 거래를 포함하는 반면, 데이터 과학은 데이터 과학 측면과 기능 엔지니어링에 중점을 두는 반면 양적 연구는 처음부터 끝까지 거래의 전체 그림을 고려합니다. 발표자는 또한 Two Sigma의 사무실 문화 및 회의에 대한 질문에 답하면서 준비된 프레젠테이션이 필요한 회의가 가끔 있지만 회의는 일반적으로 화이트보드를 사용하여 토론할 수 있는 캐주얼한 회의라고 설명합니다. 마지막으로 발표자는 결합된 데이터 세트에서 훈련된 단일 범용 모델이 특수 모델보다 성능이 우수한 이유에 대해 전이 학습 및 과적합 문제의 가능성을 언급하면서 범용 모델과 주식 특정 모델의 이점에 대해 논의합니다.
 

알고리즘 트레이딩 성공의 열쇠 | 팟캐스트 | EP 찬 박사


알고리즘 트레이딩 성공의 열쇠 | 팟캐스트 | EP 찬 박사

양적 거래 또는 일반적으로 거래는 침입하고 성공하기 가장 어려운 직업 중 하나로 간주됩니다. 양적 거래의 선구자이자 뉴욕에서 수십억 달러 규모의 헤지 펀드를 설립한 DE Shaw 박사는 다음과 같이 인정했습니다. 이 분야는 해가 갈수록 점점 더 어려워지고 있습니다. 이 감정은 업계의 많은 경험 많은 거래자들이 반향합니다.

어려움에도 불구하고 양적 거래는 열정을 가진 사람들이 추구할 가치가 있습니다. 성공적인 배우, 가수, 모델 또는 소설가가 되는 것과 마찬가지로 알고리즘 거래에서 성공하려면 헌신과 인내가 필요합니다. 모든 사람이 DE Shaw 또는 Renaissance Technologies와 같은 유명한 트레이더 수준에 도달할 수는 없지만, 트레이더를 꿈꾸는 사람은 낙담해서는 안 됩니다. 이 분야에서의 성공은 아웃라이어이기 때문에 실패에 대비하는 것이 중요합니다.

아직 금융 업계에 종사하지 않는 개인의 경우, 졸업하고 첫 거래 전략을 시작한 직후 본업을 그만두지 않는 것이 좋습니다. 풀 타임 거래를 고려하기 전에 적어도 2개의 수익성 있는 거래 전략을 2년 동안 실행하는 것이 좋습니다. 이 조언은 개인적인 경험과 다른 성공적인 트레이더의 경험을 기반으로 합니다.

거래자들은 종종 전략의 과거 성과에 대해 지나치게 낙관적인 실수를 범하여 레버리지를 너무 높게 만듭니다. 계정의 자산을 빠르게 소진할 수 있으므로 과도한 레버리지를 피하는 것이 중요합니다. 또한 전략 성과는 일반적으로 동일한 방식으로 계속 추세를 유지하지 않습니다. 과거 성과만을 기준으로 자본을 할당하는 것은 흔한 실수입니다. 대신, 자본이 전략의 변동성에 반비례하여 할당되는 리스크 패리티 할당이 일반적으로 더 나은 접근 방식입니다.

또 다른 일반적인 실수는 호황기에 데이터 장비와 인력에 이익을 투자하지 않는 것입니다. 수익의 일부를 재투자하여 데이터 인프라를 개선하고 숙련된 인력을 고용하는 것은 향후 손실을 방지하는 데 도움이 될 수 있으므로 필수적입니다.

긍정적인 면에서 직관적인 정당성이 있는 간단한 전략부터 시작하는 것이 좋습니다. 순환 신경망 또는 딥 러닝과 같은 보다 복잡한 접근 방식을 탐구하기 전에 기존 전략을 이해하고 개선하는 것이 현명합니다. 간단한 전략으로 시작함으로써 트레이더는 성공 또는 실패의 원인을 특정 요인에 기인하여 더 잘 이해할 수 있습니다.

결론적으로 양적 거래는 도전적이지만 잠재적으로 보람 있는 직업입니다. 인내, 지속적인 학습 및 신중한 의사 결정이 필요합니다. 피해야 할 함정이 있지만 숙련된 거래자로부터 배워야 할 귀중한 교훈도 있습니다. 간단한 전략부터 시작하여 위험을 관리하고 인프라와 인력에 투자함으로써 트레이더 지망생은 퀀트 트레이딩 분야에서 성공할 가능성을 높일 수 있습니다.

Keys to Success in Algorithmic Trading | Podcast | Dr. E.P. Chan
Keys to Success in Algorithmic Trading | Podcast | Dr. E.P. Chan
  • 2020.07.02
  • www.youtube.com
Dr. Ernest P. Chan is the Managing Member of QTS Capital Management, LLC. He has worked for various investment banks (Morgan Stanley, Credit Suisse, Maple) a...
 

Max Margenot의 "기본 통계적 차익 거래: 페어 트레이딩의 수학 이해"


Max Margenot의 "기본 통계적 차익 거래: 페어 트레이딩의 수학 이해"

Quanto Peon Algorithmic Trading Meetup에 오신 것을 환영합니다. 이 행사는 Quanto 금융의 세계를 탐험하는 데 전념합니다. 저는 Quanto Peon의 데이터 과학자인 Max Margit입니다. 오늘은 통계적 차익 거래라는 매혹적인 주제와 이와 관련된 기본 통계 개념에 대해 자세히 알아보겠습니다.

이론적 측면에 들어가기 전에 Quanto Peon에 대한 간략한 소개를 제공하겠습니다. 우리의 주요 목표는 개인이 자신의 알고리즘 거래 전략을 연구하고 개발할 수 있는 무료 오픈 소스 도구를 제공하여 모든 사람이 양적 금융에 접근할 수 있도록 하는 것입니다. 알고리즘 거래는 매일 오전 10시에 Apple 주식을 구매하는 것과 같은 간단한 규칙부터 통계 모델을 사용한 보다 정교한 양적 분석에 이르기까지 금융 시장에서 자동으로 거래를 실행하기 위한 명령을 사용하는 것을 포함합니다.

오늘 토론의 초점인 통계적 차익 거래는 물리적 불균형에 의존하는 대신 통계 분석을 사용하여 시장 비효율성을 활용하는 데 중점을 둡니다. 이 접근법은 자산 가격의 통계적 불균형을 식별하고 활용하는 것을 목표로 합니다. 이 개념을 더 잘 이해하려면 몇 가지 기본 통계 개념을 이해하는 것이 중요합니다.

우리가 살펴볼 주요 개념 중 하나는 특히 시계열 데이터의 맥락에서 정상성입니다. 정상성은 각 샘플이 시간이 지남에 따라 일관된 매개변수를 사용하여 동일한 확률 분포에서 추출되는 일련의 데이터 포인트를 나타냅니다. 간단히 말해서 데이터의 평균과 표준 편차가 시간이 지남에 따라 일정하게 유지됨을 의미합니다. 이는 재무에서 사용되는 많은 통계 모델이 정상성을 가정하기 때문에 중요합니다. 정상성을 보장함으로써 이러한 모델에서 얻은 결과를 신뢰할 수 있습니다.

정상성의 개념을 설명하기 위해 몇 가지 데이터 포인트를 생성해 보겠습니다. "generate_data_point"라는 기본 함수를 사용하여 표준 정규 분포에서 샘플 집합을 생성하겠습니다. 이러한 샘플은 종종 백색 잡음이라고 하는 고정된 시계열을 나타냅니다. 이 경우 평균은 0이고 표준 편차는 1입니다. 이 데이터를 플로팅하면 백색 잡음과 유사한 임의의 패턴이 관찰됩니다.

그러나 모든 시계열 데이터가 정상성을 나타내는 것은 아닙니다. 평균에 추세를 도입하면 시계열이 비정상이 됩니다. 금융에서 비정상성은 이 단순한 예보다 훨씬 더 복잡할 수 있습니다. 평균과 같은 기술 통계는 전체 시계열을 정확하게 나타내지 않기 때문에 비정상 데이터의 경우 의미가 없습니다.

이제 시계열이 정상인지 아닌지 어떻게 결정합니까? 이것은 정상성 분석에서 일반적으로 사용되는 증강된 Dickey-Fuller 테스트와 같은 가설 테스트가 작동하는 곳입니다. 이 테스트는 주어진 시계열이 비정상일 확률을 평가하는 데 도움이 됩니다.

생성된 시계열 데이터에 보강된 Dickey-Fuller 테스트를 적용해 보겠습니다. 테스트는 시계열이 비정상적이라는 귀무가설을 기각할 가능성을 나타내는 p-값을 제공합니다. 데이터가 고정된 것으로 의도적으로 생성된 첫 번째 예에서 p-값은 0에 가깝습니다. 이를 통해 귀무 가설을 기각하고 시계열이 정상일 가능성이 높다는 결론을 내릴 수 있습니다. 반면에 도입된 추세가 있는 두 번째 예에서는 p-값이 임계값(0.01)을 초과하고 귀무 가설을 기각하지 못하여 시계열이 비정상일 가능성이 있음을 나타냅니다.

그러나 가설 검정에는 한계가 있다는 점에 유의해야 합니다. 특히 재무 데이터 내에서 미묘하거나 복잡한 관계를 처리할 때 거짓 긍정이 발생할 수 있습니다. 따라서 주의를 기울이고 정상성을 결정하기 위해 가설 검정에만 의존하지 않는 것이 중요합니다.

이제 쌍 거래로 초점을 옮겨 보겠습니다. 쌍 거래에 참여하고 싶다면 여러 쌍을 고려하고 각각에 독립적인 베팅을 해야 합니다. 한 쌍에 의존하는 대신 100, 200 또는 심지어 300 쌍을 거래하여 포트폴리오를 다양화하면 각 쌍에서 내가 가질 수 있는 우위를 활용할 수 있으므로 전반적인 성공 가능성이 높아집니다.

거래 쌍은 거래를 효과적으로 관리하고 모니터링하기 위해 강력한 프레임워크가 필요합니다. 여기에는 쌍 간의 관계를 지속적으로 업데이트하고 그에 따라 위치를 조정하는 것이 포함됩니다. 쌍 간의 관계를 나타내는 베타 값은 시간이 지남에 따라 변할 수 있으므로 이러한 변화에 동적으로 적응하는 시스템이 필요합니다.

또한 각 거래에 대한 명확한 출구 전략을 갖는 것이 중요합니다. 쌍이 더 이상 예상되는 동작을 나타내지 않거나 쌍 사이의 관계가 무너지는 경우 포지션을 닫을 시기를 결정해야 합니다. 이를 위해서는 스프레드를 지속적으로 모니터링하고 거래를 청산하기 위한 사전 정의된 기준이 필요합니다.

또한 위험 관리는 쌍 거래에서 중요한 역할을 합니다. 변동성, 상관관계 및 전체 포트폴리오 노출과 같은 요소를 기반으로 각 쌍의 포지션 크기를 신중하게 계산하는 것이 중요합니다. 거래를 다양화하고 위험을 효과적으로 관리함으로써 불리한 시장 상황의 영향을 최소화하고 잠재적 이익을 극대화할 수 있습니다.

쌍 거래 전략을 효과적으로 구현하기 위해 트레이더는 종종 고급 양적 기술에 의존하고 정교한 알고리즘을 개발합니다. 이러한 알고리즘은 시장에서 잠재적인 쌍을 자동으로 스캔하고, 공동 통합 및 통계 속성을 평가하고, 미리 정의된 기준에 따라 거래 신호를 생성합니다.

결론적으로 알고리즘 거래를 위한 통계 모델을 구축할 때 정상성을 이해하고 적절한 테스트를 수행하는 것이 중요합니다. 거래자는 정상성의 개념을 파악하고 보강된 Dickey-Fuller 테스트와 같은 테스트를 사용하여 시계열 데이터에서 비정상성의 가능성을 평가할 수 있습니다. 통계적 차익 거래 전략인 페어 트레이딩을 통해 트레이더는 상관 관계가 있는 두 유가 증권 간의 역사적 관계에서 일시적인 편차를 이용할 수 있습니다. 그러나 성공적인 구현을 위해서는 강력한 프레임워크, 지속적인 모니터링, 위험 관리 및 고급 정량적 기법의 사용이 필요합니다.

Quanto Peon은 Quanto Peon Lecture Series를 통해 통계 및 금융에 대한 무료 강의를 제공함으로써 금융과 기술 간의 격차를 해소하기 위해 노력합니다. 우리의 임무는 양적 금융을 민주화하고 개인에게 알고리즘 거래 전략을 개발할 수 있는 도구와 지식을 제공하는 것입니다.

"Basic Statistical Arbitrage: Understanding the Math Behind Pairs Trading" by Max Margenot
"Basic Statistical Arbitrage: Understanding the Math Behind Pairs Trading" by Max Margenot
  • 2017.07.25
  • www.youtube.com
This talk was given by Max Margenot at the Quantopian Meetup in Santa Clara on July 17th, 2017. To learn more about Quantopian, visit: https://www.quantopian...
 

재무 수학을 위한 브라운 운동 | 양자를 위한 브라운 운동 | 확률적 미적분학


재무 수학을 위한 브라운 운동 | 양자를 위한 브라운 운동 | 확률적 미적분학

안녕하세요, YouTube입니다. ASX Portfolio 채널에 다시 오신 것을 환영합니다. 제 이름은 조나단입니다. 오늘 우리는 특히 금융 수학의 맥락에서 브라운 운동의 매혹적인 세계를 탐구할 것입니다. 이는 금융수학 분야에서 필수적인 확률과정과 확률적 미적분학의 기초를 형성하는 중요한 주제이다. 브라운 운동은 Ito 적분의 기초이며 큰 의미를 지니므로 이를 이해하는 것이 가장 중요합니다. 향후 비디오에서는 기하학적 브라운 운동, 응용 및 Ito 적분과 같은 주제를 다루면서 수학을 더 탐구할 것입니다. 앞으로 나올 동영상을 계속 시청하고 싶다면 구독 버튼을 누르세요.

이번 영상에서는 브라운 운동이 무엇이며 어떻게 발생하는지 설명하기 위해 준비한 Jupyter 노트북을 훑어보겠습니다. 이제 바로 시작하겠습니다. 대칭 랜덤 워크를 고려하는 것으로 시작한 다음 스케일링된 랜덤 워크로 이동하여 브라운 운동으로 수렴하는 방법을 보여줍니다. 이 설명 전반에 걸쳐 우리는 Steven Shreve의 저서 "Stochastic Calculus for Finance II"의 표기법과 예제를 사용할 것입니다.

무엇보다 먼저 브라운 운동의 주요 속성이 다음과 같다는 것을 이해하는 것이 중요합니다. 이것은 마팅게일(martingale)입니다. 즉, 예측이 입자 또는 주가의 현재 위치에만 기반한다는 것을 의미합니다. 또한 Markov 프로세스이며 2차 변동을 누적합니다. 2차 변동은 확률적 미적분학의 고유한 개념으로 일반 미적분학과 구별됩니다. 이 에피소드에서는 2차 변동이 수반하는 것을 탐구합니다.

코드를 따라하고 싶다면 내 웹 사이트에서 사용할 수 있습니다. 이 데모에 필요한 필수 종속 항목을 가져왔습니다. 브라운 운동은 확률적 과정이라는 점에 유의하는 것이 중요하며, 우리의 목적을 위해 확률 공간 P와 함께 결과 및 필터링 F가 있는 필터링된 확률 공간을 고려할 것입니다. 여기에서 간격 내의 실제 결과 집합이 있습니다. 0에서 시간 T까지.

브라운 운동은 항상 초기값이 0입니다. 독립적인 증분이 있고 가우시안 분포를 따르며 거의 확실하게 연속 샘플 경로를 나타냅니다. 이러한 모든 속성에 대해 자세히 설명하겠습니다.

가장 간단한 예인 대칭 랜덤 워크부터 시작하겠습니다. 랜덤 워크의 개념에 익숙하지 않은 경우 연속적인 동전 던지기의 시퀀스로 생각하십시오. 변수 omega로 표시되는 각 결과는 헤드 또는 테일일 수 있습니다. 변수 X_j를 사용하여 앞면에 1, 뒷면에 -1 값을 취하여 각 결과를 나타냅니다.

m_0이 0인 프로세스를 정의하면 m_k는 k 던지기에 대해 가능한 모든 동전 던지기 경로를 따라 합계가 됩니다. 이 경우 프로세스가 1씩 올라가거나 1씩 내려갈 수 있는 랜덤 워크가 있으며 경로에서 이러한 증분을 합산합니다. 저는 10년이라는 기간 동안 10개의 샘플 경로를 생성하는 스크립트를 작성했습니다. 플롯은 임의 보행이 경로를 따라 각 시간 단계에서 1씩 위 또는 아래로 이동하는 방법을 보여줍니다.

이 예제는 몇 가지 흥미로운 속성을 보여줍니다. 첫째, m_k+1 - m_k와 같은 기간 사이의 증분은 독립적입니다. 또한 이러한 독립적 증분의 기대값은 0이고 분산은 시간 차이 또는 시간 단계(k_i+1 - k_i) 사이의 거리와 같습니다. 분산은 단위 시간당 하나의 비율로 누적됩니다.

또한 대칭 랜덤 워크는 마팅게일입니다. 이것은 현재 위치가 주어졌을 때 다음 값에 대한 조건부 기대가 현재 위치와 같다는 것을 의미합니다. 대칭 랜덤 워크의 맥락에서,

중단한 부분부터 계속해서 다음 비디오에서는 Python을 사용하여 기하학적 브라운 운동의 샘플을 만드는 방법을 살펴보겠습니다. 기하학적 브라운 운동은 주식 가격을 모델링하기 위해 금융 수학에서 일반적으로 사용되는 확률 과정입니다. 현장에서 이해해야 할 필수 개념입니다.

하지만 그것에 대해 알아보기 전에 브라운 운동의 주요 속성 중 일부를 요약해 보겠습니다. 브라운 운동은 다음과 같은 몇 가지 특성을 특징으로 하는 확률 과정입니다.

  1. 독립 증분: 브라운 운동의 증분은 독립적입니다. 즉, 시간의 두 지점 사이의 변화는 다른 두 지점 사이의 변화와 관련이 없습니다.

  2. 가우스 분포: 브라운 운동의 증분은 가우시안 또는 정규 분포를 따릅니다. 이 분포는 다양한 결과의 확률을 설명하며 확률 이론의 기본 개념입니다.

  3. 연속 샘플 경로: 브라운 운동에는 연속 샘플 경로가 있으며, 이는 각 기간에서 미분할 수 없음을 의미합니다. 이 속성은 임의의 변동이 있는 다양한 현상을 모델링하는 데 적합합니다.

  4. 2차 변동: 2차 변동은 확률적 미적분학에서 브라운 운동의 고유한 특성입니다. 시간 경과에 따라 누적된 변동을 측정하고 확률적 프로세스의 동작을 이해하는 데 중요합니다.

이제 기하학적 브라운 운동에 대해 논의해 봅시다. 기하 브라운 운동은 지수 성장을 포함하는 브라운 운동의 확장입니다. 일반적으로 주가와 같은 금융 자산의 동작을 모델링하는 데 사용됩니다. 기하 브라운 운동은 다음과 같은 형식을 갖습니다.

dS(t) = μS(t)dt + σS(t)dW(t)

여기서 S(t)는 시간 t에서의 자산 가격, μ는 예상 수익률 또는 드리프트율, σ는 변동성 또는 수익률의 표준 편차, dt는 작은 시간 간격, dW(t)는 표준 브라운 운동 증가.

기하학적 브라운 운동을 시뮬레이션하기 위해 Euler의 방법 또는 Itô 적분과 같은 수치적 방법을 사용하여 프로세스를 이산화할 수 있습니다. 이 방법을 사용하면 일련의 불연속 단계를 사용하여 연속 프로세스를 근사화할 수 있습니다.

다음 비디오에서는 기하학적 브라운 운동의 수학적 세부 사항과 금융 수학에서의 응용을 살펴보겠습니다. 또한 기하학적 브라운 운동을 시뮬레이션하고 시각화하기 위해 Python에서 실용적인 예제와 코드 스니펫을 제공합니다.

이 주제에 대해 더 자세히 알고 싶다면 저희 채널을 구독하고 다음 비디오를 기대해 주세요. 더 많은 인사이트를 공유할 수 있기를 기대합니다. 많은 관심 부탁드리며, 다음 영상에서 만나요!

Brownian Motion for Financial Mathematics | Brownian Motion for Quants | Stochastic Calculus
Brownian Motion for Financial Mathematics | Brownian Motion for Quants | Stochastic Calculus
  • 2021.09.09
  • www.youtube.com
In this tutorial we will investigate the stochastic process that is the building block of financial mathematics. We will consider a symmetric random walk, sc...
 

Python에서 기하학적 브라운 운동 시뮬레이션하기 | Quants에 대한 확률적 미적분학


Python에서 기하학적 브라운 운동 시뮬레이션하기 | Quants에 대한 확률적 미적분학

안녕하세요, YouTube. ASX 포트폴리오 채널에 다시 오신 것을 환영합니다. 제 이름은 조나단입니다. 오늘 우리는 파이썬에서 기하학적 브라운 운동을 시뮬레이트할 것입니다. 이 자습서에서는 기하학적 브라운 운동의 동역학을 유도하거나 Ito 미적분, Ito 적분 및 확률 과정을 다루지 않습니다. 그러나 다음 자습서에서 이러한 주제를 자세히 살펴보겠습니다. 그들에 대해 더 알고 싶다면 우리 채널을 구독하고 알림 벨을 눌러 해당 비디오가 공개될 때 알림을 받을 수 있습니다.

시뮬레이션에 들어가 봅시다. 데모 목적으로 이 Jupyter 노트북을 사용할 것입니다. 먼저 시뮬레이션을 위한 매개변수를 정의합니다. 드리프트 계수 mu는 1년 동안 0.1 또는 10%로 설정됩니다. 세분화된 시뮬레이션을 위해 시간 단계 수를 "n"으로 정의하고 100으로 설정합니다. 시간은 "T"로 표시되는 연도 단위로 측정됩니다. 시뮬레이션의 수는 "m"으로 표시되고 100으로 설정됩니다. 초기 주가 S0은 100으로 설정되고 변동성 sigma는 30으로 설정됩니다. 필요한 종속성을 가져옵니다: numpy as np 및 matplotlib plt로 .pyplot.

이제 기하학적 브라운 운동 경로를 시뮬레이션해 보겠습니다. 시간 단계를 계산하기 위해 T를 n으로 나눕니다. 다음으로 numpy 배열을 사용하여 경로를 반복하는 대신 한 단계로 시뮬레이션을 수행합니다. "st"라는 배열을 정의하고 numpy의 지수 함수를 사용합니다. 함수 내에서 구성 요소를 정의합니다. mu 빼기 시그마 제곱 나누기 2, 곱하기 dt. 그런 다음 시그마에 정규 분포에서 샘플링하는 numpy의 random.normal 함수를 곱하고 dt의 제곱근을 곱합니다. 이 배열의 크기는 각각 시뮬레이션 수와 시간 단계를 나타내는 m x n입니다. 우리는 각 시간 단계에 대한 시뮬레이션을 원하기 때문에 이 배열의 전치를 취할 것입니다.

각 시뮬레이션의 초기 지점을 포함하기 위해 numpy의 vstack 함수를 사용하여 st 시뮬레이션 배열과 함께 1의 numpy 배열을 쌓을 것입니다. 이렇게 하면 각 시뮬레이션이 초기 값으로 시작됩니다. 마지막으로 누적 배열에 초기 값을 곱하여 드리프트, 분산 및 확률 구성 요소 측면에서 일일 변경 사항을 설명합니다. 이것은 우리에게 시간 단계 구현을 제공할 것입니다. 시간 경과에 따라 이러한 값을 누적하기 위해 축 1을 지정하여 각 시뮬레이션 경로를 따라 numpy의 누적 곱 함수를 사용합니다. 이렇게 하면 각 경로에 대한 누적 곱이 계산됩니다.

이제 시뮬레이션된 경로가 있으므로 시간 간격(년)을 고려해 보겠습니다. numpy의 linspace 함수를 사용하여 n+1 공백으로 0에서 T까지 균일한 간격의 시간 단계를 생성합니다. 그러면 "time"이라는 배열이 생성됩니다. 다음으로 함수를 그릴 수 있도록 st와 같은 모양으로 "fill"이라는 numpy 배열을 만듭니다. numpy의 전체 기능을 사용하고 fill_value를 시간으로 설정합니다. 이 벡터의 전치를 사용하여 x축을 따라 연도를, y축을 따라 주가를 그래프로 그릴 수 있습니다. 변동성 30%와 평균 10% 증가 또는 드리프트로 인한 분산을 고려합니다. 이 기하학적 브라운 운동.

기하학적 브라운 운동은 옵션 가격 이론 및 다양한 금융 수학 응용에 유용한 모델입니다. 이 튜토리얼에서 가치를 찾았기를 바랍니다. 다음 비디오에서는 금융 수학, Ito 미적분, Ito 적분에 대해 자세히 알아보고 다른 매개변수를 추가하여 확률적 미분 방정식의 복잡성을 높이는 방법을 살펴보겠습니다. 더 자세한 내용을 알고 싶으시면 저희 채널을 구독하시고 알림 벨을 누르시면 다음 주 해당 영상이 공개될 때 알림을 받으실 수 있습니다. 그때까지 더 가치 있는 콘텐츠를 기대해 주세요. 시청해주셔서 감사하고, 다음 영상에서 뵙겠습니다.

Simulating Geometric Brownian Motion in Python | Stochastic Calculus for Quants
Simulating Geometric Brownian Motion in Python | Stochastic Calculus for Quants
  • 2021.09.15
  • www.youtube.com
In this tutorial we will learn how to simulate a well-known stochastic process called geometric Brownian motion. This code can be found on my website and is ...
 

Quants에 대한 확률적 미적분학 | Itô Calculus를 사용한 기하 브라운 운동의 이해


Quants에 대한 확률적 미적분학 | Itô Calculus를 사용한 기하 브라운 운동의 이해

안녕하세요, YouTube. ASX Portfolio에 다시 오신 것을 환영합니다. 오늘 우리는 브라운 운동이 금융 시장을 모델링하는 데 부적절한 선택인 이유에 대해 논의할 것입니다. 브라운 운동이 음의 주식 가격을 초래할 것이라는 것은 매우 명백하며 이는 현실적이지 않습니다. 대신 브라운 운동의 확률적 속성 중 일부를 보존하고 모델에 통합하는 방법이 필요합니다. 이는 Ito 프로세스를 사용하여 달성할 수 있으며, 이를 통해 브라운 운동의 위험 소스를 추가할 수 있습니다.

잘 알려진 Ito 프로세스 중 하나는 기하 브라운 운동(GBM)으로, 많은 분들이 잘 알고 계실 것입니다. 우리는 브라운 운동의 속성을 활용하여 실제 사례와 더 잘 일치하는 새로운 모델을 개발할 수 있습니다. 이를 달성하기 위해 금융 확률 수학에서 일반적으로 사용되는 Ito 미적분이라는 특수 유형의 미적분을 사용합니다.

오늘은 Ito 적분을 이해하고 이것이 복잡한 문제를 해결하는 데 어떻게 도움이 되는지에 초점을 맞출 것입니다. Ito 미적분학에서 항등식 역할을 하고 규칙 도출을 돕는 Ito의 보조정리에 대해 논의할 것입니다. 또한 Ito-Dobelin 공식과 기하학적 브라운 운동의 동역학 유도를 살펴보겠습니다.

이러한 개념에 대해 자세히 알아보려면 Stephen Shreve의 두 번째 책인 "확률적 미적분학을 위한 연속 시간 모델"을 적극 권장합니다. 4장에서는 오늘 논의할 내용을 다룹니다.

이제 Ito 적분이 무엇인지 이해하는 것으로 시작하겠습니다. 우리가 논의할 모든 수학은 필터링된 확률 공간을 기반으로 한다는 점을 기억하는 것이 중요합니다. 이 공간에는 결과, 필터링 및 확률 측정이 포함됩니다. 여과는 시간 t까지의 모든 정보를 포함하는 시그마-대수를 말합니다. 확률 이론은 복잡하지만 오늘은 간단히 다루겠습니다. 더 깊이 있는 이해를 위해 Shreve 책의 처음 세 장을 참조하는 것이 좋습니다.

Ito 적분은 기호 ∫δdW로 표시되며, 여기서 δ는 확률 과정이고 dW는 Wiener 과정입니다. 그 의미를 파악하기 위해 0에서 T까지의 기간을 작은 간격으로 분할한다고 상상해 봅시다. 확률적 과정 δ를 n의 거듭제곱으로 표시할 수 있습니다. 여기서 n은 시간 간격의 수를 나타냅니다. 이 프로세스는 각 시간 간격에서 동전 던지기의 결과에 따라 그 값이 결정된다는 것을 의미합니다.

이제 간격의 수가 무한대에 가까워짐에 따라 합의 극한으로 적분을 고려하십시오. 각 summand는 확률적 프로세스 δ에 간격 사이의 위너 프로세스의 변화를 곱한 값으로 구성됩니다. 간격이 작아지면 Ito 적분에 수렴합니다. 그러나 이 한계가 존재하려면 두 가지 조건이 충족되어야 합니다. 프로세스 δ가 여과에 맞게 조정되어야 하고 제곱 적분 가능해야 합니다.

이제 표기법을 이해했으므로 일반적인 Ito 프로세스로 이동하겠습니다. 이러한 프로세스는 동일한 결과 공간에서 동일한 시간 영역에서 발생합니다. Wiener 프로세스와 관련하여 시간 기반 적분 및 Ito 적분을 포함합니다. 시간 기반 적분은 일반 리만 적분과 유사하지만 Ito 적분은 프로세스의 확률론적 특성을 캡처합니다. 이러한 프로세스는 드리프트 및 확산 용어로 나눌 수 있습니다.

Ito 프로세스의 예는 기하학적 브라운 운동(GBM)입니다. 드리프트 항과 확산 항으로 구성됩니다. 드리프트는 상수 μ에 의해 결정되는 반면 확산은 변동성 매개변수 σ에 의해 제어됩니다. GBM의 역학은 방정식과 같이 적분을 사용하여 표현할 수 있습니다.

이를 확장하여 Ito 프로세스의 적분도 고려할 수 있습니다. 예를 들어 Ito 프로세스의 적분은 거래 손익(P&L)을 나타낼 수 있습니다.

Itô-Doob 분해에서 드리프트 항의 적분, 확산 항의 적분 및 Itô 적분 항으로 표현되는 일반적인 프로세스가 있습니다. 이제 Itô-Doob 공식은 프로세스 함수의 미분을 계산하는 방법을 제공합니다. 함수의 미분은 시간에 대한 함수의 편도함수와 상태 변수에 대한 함수의 편도함수에 드리프트 항을 곱한 것과 관련하여 함수의 편도함수를 더한 것과 같습니다. 확산 항을 곱한 상태 변수에 Itô 적분 항을 곱한 상태 변수에 대한 함수의 편도함수의 적분을 더합니다.

이 공식을 사용하면 시간이 지남에 따라 프로세스가 발전함에 따라 함수 값의 변화를 계산할 수 있습니다. 그것은 Itô 미적분학의 기본 도구이며 확률적 분석 및 수학적 금융에서 광범위하게 사용됩니다.

기하학적 브라운 운동(GBM)으로 이동하면 주가 및 기타 금융 자산의 역학을 모델링하는 데 일반적으로 사용되는 특정 유형의 Itô 프로세스입니다. GBM은 드리프트 및 확산 구성 요소를 모두 통합합니다. 드리프트 항은 자산의 예상 수익률을 나타내는 반면 확산 항은 자산 가격 움직임의 변동성 또는 무작위성을 포착합니다.

GBM의 동역학은 Itô 미적분을 사용하여 도출할 수 있습니다. Itô 공식을 자산 가격의 로그에 적용하여 시간 경과에 따른 가격 로그의 변화를 설명하는 표현식을 얻습니다. 이 변화는 드리프트 항에 시간 증분을 곱하고 확산 항에 Itô 적분을 곱한 것과 같습니다. 방정식의 양쪽을 지수화함으로써 자산 가격 자체의 역학을 회복합니다.

GBM의 역학을 이해하는 것은 옵션 가격 책정 및 위험 관리에 매우 중요합니다. 이를 통해 자산 가격의 확률적 행동을 모델링하고 다양한 결과의 확률을 추정할 수 있습니다. GBM은 금융 수학에서 널리 사용되어 왔으며 옵션 가격 책정을 위한 Black-Scholes 모델과 같은 많은 가격 책정 모델의 기초 역할을 했습니다.

요약하면 Itô 미적분학은 재무에서 확률적 프로세스를 모델링하고 분석하기 위한 강력한 프레임워크를 제공합니다. Itô 적분을 통합하고 Itô의 보조정리와 Itô-Doob 공식을 적용함으로써 다양한 재무 변수의 동역학을 도출하고 실제 시장의 확률적 속성을 캡처하는 모델을 개발할 수 있습니다. Itô 미적분학은 수학적 금융 분야에 혁명을 일으켰으며 계속해서 금융 위험을 이해하고 관리하는 데 필수적인 도구입니다.

Stochastic Calculus for Quants | Understanding Geometric Brownian Motion using Itô Calculus
Stochastic Calculus for Quants | Understanding Geometric Brownian Motion using Itô Calculus
  • 2021.09.22
  • www.youtube.com
In this tutorial we will learn the basics of Itô processes and attempt to understand how the dynamics of Geometric Brownian Motion (GBM) can be derived. Firs...
 

Quants에 대한 확률적 미적분학 | 파생 상품에 대한 위험 중립 가격 책정 | 옵션 가격 설명


Quants에 대한 확률적 미적분학 | 파생 상품에 대한 위험 중립 가격 책정 | 옵션 가격 설명

이 비디오에서는 몬테카를로 시뮬레이션과 위험 중립 가격 책정을 사용하여 금융 파생상품의 가치를 평가하는 금융 수학에 대해 알아봅니다. Monte Carlo 시뮬레이션을 사용하는 이유, 위험 중립 가격 책정이란 무엇인지, 주식 성장률이 파생 모델에 입력되지 않는 이유와 같은 질문에 답할 것입니다.

위험 중립적 가격 책정은 옵션의 가치가 미래 수익에 대한 할인된 기대치인 방법론입니다. 즉, 현재 시점으로 다시 할인된 파생 상품의 모든 가능한 보상의 기대 가치입니다. 기본 주식 성장률은 위험 중립 가격 책정 프레임워크에서 옵션 가격에 영향을 미치지 않습니다. 이는 파생 상품과 기초 주식이 완벽한 상관관계를 가지고 있어 복제가 가능하고 무위험 포트폴리오를 생성할 수 있기 때문입니다.

다른 평가 방법에 비해 위험 중립적 가격 책정 접근 방식을 사용하면 몇 가지 이점이 있습니다. 첫째, 복잡한 미분 공식의 경우 폐쇄형 솔루션이 실현 가능하지 않을 수 있습니다. 이러한 경우 복제 방법을 사용하고 편미분 방정식(PDE)을 푸는 데 계산 비용이 많이 들 수 있습니다. 반면에 위험 중립 가격 책정은 계산 비용이 덜 드는 Monte Carlo 시뮬레이션을 사용하여 옵션 값을 쉽게 근사화할 수 있습니다.

위험 중립 가격 책정을 설명하기 위해 1주기 이항 모델을 고려하는 것으로 시작합니다. 이 모델에서 주식은 오르거나 내릴 수 있으며 옵션 값은 이 두 가지 가능한 결과에 따라 달라집니다. 기본 주식과 무위험 자산의 포트폴리오를 구성함으로써 옵션의 수익을 복제할 수 있습니다. 차익 거래가 없다는 원칙을 사용하여 시간이 0일 때의 옵션 가치는 시간이 0일 때의 포트폴리오 가치와 같아야 합니다. 선형 방정식을 풀면 이항 모델에서 할인된 기대치를 나타내는 공식을 얻을 수 있습니다.

우리는 주식 가격의 물리적 확률에서 위험 중립 확률로 전환할 수 있는 q로 표시되는 위험 중립 확률 측정의 개념을 도입합니다. 이 이동은 random-nickdem 파생 상품이라는 무작위 변수로 물리적 확률을 재가중하여 수행됩니다. 이 파생물을 통해 위험 중립 가격 세계에서 물리적 확률 세계로 옵션 값을 변환할 수 있습니다.

위험 중립 가격 책정의 목적은 Zt로 표시되는 임의의 닉뎀 파생 프로세스를 식별하여 모든 할인된 주가가 위험 중립 확률 측정 q에서 마팅게일임을 확인하는 것입니다. 측정 변경을 수행함으로써 물리적 확률 측정 하의 원래 브라운 운동을 위험 중립 확률 측정 하의 새로운 브라운 운동으로 변환할 수 있습니다. 이 새로운 브라운 운동은 마팅게일 과정으로 시간이 지나도 그 기대치가 일정하게 유지됨을 나타냅니다.

이러한 개념을 적용하기 위해 무배당 주식의 역학을 나타내는 기하학적 브라운 운동 모델을 고려합니다. 모델은 결정적 구성요소와 변동성을 나타내는 확률적 구성요소로 구성됩니다. 그러나 원래 주식 역학은 결정론적 구성 요소로 인해 물리적 확률에 따라 마팅게일이 아닙니다. 동역학을 마팅게일로 만들기 위해 드리프트 항을 제거하고 위험 중립 확률 측정 하에서 주식 동역학을 마틴게일 프로세스로 변환하는 Radon-Nikodym 파생물을 도입합니다.

요약하면, 위험 중립적 가격 책정과 Monte Carlo 시뮬레이션은 금융 파생상품의 가치를 평가하는 데 유용한 프레임워크를 제공합니다. 위험 중립 가격 책정 접근 방식은 단순성, 계산 효율성 및 복잡한 파생 구조를 처리할 수 있는 기능과 같은 이점을 제공합니다. 랜덤 닉뎀 파생 상품을 사용하고 측정값을 물리적 확률에서 위험 중립적 확률로 변경함으로써 우리는 파생 상품의 가치를 정확하게 평가하고 무위험 방식으로 수익을 복제할 수 있습니다.

Stochastic Calculus for Quants | Risk-Neutral Pricing for Derivatives | Option Pricing Explained
Stochastic Calculus for Quants | Risk-Neutral Pricing for Derivatives | Option Pricing Explained
  • 2022.01.12
  • www.youtube.com
In this tutorial we will learn the basics of risk-neutral options pricing and attempt to further our understanding of Geometric Brownian Motion (GBM) dynamic...
 

Ornstein-Uhlenbeck 프로세스로 주식 변동성 거래


Ornstein-Uhlenbeck 프로세스로 주식 변동성 거래

2020년 초 S&P 500은 가격이 급격히 하락하면서 변동성이 크게 증가했습니다. 한 달 사이에 지수는 거의 천 포인트 급락했습니다. 동시에 거래되는 지수 옵션을 기반으로 한 미래 변동성에 대한 기대도 이 기간 동안 급등하여 최고치인 66에 도달했습니다. 시장 변동성 기간 동안 지수 가치가 하락하면 VIX(변동성 지수)가 상승하는 것이 분명해졌습니다. VIX는 변동성의 미래 추정치 역할을 합니다. 이러한 현상으로 인해 마켓 메이커와 거래 전문가들은 실현된 변동성이 지속될 것이라고 예상했습니다.

이번 영상에서는 변동성의 시장 특성을 설명하고, 특정 변동성 지수에 Ornstein-Uhlenbeck 공식을 적용하여 변동성을 모델링하는 방법론에 대해 논의하고자 합니다. 최대우도 추정 방법을 사용하여 모델의 세 가지 매개변수를 시장 데이터로 보정합니다. 그런 다음 Python에서 이 프로세스를 시뮬레이션하여 시간 경과에 따른 변동성의 역학을 이해하고 분석할 수 있습니다.

이를 달성하기 위해 stats 모듈에서 time, math, numpy, pandas, datetime, scipy, matplotlib, pandas_datareader 및 plot_acf 함수와 같은 다양한 종속성을 가져올 것입니다. 우리가 활용할 데이터는 2003년 이후의 S&P 500 데이터입니다. 금융 시계열에서 변동성 클러스터링과 그 속성을 연구하기 위해 금융 시계열의 통계적 속성을 탐구하는 Ramacant(2005)의 연구 논문 "Volatility Clustering in Financial Markets"를 참조할 것입니다. 우리가 집중할 세 가지 중요한 속성은 초과 변동성, 무거운 꼬리 및 변동성 클러스터링입니다.

변동성 클러스터링은 가격의 큰 변화가 방향에 관계없이 다른 큰 변화로 이어지는 경향이 있는 반면, 작은 변화에는 종종 작은 변화가 뒤따른다는 관찰을 말합니다. 이 정량적 표현은 수익률이 상관관계가 없을 수 있지만 절대 수익률 또는 그 제곱은 시간이 지남에 따라 점차 감소하는 작은 양의 상관관계를 나타냄을 시사합니다. 이를 분석하기 위해 시간 경과에 따른 가격 변동의 로그를 나타내는 로그 수익률을 조사합니다. S&P 500의 로그 수익률을 시각적으로 조사하면 2008-2009년과 2020년의 중요한 클러스터와 같이 특정 기간 동안 높은 규모의 클러스터를 관찰할 수 있습니다.

다음으로 지연된 로그 수익률 간의 상관관계를 평가합니다. 특히, 지정된 데이터 범위에 대한 로그 반환에서 통계적으로 유의미한 자기 상관 관계를 찾지 못했습니다. 그러나 로그를 제곱하여 절대 크기에 초점을 맞추면 지연된 며칠 및 몇 주까지 확장되는 강력한 양의 상관 관계가 관찰됩니다. 이는 변동성이 높은 기간에는 지속할 가능성이 높고 변동성이 낮은 기간에도 추세가 계속될 가능성이 있음을 의미합니다. 이 현상을 변동성 클러스터링이라고 합니다.

특정 일수 동안의 롤링 변동성을 시각화하기 위해 거래 창을 선택하고 해당 창에 대한 표준 편차를 계산합니다. 변동성을 연간으로 환산하기 위해 연간 거래일 수의 제곱근(일반적으로 252)을 사용합니다. 이 접근 방식을 통해 특정 기간 동안 실현 변동성이 크게 급증하는 것을 관찰할 수 있습니다.

이 실현된 변동성 프로세스를 모델링하기 위해 Ornstein-Uhlenbeck 공식을 사용합니다. 금융 수학에서 Vasicek 모델이라고도 하는 이 공식은 세 가지 매개변수를 고려합니다. 세타, 가격이 변동하는 평균 변동성; 변동성 자체인 시그마. 우리는 이 분포를 준수하는 관찰된 데이터의 가능성을 최대화하는 매개변수 값을 찾는 것을 목표로 합니다.

이를 달성하기 위해 임의 샘플 및 확률 밀도 함수에 적용되는 최대 우도 추정(MLE) 방법을 사용합니다. 정규 분포의 경우 우도 함수는 매개변수가 지정된 개별 샘플 확률의 곱입니다. 우도 함수의 로그를 취하면 다음과 같이 변환할 수 있습니다.

Ornstein-Uhlenbeck 프로세스의 기대치와 분산을 유도했으므로 이제 이 프레임워크를 사용하여 변동성을 모델링할 수 있습니다. 이를 위해 MLE(Maximum Likelihood Estimation) 방법을 사용하여 시장 데이터에 대한 모델 매개변수를 보정합니다.

먼저 time, math, numpy, pandas, datetime, scipy, matplotlib, pandas_datareader 및 stats 모듈의 plot_acf 함수와 같은 라이브러리를 포함하여 필요한 종속성을 가져옵니다. 또한 2003년부터 S&P 500 데이터를 가져와서 시장 데이터로 사용할 것입니다.

다음으로 금융 시계열에서 변동성 클러스터링의 개념을 살펴봅니다. Volatility clustering은 가격의 큰 변화 뒤에 다른 큰 변화가 뒤따르는 경향이 있고, 작은 변화 뒤에 작은 변화가 뒤따르는 경향이 있는 현상을 말합니다. 우리는 S&P 500의 로그 수익률을 그릴 때 이 클러스터링 효과를 시각적으로 관찰합니다. 우리는 시장 변동성 기간 동안 로그 수익률의 크기가 함께 모여 큰 가격 움직임 사이의 상관관계를 나타내는 것을 볼 수 있습니다. 예를 들어, 우리는 2008-2009년 금융 위기 동안 클러스터를 볼 수 있고 2020년 변동성이 급증하는 것을 볼 수 있습니다.

로그 수익률 간의 상관관계를 정량화하기 위해 자기상관함수(ACF)를 계산합니다. 로그 수익률 자체는 유의미한 자기상관을 나타내지 않지만 제곱 로그 수익률(절대 크기를 나타냄)은 시간이 지남에 따라 서서히 감소하는 작은 양의 상관관계를 나타냅니다. 이러한 절대 크기의 자기 상관은 변동성이 높은 기간이 지속되는 경향이 있는 반면 변동성이 낮은 기간도 지속되는 경향이 있는 변동성 클러스터링의 존재를 확인합니다.

변동성을 더 자세히 분석하기 위해 표준 편차를 계산하고 연간 거래일 수의 제곱근을 사용하여 연간화하여 지정된 일수 동안의 롤링 변동성을 계산합니다. 롤링 변동성을 플로팅하면 변동성이 증가한 기간을 관찰할 수 있으며 이는 실현 변동성이 크게 상승했음을 나타냅니다.

이제 변동성을 모델링하는 데 사용되는 Ornstein-Uhlenbeck(OU) 공식을 소개합니다. OU 모델은 평균 회귀, 평균 수준 및 평균 가격 주변의 변동성을 통합합니다. 모델의 매개변수에는 kappa(평균 회귀율), theta(평균 수준) 및 sigma(변동성)가 포함됩니다. 이러한 매개변수를 추정하기 위해 OU 분포에서 관찰된 데이터의 가능성을 최대화하는 매개변수 값을 찾는 최대 가능성 추정(MLE) 방법을 적용합니다.

매개변수가 주어진 관측 데이터의 결합 확률 밀도 함수(pdf)인 우도 함수에 대해 논의하는 것으로 시작합니다. 정규 분포의 경우 우도 함수는 개별 pdf 값의 곱입니다. 가능도 함수의 로그를 취하면 확률의 곱을 로그의 합으로 변환하므로 계산이 간단해집니다. 매개변수의 MLE(Maximum Likelihood Estimator)를 찾아 관측 데이터의 우도를 최대화하는 값을 결정할 수 있습니다.

OU 프로세스의 경우 로그 우도 함수의 미분 가능성으로 인해 최대 우도 추정치를 찾기 위해 수치적 방법을 사용해야 합니다. scipy.optimize.minimize 함수를 사용하여 최대화 문제에 대한 수치적 솔루션을 제공하므로 음의 로그 우도를 최소화합니다. 로그 우도 함수, 초기 매개변수 및 제약 조건을 정의하여 관측 데이터의 우도를 최대화하는 매개변수를 추정할 수 있습니다.

OU 프로세스의 매개변수를 추정한 후에는 Python을 사용하여 프로세스를 시뮬레이션할 수 있습니다. 시간 단계를 이산화하고 시간 경과에 따른 경로를 얻거나 연속 시간 Itô 프로세스로 시뮬레이션하여 프로세스를 시뮬레이션할 수 있습니다. 후자의 방법은 특정 시간의 변동성 역학을 보다 정확하게 표현합니다.

결론적으로 본문은 시장 변동성 기간 동안 S&P 500에서 관찰되는 변동성 특성에 대해 논의합니다. 변동성 클러스터링의 개념을 소개하고 로그 수익률과 제곱 로그 수익률을 사용하여 그 존재를 입증합니다. 그런 다음 OU(Ornstein-Uhlenbeck) 모델을 변동성을 모델링하는 프레임워크로 도입하고 MLE(Maximum Likelihood Estimation) 방법을 사용하여 모델 매개변수를 추정합니다. 마지막으로 OU 프로세스의 시뮬레이션을 설명하여 시간 경과에 따른 변동성 역학을 분석하고 이해할 수 있습니다.

Trading stock volatility with the Ornstein-Uhlenbeck process
Trading stock volatility with the Ornstein-Uhlenbeck process
  • 2022.03.07
  • www.youtube.com
Understanding and modelling volatility accurately is of utmost importance in financial mathematics. The emergence of volatility clustering in financial marke...
 

무위험 옵션 거래를 위한 마법의 공식



무위험 옵션 거래를 위한 마법의 공식

이 비디오에서는 Breeden-Litzenberger 공식을 사용하여 옵션 가격에서 위험 중립 확률 밀도 함수를 도출하는 방법을 배웁니다. 이 기술은 특히 복잡한 역학 및 고차원 시나리오에서 옵션 가격을 계산하는 데 시간이 많이 걸리고 계산 집약적이 될 때 매우 유용합니다. Breeden-Litzenberger 공식을 사용하면 서로 다른 행사 가격 및 만기 시간 값에 대해 복잡한 파생 상품을 한 번 계산할 수 있으므로 다양한 복잡한 파생 상품의 계산을 단순화하는 위험 중립 확률 분포 함수가 생성됩니다.

시작하려면 위험 중립 확률의 개념을 이해합시다. Feynman-Kac 분석을 통해 위험 중립 확률을 시간(t)에서 최종 위험 중립 확률의 척도(Q)로 정의할 수 있습니다. 누적 확률 분포 함수(F)는 위험 중립 확률 분포를 나타냅니다. 행사가(k)와 만기까지의 시간(tau)으로 시간(t)에 유럽식 콜 옵션의 가격을 책정하는 것은 보상에 대한 위험 중립적 할인 기대치를 취함으로써 수행할 수 있습니다. 이는 (S_t - k)의 적분에 스트라이크(k)와 무한대 사이의 위험 중립 밀도 함수(pdf)를 곱하고 무위험 비율로 할인한 값으로 표현할 수 있습니다.

이 공식에서 직접 위험 중립 확률을 계산하기 위해 1978년의 Breeden-Litzenberger 공식을 사용할 수 있습니다. 여기에는 스트라이크(k)에 대한 적분의 1차 도함수는 마이너스 지수 할인 계수에 다음을 곱한 것과 같다고 명시되어 있습니다. (1 - F), 여기서 F는 누적 밀도 함수입니다. 스트라이크(k)를 중심으로 하는 적분의 2차 도함수는 위험 중립 pdf를 곱한 할인 계수인 pdf를 추출합니다.

이제 이 공식을 Python에 적용하는 방법에 대해 논의해 보겠습니다. NumPy, SciPy, Pandas 및 Matplotlib와 같은 라이브러리를 가져와야 합니다. 예를 들어 Heston 모델에서 확률적 변동성이 있는 유럽식 콜 옵션을 고려할 것입니다. Heston 모델은 기본 자산의 역학과 변동성을 제공합니다. 주가, 파업, 만기까지의 시간, 무위험 이자율과 같은 필수 매개변수와 평균 회귀율, 장기 분산, 초기 변동성, 상관관계 및 변동성의 변동성과 같은 Heston 모델 매개변수를 초기화합니다.

Breeden-Litzenberger 공식을 사용하여 위험 중립 확률 분포 함수를 결정할 수 있습니다. 유한 차분 근사법을 사용하여 2차 도함수를 근사함으로써 다양한 행사 및 만기 시간 값에 대한 위험 중립 분포를 계산합니다. 우리는 특정 성숙도에 대해 2D pdf를 구성합니다.

Heston 모델에서 옵션 가격을 계산하기 위해 특성 함수를 사용하고 직사각형 통합을 사용하여 수치 적분을 수행합니다. 특성 함수를 정의하고 직사각형 통합을 사용하여 지정된 도메인에 대해 복소 적분을 계산합니다. 통합을 위해 선택한 단계 크기는 특히 외가격 옵션의 경우 정밀도에 영향을 미칩니다.

C로 구현되고 보다 정확한 수치 적분을 제공하는 QuantLib 라이브러리와 직사각형 통합을 사용하여 얻은 결과를 비교합니다. 두 접근 방식 간에 약간의 차이가 있지만 평균 제곱 오차(MSE)는 작습니다. 불일치는 주로 Python에서 십진수 값의 이진 표현으로 인해 발생하는 반올림 오류로 인해 발생합니다.

불연속 근사 pdf를 얻은 후 순방향 계수를 곱합니다. 보간법을 사용하여 곡선을 매끄럽게 하고 지속적인 위험 중립 분포 함수를 생성합니다. 마지막으로 이 위험 중립 분포를 사용하여 다양한 복잡한 파생 상품의 가격을 쉽게 책정할 수 있습니다.

결론적으로 Breeden-Litzenberger 공식을 사용하면 옵션 가격에서 위험 중립 확률 밀도 함수를 도출할 수 있습니다. 유한 차분 근사법을 사용하여 2차 도함수를 근사하고 수치 적분을 수행함으로써 다양한 행사 및 만기까지의 시간 값에 대한 위험 중립 분포를 계산할 수 있습니다. 이를 통해 복잡한 파생 상품의 가격을 효율적으로 책정할 수 있습니다.

The Magic Formula for Trading Options Risk Free
The Magic Formula for Trading Options Risk Free
  • 2022.06.05
  • www.youtube.com
In 1978, Breeden and Litzenberger showed how under risk-neutral pricing, that the discounted Risk-Neutral Density (RND) function could be estimated directly...