유전자 알고리즘을 활용한 시계열 주가 예측 초간단 방법

유전자 알고리즘을 활용하여 시계열 주식을 예측하는 초간단 방법이 있어 소개하고자 한다. 주식을 예측하는 알고리즘은 로봇트레이딩에 가장 중요한 요소일 것이다.

소개되는 방법은 실제 주식 예측에 사용되는 방법이라기보다 예제로써 이해하길 바란다. 유전자 알고리즘을 한 마디로 소개하면 유전자에 규칙을 심어 환경(목적함수)에서 진화시켜 적응하는 유전자만을 추려내면서 학습하는 방법이다. 살아남은 유전자가 결국 찾고자 하는 목적함수에 대한 적합한 해인 셈이다.

유전자 알고리즘으로 시계열 주식을 예측하는 방법을 설명하겠다. 시계열이라는 의미는 일정 시간 간격으로 배치된 데이터들의 수열을 의미한다. (위키백과 발췌) 시계열 주식을 예측하기 위해서는 먼저 예측하고자 하는 대상을 먼저 결정해야 한다. 코스피, 코스닥 또는 특정 종목일 수도 있다.

대상이 결정이 되면 다음은 알고리즘이 이해할 수 있는 수준으로 모델링되어야 한다. 만약 대상 주가가 과거 시점부터 양봉/음봉으로 변화하는 것만 모델링 한다면 11000101… 와 같이 시계열 데이터가 표현될 것이다. 이에 대해 과거 3봉(일) 시계열 데이터를 활용하여 예측한다면 (N=3) 아래처럼 유전자가 모델링 될 수 있다.

000 -> 1 (p_0) // 11000101…
001 -> 0 (p_1) // 11000101…
010 -> 1 (p_2) // 11000101

유전자는 p_0, p_1, …, p_7으로 표현 (101…)

즉, 유전자는 시계열 예측을 하는 방법(규칙)을 지니고 있는 것이다. 수많은 유전자들이 무작위로 생생된다. 유전자 검증(목적함수)는 과거 챠트에 대해서 얼마나 예측을 잘 했는지에 대해서 평가한다. 우수 유전자끼리 교배하고 돌연변이도 발생하면서 진화된다. 환경에 적응하고 진화하면서 비교적 예측을 잘하는 유전자만 살아 남게 되고 최종적으로 적합한 유전자로 주식을 예측하는 것이다.

참조

  • 인공지능을 이용한 빅데이터 처리, 오다카 토모히로 지음, 김성재 옮김, 길벗

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google photo

Google의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중