사후약방문
요즘 각광 받는 기술 중에 머신러닝이라는 것이 있습니다.
머신러닝, 기계학습 이라는 것은 기계로 하여금 사람과 비슷하게 학습하도록 만든다는 것입니다.
가령 컴퓨터에게 컵이라는 것을 인식시킬 때 계속 ox 문제를 풀게 하는 것입니다. 컵이 맞으면 o, 컵이 아니라 밥그릇이면 x 이런 식으로 ㅋㅋㅋ
그래서 계속 문제를 풀면서 고유한 컵의 특징을 찾아내는 것이 머신러닝에 의한 학습법이라고 볼 수 있습니다.
7~8년 전에 빅데이터 라는 이름이 꽤 유명해지고 나서부터 통계학과에서 나름 이런 논쟁이 있었는데, 빅데이터 분석 방법이라는 것이 아주 새로운 방법은 아니고 오히려 기존에 있던 데이터 마이닝에 새롭게 이름을 붙인 것에 불과하다는 논쟁이었죠. 물론 연산속도에는 차이가 있습니다만.
회귀분석이란 이렇게 찍혀있는 점들을 가장 잘 설명하는 하나의 직선을 그리는 방법입니다.
머신러닝에서도 이런 분석이 똑같이 가능한데요 최근 자료들의 경향을 더 잘 반영해서 최적의 회귀선을 뽑아주는 것입니다.
더 정확하지 않겠느냐 하시겠지만 컴퓨터가 최신 자료에 가중치를 주어 계산을 하다보니 과적합(overfitting)의 문제가 발생하게 됩니다. 즉 최근의 자료를 잘 설명하기 위해서 전체적인 추세를 거스르는 판단을 하게 된다는 것이지요. 단기적으로는 맞을 수 있겠지만 중장기적으로 고려했을 때에는 그렇지 않을 수 있다는 거죠.
www.youtube.com/watch?v=m5NeH8HIsSM&t=1148s
이런 말을 하지 못할 게 뭐가 있겠습니까?
비오는 것을 보며 오늘은 비가 옵니다! 라고 말하는 것을 예측의 영역이라고 할 수 있나요? ㅋㅋㅋ 그냥 중계하는거지
www.youtube.com/watch?v=YQCvkVCU0Xg&t=375s
..;;
ㅋㅋㅋ
제가 볼 때는 사후약방문 아니겠느냐 이말입니다. ㅋㅋㅋㅋ 최근의 트렌드만을 과도하게 반영하다보면 전체적인 추세를 놓칠 가능성이 높아질 것이라고 저는 생각합니다.
물론 저처럼 주식하면..ㅋㅋㅋㅋㅋ 이하 생략..