数据清洗是整个架构的核心,主要有五个任务:
- 数据初始化,形成参考指标
- 数据切片并归一化,形成样本集
- 形态识别,针对模型要进行识别的形态进行筛选
- 数据标记,标记形态类型及买卖信号,标记是否达到预期盈利,是否被打掉止损
- 依赖已经定制好的预置买卖策略(目的是尽量降低市场随机性的影响)
- 让模型依据价格行为给出合理的推测
- 参考后续行情,标记后续价格行为的变化
- 目的是让模型针对已经发生的(意外)情况,推出可能发生的后续行情
- 市场没有意外,这里只是站在程序设计角度是意外情况
所以数据清洗服务本质也是一个庞大的框架