003 数据攻坚:纸质与电子的博弈 (第1/2页)
清晨五点四十七分,天光刚透出灰白。校门口的报刊亭铁皮门哗啦一声推开,老板打着哈欠挂上灯泡。陈帆站在门口,手里攥着两枚硬币,指节微微发白。
他没说话,只把钱递过去。老板见怪不怪,抽出一份《中国证券报》递来,顺口道:“还是老位置?”
陈帆点头,接过报纸转身就走。这份默契是三天前建立的——头一回他迟了五分钟,报纸已被别人买走,等他在另一家店找到时已是七点,上课铃响过,数据录入整整耽搁一天。从那以后,他每天提前十分钟候在亭外。
校园里空无一人。他绕到实验楼东侧楼梯间,背靠水泥墙坐下,从书包掏出裁纸刀。刀片有些钝了,划过纸面发出沙沙声。他沿着股市版边缘慢慢切割,避开标题栏的折痕,确保每个数字都完整清晰。剪下来的纸页按日期叠好,夹进硬皮文件夹,封面上用铅笔写着“stock_data_v1”。
十天下来,文件夹已厚了一寸。每早六点准时采购、裁剪、编号、归档,动作越来越熟,却不敢有半点松懈。他知道,这些纸片是他目前唯一的数据库。
回到教室时才六点二十。早自习还没开始,座位上没人。他拉开抽屉,取出直尺和铅笔,在数学本上铺开一张裁好的报纸。横轴画时间,纵轴标价格,每一毫米代表零点一元。他对照收盘价一点一点描点连线,指尖压着尺子边缘缓缓移动。
第三天早上,他发现前日的线段偏低。重新核对数据,原本报纸上陆家嘴收盘是7.6元,他却记成了7.5元,导致图表偏差近两个刻度。误差率算下来超过百分之二。
他盯着那条错线看了很久,然后撕下整页,揉成一团塞进桌洞。再翻新页时,先在顶部写了一行字:**每次记录后必须双人复核——若无人配合,则需设计自动校验机制**。
这个念头一旦出现,就像钉子扎进脑子里。他知道人工抄录撑不了太久。信息量越大,出错概率越高,而金融市场里,一个数字差,可能就是一笔亏空的起点。
但他现在什么都做不了。U盘被没收后,他再没机会碰机房电脑。李主任巡查频率增加了,连清洁工进出都要登记。电子路被彻底堵死,至少短期内无法突破。
那就只能先把纸质系统做到极致。
接下来的日子,他调整流程。每天裁剪完报纸后,先在文件夹首页列出当日所有重点股票代码与价格,作为原始台账;绘图时不再直接照搬,而是先对照台账二次确认;每周末统一检查一周图表连续性,查找跳变异常。
效率低得惊人。单是录入一只股票五日行情,就要花去四十分钟。可他别无选择。
林悦是在第十天注意到他的。
那天早晨她来得早,看见陈帆正低头描线,手指紧贴尺边,一笔一划画得极慢。她没出声,只是放下书包时多看了几眼。那不是普通的涂鸦,也不是作业草图——横竖分明,点阵排列,像某种规律图形。
(本章未完,请点击下一页继续阅读)