第634章 给学术圈一点小小的北邮震撼 (第2/2页)
但直接这么做,预测精度必然会存在误差,成绩会差一些。
原因很简单,模型最终输出的是五千个选项的概率。
在面对这五万张只有一千种标准答案的验证图片时,通用模型依然会按照五千个类别的范围去预测。
一旦它把图片分类成了比赛规定的一千个类别之外的选项,按照赛制就会被判定为错误。
它还需要时间去针对这一千个特定的类别重新训练,才能做到精准得分。
楚一航没管那么多,直接在终端里输入调用TenSOrFlOW框架的命令。
回车键敲下。
隔壁机房的散热风扇转速瞬间飙升,噪音穿透了玻璃门。
屏幕上开始滚动运行日志。
钟柏盯着显存占用率的监控面板。
“集群的显存占用直接拉满了。”
“九章平台对AMD显卡的调度策略真够暴力的。”
叶言看着进度条。
“处理五万张图片,传统算法少说得跑个两三天。”
“我看这进度,估计一顿饭的功夫就能出结果。”
楚一航往后靠在椅背上。
“这就叫算力碾压。”
十分钟过去。
终端屏幕上的滚动日志停了下来。
最后一行输出了一串统计数据。
钟柏揉了揉眼睛,指着屏幕上的数字。
“我是不是看花眼了?”
叶言凑过去,一个字符一个字符地念出来。
“TOp-1准确率:40.2%。”
“TOp-5准确率:80.5%。”
楚一航保持着靠在椅背上的姿势,摸下巴的手停住了。
郭长征立刻推开钟柏,自己握住鼠标,点开测试代码的日志文件。
他快速检查着数据加载流程和对比逻辑。
“没有发生数据泄露。”
“这个模型的训练集里,不包含这些验证集的数据。”
郭长征得出结论。
“代码没问题,这确实是我们那个通用模型在全新验证集上跑出的真实成绩。”
钟柏倒吸了一口凉气。
“这还只是我们用通用数据训练的基础模型啊。”
“还没专门针对ImageNet的一千个分类做重新训练呢。”
叶言迅速在脑海里计算着行业平均水平。
“目前用传统的SIFT特征提取加上支持向量机算法。”
“在这类复杂图片识别任务上,最高正确率也就只能做到20%到25%。”
楚一航站起身来,看着屏幕。
“20%对40%。”
“这不是同台竞技,这是直接把桌子掀了。”
钟柏激动得满脸通红,直接点开浏览器上ImageNet的官网。
“现在排行榜上还是空的,一个队伍都没上传。”
“楚哥,咱们赶紧把这个测试集的预测结果跑出来,直接上传一波。”
“先拿个40%的成绩挂在榜首。”
“给全世界的学术圈一点小小的北邮震撼。”
“不行,不能传。”郭老师却是摇了摇头。
钟柏满脸写着问号,手悬在鼠标上。
“为什么啊郭老师?这么高的分数,传上去绝对能霸榜个把月。”
郭长征指着打印下来的比赛规则说道,“规则写得清清楚楚,满打满算就五次上传机会。”