亲,双击屏幕即可自动滚动
正文 第181章 论文通过!
    请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

    最大的质疑点依然集中在时间上。

    “时间太短了!这根本不符合常理!”水木清华计算机版块的一个高楼帖子里,一位认证为某大厂算法工程师的用户发帖分析。

    “异步sgd的算法架构,从建立数学模型,到写代码实现,再到搭建几百个节点的测试环境跑数据,最后排版成纯英文的学术格式。这一套流程下来,一个配合默契的五人博士团队,最快也需要三个月。他一个人几天就搞定了这根本不像人类能够做到的事情。”

    “我也觉得离谱。除非他是个不需要吃饭睡觉的机器人,大脑自带c++编译器。”

    “或者是他背后有一个极其庞大的智囊团,赵阳只是被推到台前的一个学术符號”

    网络上的质疑声一浪高过一浪。

    但对於这些舆论,无论是作为联合培养合作方的燕京大学,还是赵阳的母校燕京林业大学,在经过內部高层紧急磋商后,都选择了保持绝对的克制和沉默。

    燕林大宣传部接到了周立民校长的死命令:不接受採访,不发表声明,不对外確认。

    原因很简单。目前这则消息,仅仅只是nips的一位编辑查理斯发在个人社交帐號上的单方面言论。

    虽然赵阳本人承认了投稿,但学术界有学术界的铁律。在论文没有经过严格的同行盲审、没有拿到官方正式的aept(接收)通知邮件之前,一切都存在变数。

    如果现在校方大张旗鼓地帮赵阳站台宣传,万一后续论文在復现过程中出现哪怕一丁点致命的代码错误导致被拒稿,那两所高校的声誉都会跟著受到严重的牵连。

    学术研究,容不得半点粉饰和浮躁,只能用最终的录用结果说话。

    所以,校方选择了闭嘴。

    外界的网民和媒体找不到官方的回应,只能继续在网络上进行著无休止的猜测。

    而与此同时。

    在美国的几个顶级计算机实验室里,一场极其严苛的代码復现和盲审工作,正在紧张地进行著。

    麻萨诸塞州,剑桥市。

    麻省理工学院计算机科学与人工智慧实验室(itcsail)。

    这里是全球计算机科学研究的最高殿堂之一。

    一间布满各种伺服器机柜和工作站的实验室里。

    分布式计算领域的顶尖专家、csail的资深教授罗伯特,此时面色凝重地坐在主控台前。

    四个小时前,他接到了nips执行会长的紧急私人电话,並签署了严格的保密协议,拿到了那篇署名为yangzhao的盲审论文pdf文件。

    在看完论文第二部分的数学推导后,罗伯特的反应和查理斯完全一样。

    震惊与兴奋。

    这套基於节点延迟时间设置动態指数惩罚权重的数学模型,在理论上有极高的可行性!

    论文里,通过一些分布式结构和特殊方式,规避了之前那些研究者通过复杂的通信锁的错误。

    不过计算机科学是一门实证科学。数学公式再漂亮,如果不能在代码层面跑通,那也就是一堆废纸。

    虽然单看论文,几乎可以確定九成以上没问题,但最终要证实论文可行性,还是需要做实验。

    想到这儿,没有任何迟疑,罗伯特开口叫来了自己实验室最出色的两名博士后。

    “戴维,迈克,把本地的集群切出一块隔离区。准备復现这篇论文里的算法。”

    两名博士后立刻走到副控台前,开始敲击键盘。

    “教授,需要调用多少个节点”

    戴维问道。

    “分配128个物理计算节点,构建一个完全分布式的异步环境。”

    请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

    罗伯特看著论文第三部分的实验参数,稍稍沉吟了一下。

    “按照论文里的设定,向其中40个节点注入隨机网络延迟。延迟范围设置在100毫秒到500毫秒之间,模擬极端恶劣的陈旧梯度环境。”

    “明白。”

    很快,两个博士后开始迅速按照论文之中的实验流程进行操作。

    罗伯特將论文附件中提供的那段核心c++架构代码提取出来,亲自进行编译。

    代码非常简洁,没有一行多余的冗余注释。

    “这种代码风格……简直像是一台精密的机器写出来的。”罗伯特一边检查代码,一边在心里暗自惊嘆。

    十分钟后,编译通过,没有报错。

    “模型部署完毕。数据集使用標准的iage子集。”

    戴维匯报导。

    “开始运行测试程序。叠代周期设定为10000个epoch。”罗伯特下达了指令。

    回车键敲下。

    主控台屏幕上,黑色的终端窗口瞬间开始输出运行日誌。

    三个人站在屏幕前,眼睛地盯著不断刷新的数据行。

    隨著算力的持续满载输出,实验室里的空调系统自动加大了製冷功率。

    二十分钟后。

    终端日誌的滚动停止。一万次叠代周期全部跑完。

    罗伯特亲自移动滑鼠,输入指令,调出了最终的训练loss收敛曲线。

    曲线图页面跳出来。

    整个曲线的形態,和论文中给出的实验数据图表情况几乎完全一致。

    戴维和迈克两个博士后面面相覷,都能看到对方眼中的震惊。

    困扰了他们实验室整整一年的异步网络收敛发散问题,就这样被乾净利落地解决了。

    罗伯特教授站在屏幕前,看著那条红色的收敛曲线。

    他推了推眼镜,深深吸了一口气,然后缓缓吐出来。

    “没有任何造假。数学推导完美,工程代码落地完美。”

    罗伯特的声音在机房里响起。

    “这项技术一旦开源,未来五年內的大规模模型训练框架,都要在它的基础上进行重写。”

    罗伯特转身回到自己的办公桌前。

    他打开nips的內部审稿系统,找到赵阳那篇论文。

    在最终的审稿意见栏里,他没有写长篇大论的评价。对於这种奠基级別的论文,任何修改意见都是多余的。

    他直接勾选了最高级別的评价选项。

    【stro】(强烈建议接收)

    並在补充说明里敲下了一行字。
为您推荐