当晚九点。
燕北大学官方围脖、官方公眾號、官方b站帐號,同时发了一条动態。
【重磅!由我校江辰院士独立开发的下一代ai深度学习框架stelris,已在github正式开源!】
【这是目前全球最先进的ai框架,完全免费,欢迎所有开发者下载使用!】
配图是github仓库截图。
以及一张江辰在燕北大学图书馆老位置写代码的侧脸照。
这张照片是唐若曦夏天拍的。
画面里他穿著白衬衫,袖子挽到手肘,手指搭在键盘上,屏幕上密密麻麻全是代码。
她本来只是觉得好看才拍的,没想到被学校拿去当宣传照了。
动態一发,评论区瞬间就炸了。
“臥槽江神自己写了个ai框架还开源”
“stelris这名字好帅!”
“我刚去github看了一眼,还真开源了!文档全是中文加英文双语的!api写得清清楚楚!江神牛逼!”
“等等,你们看介绍了吗比tensorflow先进两代真的假的”
“江神说比tensorflow先进两代,那就是真先进两代,他什么时候吹过牛”
“也是......人家连哥德巴赫猜想都能证明,区区一个ai框架算什么。”
“话不能这么说,搞框架跟搞数学是两码事。tensorflow背后是股歌几千个工程师,江神一个人写的框架,真能打”
“能不能打,下载下来试试不就知道了。”
“对!有没有兄弟已经跑了的来说说使用体验!”
“我跑了!公司显卡刚好空著,就拿nist数据集试了一下。”
“说真的,我到现在手还在抖……同样一个简单的卷积神经网络,用tensorflow训练要跑二十分钟,用stelris只跑了两分钟。”
“两分钟!而且训练过程中的內存占用不到tensorflow的四分之一!”
“臥槽真的假的两分钟你確定不是显卡问题”
“同样的硬体,同样的数据集,同样的网络结构,控制变量法懂不懂就是框架的优化牛逼!而且我刚才又跑了个transforr,训练速度比pytorch快了將近八倍!八倍啊兄弟们!”
“我作证!我也刚跑完bert的预训练,用tensorflow加四张显卡跑了整整两天一夜。”
“刚才用stelris试了一下,同样的数据量,只跑了不到五个小时就收敛了!中间还没崩过一次!全程稳如老狗!这效率简直离谱!”
“五个小时你是认真的吗我之前训bert训了整整三天才勉强收敛,你五个小时就搞定了”
“骗你干嘛!github上已经有其他开发者在跑gpt架构的测试了,初步数据更夸张……同样的参数量,內存占用不到pytorch的三分之一,训练速度是pytorch的十倍以上。”
“十倍!你知道这是什么概念吗也就是说,以前要花半个月才能训完的大模型,现在一天就能跑完!”
“臥槽......真的假的这框架也太猛了吧”
“还有更猛的,你们看文档里那个lora加速模式……在模型微调阶段开启之后,推理延迟能进一步降低到原来的几十分之一,功耗降低到几十分之一。”
“这意味著什么意味著以前在手机上根本跑不动的千亿参数大模型,现在在手机上直接就能用!离线版chatgpt,没网也能跑!(这世界已经有了)”
“离线版chatgpt我的天!这也太离谱了吧!”
“关键是代码质量,我刚花了一个小时读了核心调度的那部分代码,说实话,读完想哭……真的太优雅了。”
“江神的代码风格,就像一个围棋大师在棋盘上落子,每一处都恰到好处,没有一行是多余的。”
“他写的不只是代码,是艺术品。”
“艺术品+1,我一个阿巴p8的同事看完之后沉默了整整半个小时,然后去阳台抽了半包烟。回来之后说了一句:我这五年写的都是屎。”
与此同时。
东大科技部的官方帐號也转发了燕北大学的那条围脖。
附上了简简单单的一句话:
“祝贺江辰院士,东大ai,未来可期。”
这条转发一出,热度瞬间飆到了顶峰。
国家级官方媒体的背书,意味著这件事已经不只是技术圈的自嗨,而是上升到了国家战略的高度。
各大科技媒体的头条迅速更换……
《江辰:从数学天才到ai框架之父》
《一个人的开源项目,挑战股歌几千工程师》
《stelris到底有多强全球开发者连夜实测!》
《东大ai框架横空出世,灯塔国技术霸权宣告终结》
github上,stelris仓库的star数正在以肉眼可见的速度往上涨。
两万、五万、八万,几乎每刷新一次页面,数字就跳一大截。
fork数也在疯狂增长,issue区已经被全世界开发者的反馈和建议塞爆。
“来自高卢鸡的开发者:刚用stelris跑完一个图像识別项目,训练速度比之前用的任何框架都快了至少五倍。江辰,你是神。”
“来自d国的博士生:我正在写毕业论文,研究方向是大语言模型的轻量化部署。stelris的lora加速模式直接帮我解决了困扰我大半年的性能瓶颈!江院士,请收下我的膝盖!”
“来自东大魔都的创业者:我们是个五人的创业小团队,之前一直用pytorch,显卡成本压得喘不过气。”
“现在换了stelris,同样的训练量,硬体成本直接砍到原来的四分之一。江神,你是我的救命恩人!”
“来自岛国的研究员:我花了整整一天的时间,把stelris的底层算子调度代码从头到尾读了一遍。”
“说实话,读完之后我在工位上发呆了很久。这种水平的代码,不是靠『努力』就能写出来的,这是天赋。或者说,是神启。”
短短二十四小时。
stelris的star数突破三十万,fork数突破十万,登上github全球热榜第一,而且热度还在持续攀升。
这数据,已经超过了tensorflow当初发布时的首周表现。
陈小胖躺在床上,左手举著手机,右手抓著酱板鸭,嘴里含含糊糊地念叨著:
“四十万了,四十万了!江神,这简直是屠榜啊!”
隔壁床的李默早已不见人影,正坐在电脑前,屏幕上开著stelris的官方文档,一边看一边往笔记本上记东西,嘴里还念念有词。
陈小胖喊了半天没人理他,坐起来朝李默那边看了一眼,一脸无奈:“疯了疯了,都疯了。”
而江辰本人,此刻正坐在未名湖边的长椅上。
唐若曦靠在他肩上,手里举著手机,屏幕上显示著github的实时star数。
夜风习习,湖面波光粼粼。
“老辰,五十万了。”
“嗯。”
“全世界都在用你的框架,你开心吗”
江辰低头看了看她,然后伸手轻轻揉了揉她的头髮。“还行。”
唐若曦笑了。
她早就知道他会说这两个字。
湖对岸,博雅塔静静矗立,塔尖的灯光映在水面上,像一颗落进湖里的星星。
stelris,星辰。
属於东大ai的星辰大海,才刚刚开始。
……