两人又聊了几句家常,然后挂断了电话。
陈林放下手机,盯着天花板发呆。
春节回家......
他确实需要好好规划一下。
首先是交通问题。
所以这次回江都,估计还是要找付杨青安排。
要么开车,要么坐飞机。
然后是时间问题。
YanHai-30B的模型训练刚刚开始。
按照白迁和潘思的估计,完整训练一轮大概需要一个月左右。
也就是说——
如果他二月中旬回家过春节的话,模型应该还在训练中。
他这个当老板的直接撂挑子走人,好像不太好?
但换个角度想——
训练阶段其实不太需要他。
白迁和潘思都是顶尖的技术专家。
只要流程跑起来了,他在不在都一样。
真正需要他的是训练完成之后的测试和调优阶段。
如果模型效果不好,需要调整架构或者参数,那才是他发挥作用的时候。
所以,先回家过年,等年后再回来盯着,应该问题不大?
陈林揉了揉太阳穴。
这事儿还是明天再想吧。
今天太累了。
——
1月21日。
周三。
上午十点。
陈林准时来到了演海公司的办公室。
刚进门,就看到白迁正在工位上敲敲打打。
潘思坐在旁边,盯着屏幕上的监控面板,表情专注。
沈妍和孙宇也在各自的位置上忙碌着。
云清不在。
应该是今天有课或者出去忙别的了。
“陈总!“
白迁第一个注意到陈林的到来,从椅子上站起来:
“您来了!“
“嗯。“
陈林点了点头,走到白迁身边:
“训练跑得怎么样了?“
“非常顺利!“
白迁的脸上带着兴奋的神色:
“上周和津门超算中心对接完之后,昨天就正式开始跑了。“
他指了指屏幕上的监控面板:
“您看,Loss曲线下降得很稳,没有出现任何异常。“
陈林顺着他手指的方向看去。
屏幕上显示着一条平滑下降的曲线。
从最初的5.x,一路降到了现在的2.x。
趋势非常健康。
“超算中心那边配合得怎么样?“
陈林问道。
“非常配合!“
白迁连连点头:
“孟总工亲自带队对接的。我们的需求他们基本都能满足。“
“而且他们的GPU集群确实强。“
“我估算了一下,完整训练一轮的时间,比我们之前预估的还要短。“
“大概二十五天左右就能跑完。“
二十五天?
陈林心里暗暗盘算了一下。
今天是1月21号。
加上二十五天......
差不多是2月15号左右。
离春节(2月17号)还有两天。
也就是说——
如果一切顺利的话,他可以在春节前看到训练完成的模型。
然后过年期间做一些初步的测试。
年后再回来做详细的调优。
这个时间安排......
似乎还不错?
陈林满意地点了点头。
“继续保持。有问题及时跟我说。“
“好的陈总!“
白迁用力点头。
交代完这边的事情,陈林转身走到自己的工位上坐下。
然后,他掏出手机,给付杨青发了一条消息:
【方便聊聊吗?关于春节回老家的事。】
不到一分钟,回复就来了。