小原文学网
首页 > 都市言情 > 都大学了小学系统才来无防盗 >

第三百零二章 给自己安排任务

章节目录

  挂断电话后。

  陈林靠在椅背上。

  没有马上有所行动。

  他看着窗外的天空。

  思绪有些飘远。

  这几个月,演海公司关于大模型的工作进展速度已经算是非常快了。

  从最开始的YanHai-1.5B。

  到现在的YanHai-30B。

  每一步都走得很扎实。

  测试数据也确实亮眼。

  同等参数量级下,碾压所有开源模型。

  甚至和国际顶尖的闭源模型相比,也能缩小一部分原来的差距。

  但是......

  陈林心里很清楚。

  想要真正追赶上大漂亮那些主流大模型的差距。

  道阻且长。

  他想起了去年11月份的事情。

  那时候他研究出的那套可以大幅降低大模型幻觉率的算法。

  一度把华尔街和大漂亮股市搅得天翻地覆。

  AI板块暴跌。

  市值蒸发超万亿美元。

  然而几个月过去了。

  情况已经完全不一样了。

  大漂亮那边不断有新消息放出来。

  这个巨头发布新模型。

  那个巨头宣布技术突破。

  一波接一波的利好消息。

  之前那一波大跌的跌幅早就收回来了。

  股市甚至还创出了新高。

  好像什么都没有发生过一样,只有那些上了过高杠杆导致爆仓的散户,成为了巨大波动的牺牲品

  陈林对此并不意外。

  大漂亮毕竟是蓝星第一的金融强国。

  对于金融市场的掌控能力是其他国家望尘莫及的。

  而且更关键的是......

  大漂亮那些科技巨头在AI硬件上的垄断式领先。

  陈林想起了一个多月前的新闻。

  NVDA发布了一个叫做“Context Memory Platform“的新架构。

  4个DPU支持100TB/net。

  每个GPU分配的存储增加到了16GB。

  消息一出。

  大漂亮股市的存储板块迎来一波疯涨。

  连泡菜国的叁丧电子都跟着喝了汤。

  直接创了股价新高。

  这就是硬件优势带来的话语权。

  无论软件层面多么努力。

  硬件上的差距始终是一道难以逾越的鸿沟。

  陈林深吸了一口气。

  收回了飘远的思绪。

  他在心里给自己打气。

  正是因为这样。

  自己的努力才更为重要。

  华夏在硬件上暂时追不上。

  那就在软件和算法上多下功夫。

  用更好的算法架构来弥补算力的不足。

  这正是演海一直在做的事情。

  “行了。“

  陈林自言自语道:

  “感慨归感慨,该干活还得干活。“

  他站起身。

  朝白迁和潘思的工位走去。

  ......

  ......

  白迁和潘思正在讨论刚才会议上的内容。

  看到陈林走过来。

  两人都抬起头。

  “陈总,有什么事?“

  白迁问道。

  陈林在他们旁边找了把椅子坐下。

  “计划有变。“

  他直接说道:

  “刚才廖部长打电话来了。“

  白迁和潘思对视了一眼。

  都露出了好奇的神色。

  陈林简单说明了一下情况。

  YanHai-30B要在全国范围内推广。

  科技蔀那边非常重视。

  津门超算中心会提供算力支持。

  他们演海这边需要尽快把推理服务开发好。

  白迁听完,若有所思地点了点头。

  “推理服务的开发不算复杂。“

  他说:

  “但如果要支持大规模并发的话......“

  “确实需要花点时间做优化。“

  潘思也点了点头。

  “主要是部署和运维那块。“

  他补充道:

  “大规模集群的推理服务,稳定性是第一位的。“

  “不能出任何岔子。“

  陈林笑了笑。

  “所以......“

  他看着两人:

  “之前定下的神经发育程序融合YanHai-1.5B的研发计划,暂停一下。“

  “先把推理服务这块搞定。“

  他顿了顿:

  “计划不如变化嘛。“

  白迁和潘思都没有异议。

  毕竟推广YanHai-30B是一件大事。

  某种程度上比神经发育程序的研发还要紧迫。

  “那人员怎么安排?“

  潘思问道。

  陈林想了想。

  “推理服务这个项目不算大。“

  他说:

  “潘思你来当项目经理。“

  “白迁当架构师。“

  “我、沈妍、孙宇三个人打下手。“

  他笑着补充道:

  “够用了。“

  潘思和白迁都点了点头。

  这个配置确实够用。

  推理服务的开发虽然需要一定的技术功底。

  但和从零开始训练一个大模型相比。

  难度完全不是一个量级的。

  “那就这么定了。“

  陈林站起身:

  “尽快开干吧。“

  “目标是一周之内完成开发和测试。“

  “下周一正式部署上线。“

  “没问题。“

  白迁和潘思异口同声地回答。

  ......

  项目正式启动。

  白迁作为架构师。

  很快就把整体框架拿了出来。

  大模型推理服务这块。

  各大科技巨头其实已经做得非常成熟了。

  有很多现成的开源方案可以参考。

  什么vLLM、TensorRT-LLM、TGI......

  每一个都有大量的生产环境验证。

  白迁没有闭门造车。

  而是在这些成熟方案的基础上进行改造。

  针对YanHai-30B的特殊架构做了一些定制化的优化。

  “我们的架构天然适合做推理优化。“

  白迁一边画图,一边解释:

  “因为计算复杂度本身就比Transformer低。“

  “再加上一些工程层面的trick......“

  “推理速度应该能做到非常可观。“

  他在白板上画了一个大致的系统架构图。

  分为几个核心模块:

  模型加载模块、请求分发模块、推理计算模块、结果返回模块。

  还有一些辅助模块:

  日志模块、监控模块、安全模块......

  “整体架构就是这样。“

  白迁放下马克笔:

  “接下来我细化一下每个模块的技术方案。“

  “然后交给潘思来分配任务。“

  潘思点了点头。

  “我这边已经在准备任务拆解了。“

  他说:

  “等白迁的方案出来,我就开始分工。“

  效率很高。

  毕竟都是老手了。

  ......

  大约一个小时后。

  白迁把详细的技术方案整理好了。

  发到了公司内部的协作平台上。

  潘思看完之后。

  开始进行任务拆解和分配。

  “白迁负责核心的推理计算模块。“

  他一边说,一边在任务管理工具上创建卡片:

  “这块技术难度最高,需要你来把关。“

  白迁点了点头。

  “没问题。“

  “我负责请求分发模块和结果返回模块。“

  潘思继续说道:

  “这两块和系统架构关系比较大,我来处理。“

  他看向孙宇:

  “孙宇,你负责日志模块和监控模块。“

  “这两块相对简单,但很重要。“

  “一定要做得细致。“

  孙宇立刻挺直了腰板。

  “保证完成任务!“

  他的声音很响亮。

  态度很端正。

  潘思满意地点了点头。

  然后他看向沈妍:

  “沈妍......“

  他想了想:

  “你负责模型加载模块吧。“

  “这块涉及到一些数学层面的优化。“

  “正好发挥你的特长。“

  沈妍点了点头。

  “好。“

  最后,潘思看向陈林。

章节目录
书友推荐: 亮剑:从晋西北到长津湖百战百胜 无敌从我看见BOSS血条开始 你这辈子就是让游戏给害了! 战锤:从种田开始重塑黄金时代 每日结算,我以神通铸长生 在美漫当幕后黑手的日子 龙族:败犬女主太多了 人在狼旅,军令执行就变强 我的末世领地 篮坛神迹 霍格沃茨:别叫我制杖师 我在大明当文豪 诸天道祖,从遮天开始 说好破产工厂,咋成了科技帝国? 玩家请上车 诸天恶兽,我以牛鬼蛇神为食 让你去变形,没让你去扶贫 红尘尸仙 抗战:兵王的批量制造 入劫封神,开局司掌风雷三灾