36氪获悉,跨国科技公司Yandex最近推出YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%,具体取决于架构和参数数量。通过使用YaFSDP减少LLM的训练时间可以节省高达20%的GPU资源。
36氪获悉,特一药业发布公告,公司拟以7000万元—1.2亿元回购股份,回购股份用于股权激励或员工持股计划。
2024-06-11
8点1氪|西贝创始人贾国龙道歉,罗永浩发文回应;宗馥莉或另立门户,启用新品牌“娃小宗”;9月机票价格大跳水:不少航线低至1到2折
早该淘汰的机械停车位,终于要“凉了”
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业