o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
10% KV Cache实现无损数学推理,这个开源方法解决推理大模型「记忆过载」难题
20瓦就能运行下一代AI?科学家瞄上了神经形态计算
全方位实测首个AI原生浏览器:618比价、写高考作文……网友:再见Chrome
韦东奕论文登数学顶刊,将散焦方程的爆破性研究扩展至d≥4
一句话生成任务专属LoRA,Transformer作者创业公司颠覆LLM微调
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
黄仁勋发布量子计算专用CUDA,预言量子计算机几年内应用,但现在还离不开GB200
何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升
LeCun世界模型出2代了,62小时搞定机器人训练,开启物理推理新时代
小扎“超级智能”小组第一位大佬,谷歌DeepMind首席研究员,“压缩即智能”核心人物
每秒生成超30帧视频,支持实时交互,自回归视频生成新框架刷新生成效率
最大的开源GraphRag:知识图谱完全自主构建
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
o3-pro正式推出,说声“嗨”就花了80美元,思考1+1用时16分钟
18万引大牛Sergey Levine:不是视频模型“学习”慢,而是LLM走捷径
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
20年物理疑云消散,“μ子异常”最新实验未发现显著偏差,标准粒子模型屹立不倒
北大伯克利联手“拷问”大模型:最强Agent也才40分,新基准专治“不听话”的AI分析师
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业