被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...
date:2025-08-27 03:34  praise:  views:1513
AIGC:我不是元宇宙的附庸品
“你们是从什么时候开始注意到人类的?”“当第一个原始人开始仰望星空的时候。”AI 的类人猿,早已开始仰望人类。01 来自机器的审视在过去短短的两年间,算法从业者王超岳有过两次被 AI 震撼住的时刻。一 ...
date:2025-08-27 03:13  praise:  views:2333
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
date:2025-08-27 03:11  praise:  views:1559
大模型「点火」,AI for Science 提速
在生产环节中,95% 是一个分水岭。以人为对照标准,人工的准确率在 92% 至 98% 之间,因此,行业对机器容忍度的判别标准取之中位数,未达到 95% 的部分,无论是 80% 乃至 90% 的准确率 ...
date:2025-08-27 02:50  praise:  views:640
国内首个医疗专科推理数据集开源,蚂蚁百灵大模型助力行业落地
12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将有助于提升大模型在医疗领域的专业 ...
date:2025-08-27 02:36  praise:  views:1763
别再声讨零一万物了
最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...
date:2025-08-27 02:24  praise:  views:2234
博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地
生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累,使创新成果更快地转化为产品,连接产业链上下游,也可以为人才的培养和流动提供良好平台。中国已被视为全球AI领域最具竞争力的国家。人 ...
date:2025-08-27 02:14  praise:  views:660
谁将替代 Transformer?
【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...
date:2025-08-27 02:09  praise:  views:541
印度德里地区发生4.5级地震 多地震感强烈
据欧洲与地中海地震中心测定,当地时间7月10日9时04分,印度德里地区发生4.5级地震,震源深度10公里,震中位于北纬28.6065度,东经76.5817度。印度国家地震中心尚未发布有关震中和震级的详 ...
date:2025-08-27 01:55  praise:  views:2555
为每个用户提供专属定制服务,OPPO 安第斯大模型的新卷法
作者丨郭 思编辑丨陈彩娴ChatGPT热潮引发的百模大战,在持续了大半年之后,模型的参数已经卷到极限,越来越多的公司开始意识到,百模大战的下半场,落地应用才是值得卷的地方。而当聚光灯打在OPPO这个手 ...
date:2025-08-27 01:26  praise:  views:2436