阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
date:2025-08-29 07:51  praise:  views:1852
港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高
探索 AI 和医学结合更多的可能性,是人工智能发展的一个重要命题。AutoML 作为近年来备受瞩目的概念之一,被视为解决算法工程师来提高训练模型效率的一个工具,在工业、农业、零售等诸多场景中均有被使用 ...
date:2025-08-29 07:49  praise:  views:1174
Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节
作者:赖文昕编辑:陈彩娴自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。“世界模型”作为Sora的一大核心亮点,被OpenAI写在 ...
date:2025-08-29 07:43  praise:  views:2824
别再说国产大模型技术突破要靠 Llama 3 开源了
【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...
date:2025-08-29 07:19  praise:  views:733
突发!俄罗斯发动大规模攻击
当地时间10日,乌克兰首都基辅持续传出爆炸声。此前基辅拉响防空警报。此前,俄罗斯国防部9日发布战报称,俄军对乌克兰军用机场基础设施进行了集群打击。乌克兰方面同一天称,俄对乌多个城市发动新一轮大规模攻击 ...
date:2025-08-29 07:19  praise:  views:1024
浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力
去年以来,ChatGPT引爆了新一轮的AI浪潮,随后国内大模型进入“百模大战”的热闹中。如今,一年多过去,国内外的大模型开启了不同的叙事方式,OpenAI已在酝酿GPT5,继续探求通往AGI的路径,而 ...
date:2025-08-29 06:45  praise:  views:715
美图视觉大模型3.0:让设计师做甲方
作者:郭思编辑:陈彩娴ChatGPT之前,国内最近一次的AI热潮是以“AI四小龙”的发展为代表,但这些公司烧钱程度与落地产出的不匹配,令市场倍感失望。时间来到2023年, 在ChatGPT 出来之后, ...
date:2025-08-29 06:34  praise:  views:127
Babel 张海龙:AI Agent 将铸就一支“钢铁雄师”
作者:赖文昕编辑:陈彩娴在刚刚结束的英伟达 GTC 大会上,CEO 黄仁勋描绘了一幅在 AI 大模型影响下软件开发的新蓝图:未来做软件不太可能重头开始写一大堆代码。“很可能你会组建一支 AI 团队。” ...
date:2025-08-29 06:19  praise:  views:891
原创话剧《北去·南归》在京首演:简洁样貌与朴素情感“在场”大放异彩
来源标题:原创话剧《北去·南归》在京首演:简洁样貌与朴素情感“在场”大放异彩一部跨越时代的中国家庭备忘录 流动与守望中寻找“故乡”的精神坐标5月30日,一部近年来鲜少出现的关乎 ...
date:2025-08-29 06:11  praise:  views:866
百川智能发布Baichuan2—Turbo系列API,开启企业定制化新生态
【雷峰网(公众号:雷峰网)消息】12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K 及Baichuan2-Turbo。在 ...
date:2025-08-29 05:54  praise:  views:2979