- 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
- 编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...
- date:2025-08-25 19:00 praise: views:459
- IDEA研究院发布DINO
- 计算机视觉技术在真实世界的应用场景十分广泛。然而,过去主流的小模型方案,难以应对碎片化、多变的长尾需求,限制了技术落地规模。源自自然语言研究的Transformer架构诞生后,视觉模型与之结合,走上一 ...
- date:2025-08-25 18:47 praise: views:795
- 37年人艺经典《天下第一楼》再“开席”
- 来源标题:37年人艺经典《天下第一楼》再“开席”《天下第一楼》剧照。 李春光 摄日前,已演出37年的北京人艺经典剧目《天下第一楼》在首都剧场再次登台“开席”,并将持续上演至6月 ...
- date:2025-08-25 18:11 praise: views:1577
- 《天下第一楼》600场演来如初见
- 来源标题:《天下第一楼》600场演来如初见“好一座危楼谁是主人谁是客,只三间老屋时宜明月时宜风。”这副悬挂于老字号福聚德厅堂中的对联,已在舞台上陪伴观众度过37载春秋。6月2日 ...
- date:2025-08-25 18:08 praise: views:1039
- 若愚科技:基于多模态大模型的机器人“大脑”领导者
- 当前,“四肢发达、头脑简单”的传统机器人已经无法满足千行百业“机器代人”的需求,迫切期待机器人从单一场景自动化向复杂场景智能化的拐点出现。传统机器人实现高阶智能的关键是更加智能的机器人“大脑”。近日, ...
- date:2025-08-25 17:36 praise: views:2855
- Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
- 继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经 ...
- date:2025-08-25 17:32 praise: views:2432
- 实测豆包1.5后,看到了字节不走捷径的底气
- 2025 年 1 月,豆包大模型 1.5 全面上线火山方舟,其中豆包通用模型 pro 在多个权威测评集综合得分优于GPT4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水 ...
- date:2025-08-25 17:30 praise: views:2039
- Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强
- DeepMind闷声干大事,悄悄训练了一个大小只有270M的Transformer模型,居然不需要搜索,就能实现大师级的下棋水平。这几天的推特因为这篇2月份发布的论文吵得不可开交,DeepMind团队 ...
- date:2025-08-25 17:29 praise: views:627
- 抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限
- 来源标题:抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限近日,抖音联合美团出品的精品喜剧系列短剧《葬礼后我竟成大哥卧底》正式上线。自今年年初起,由《喜人奇妙夜》高人气演员参演的《陛下,你走错片 ...
- date:2025-08-25 16:51 praise: views:400
- 朱芷瑩:连续二年闪耀戛纳的中国时尚艺人
- 来源标题:朱芷瑩:连续二年闪耀戛纳的中国时尚艺人 中国时尚艺人朱芷瑩以双重身份闪耀2025戛纳电影节:戛纳红毯展现东方气质,007主题造型诠释"攻击性时尚",从红毯新人到国际盛事常客,她用多元表现力持 ...
- date:2025-08-25 16:36 praise: views:2086