让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗? 新智元报道 编辑:定慧 当 AI 模型拥有千万级 Token 的超长记忆力时,如何检验它们的真正实力?OpenAI 给出了新答案:MRCR 基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥运会」。MRCR 不仅有助于揭 新闻分类:行业新闻 浏览:2012 阅读全文
AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品 新智元报道 来源:学术头条 具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence 推出全新的π0.5 VLA 模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦 新闻分类:行业新闻 浏览:3663 阅读全文
AI再破2000年前「上古卷轴」!古希腊著作原文首次重见天日 新智元报道 编辑:定慧好困 2000 多年未解之谜被 AI 破解!2025 年,研究人员首次非侵入性地读取到仍卷着的赫库兰尼姆古卷标题。这一突破来自维苏威挑战赛,获奖团队赢得 6 万美元,更为沉睡两千年的古代智慧开启了解读新纪元。 AI 再建一功! 火山灰掩埋的古代智慧,正在被 AI 一点点复活。 新闻分类:其他新闻 浏览:2576 阅读全文
3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限 Video-XL-Pro 团队投稿 量子位 | 公众号 QbitAI 3B 模型超越 Meta 7B 模型,超长视频理解 SOTA 刷新了! 来自上海交通大学、北京智源研究院、特伦托大学的联合研究团队推出了 Video-XL-Pro,实现近一万帧视频的单卡处理,大海捞针准确率超 98%。 现有的多模 新闻分类:娱乐新闻 浏览:1239 阅读全文
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源 超越 YOLOv3、Faster-RCNN,首个在 COCO2017 val set 上突破 30AP 的纯多模态开源 LLM 来啦! 华中科技大学、北京邮电大学等多所高校研究团队共同推出的 Perception-R1(PR1),在视觉推理中最基础的感知层面,探究 rule-based RL 能给模 新闻分类:娱乐新闻 浏览:2223 阅读全文
细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025 MultiGO 团队投稿量子位 | 公众号 QbitAI 从人体单图变身高保真 3D 模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了! 团队最新提出的MultiGO创新方案,借助分层建模思路——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。 这有点像在搭乐高积木:先 新闻分类:国际新闻 浏览:2527 阅读全文
OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到 GPT-4o 更新后“变谄媚”?后续技术报告来了。 OpenAI 一篇新鲜出炉的认错小作文,直接引来上百万网友围观。 CEO 奥特曼也做足姿态,第一时间转发小作文并表示: (新报告)揭示了 GPT-4o 更新失败是因为什么,从中 OpenAI 学到了什么,以及我们将会采取的应对措施是什么。 概括而言 新闻分类:娱乐新闻 浏览:3840 阅读全文
三位北大校友突破65年数学难题!为母校126周年献贺 65 年数学难题新突破! 来自复旦大学的林伟南、王国祯以及 UCLA 的徐宙利合作,解决了 126 维空间的 Kervaire 不变量问题。 三位作者都是北大数院出身,该成果曾作为北大建校 126 周年贺礼做报告,现在完整论文终于上传 arXiv。 △图源:北京大学数学科学学院 他们这次解决的是高维 新闻分类:科技新闻 浏览:3984 阅读全文
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2% BrowseComp-ZH 团队投稿 量子位 | 公众号 QbitAI 你以为大模型已经能轻松“上网冲浪”了? 新基准测试集 BrowseComp-ZH 直接打脸主流 AI。 BrowseComp-ZH 是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO 等机构联合发布的新基准测试集,让 2 新闻分类:其他新闻 浏览:3942 阅读全文
海外最赚钱的中国AI公司,藏不住了 文 | 侃见财经 全球 AI 浪潮强势来袭,商业化爆发“奇点”临近。 4 月 28 日晚间,昆仑万维(300418.SZ)发布 2025 年一季度业绩报告,其中显示,公司一季度实现营业总收入 17.6 亿元,同比大幅增长 46%。整体毛利率高达 69%,继续保持在较高水平。 侃见财经翻看这份财报,最 新闻分类:娱乐新闻 浏览:5319 阅读全文
AI大幅降本,扶起“半死不活”的动漫短剧 文 | 犀牛娱乐,作者|小福,编辑|朴芳 AI 技术增效,让动漫短剧也有了上桌的机会。 短短几年时间,一个动漫短剧演变出了各式各样的类型,动态漫短剧、AI 生成动漫短剧、AI 转绘动漫短剧……看似皆为动漫,却落得同台不同命。 传统动漫短剧成明日黄花 就在几个月之前,动漫短剧还不是那么被看好的生意。 新闻分类:其他新闻 浏览:3503 阅读全文
当你的AI男友不再擦边,MiniMax就“赢”了 文 | 创业最前线,作者 | 冯羽,编辑 | 蛋总 “在使用海螺 AI 生成视频时偶尔会出现‘开盲盒’情况(即存在一定概率描述与生成内容不符),但大模型的本质是一种概率计算,尤其是手部细节是 AIGC 弱项,短期内难以避免。”一位短视频创作者表示。 这款支持文生视频、图生视频的 AI 内容平台上线时 新闻分类:国际新闻 浏览:4275 阅读全文
突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人 衡宇发自凹非寺 量子位 | 公众号 QbitAI 五一节后第一口瓜,曝阿里通义实验室高层人员离职变动! “互联网八卦小喇叭”等多个微信公众号爆料,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级 P10),已于 4 月 30 日低调离职。 他曾带领团队做出通义 App 上全民舞王「兵马俑跳科目三」等 新闻分类:行业新闻 浏览:873 阅读全文
微信下场做抽奖,腾讯挖起自己的流量 文 | 电商在线 刚在春节用蓝包完成一场电商奇袭的腾讯,又搞起大动作。 自 2024 年 12 月灰度测试以来,微信蓝包凭借其“社交送礼”的便捷性迅速崛起。先是靠着送礼物这个独特功能抢夺互联网的流量与关注,随后快速进入用户的聊天页面,成为和红包一样占据C位的聊天框角色。2 月 5 日,微信派发布数据 新闻分类:行业新闻 浏览:1717 阅读全文
哈啰单车,凭什么比公交还贵? 文 | 听筒 Tech,作者 | 陈柯,编辑 | 饶言 悄然涨价的“最后一公里”,用户直呼“骑不起”。 五一假期临近,那些曾靠“30 分钟内 1 元任意骑”俘获无数“旅游特种兵”的共享单车们,在经历一次次坐地起价后,正在被年轻人抛弃。 这些共享单车,不再是“城市慢骑”的首选,这其中,尤以哈啰单车为甚 新闻分类:科技新闻 浏览:1086 阅读全文
TikTok Shop西线有战事 文 | 光子星球 4 月的广州暑气渐起,看似一片火热的广交会上,跨境从业者的脸上却有一丝遮不住的阴郁。 距离“关税大棒”正式落地还有半个月时间,全球最大市场的变故推动大家谋求新路。“大家都在准备退路,转代理甚至直接转行。” TikTok Shop 商家李斌(化名)便是其中之一,在他观察下,不少为跨境 新闻分类:娱乐新闻 浏览:4068 阅读全文
优酷平台预算缩水后的第一剑,指向了男频剧 文 | 首席消费官,作者 | 苏苏 2023 年底,优酷当时剧集业务的负责人在公开讲话中提到,要“以男性赛道撬动平台新增量”。 2025 年,优酷剧集负责人更换后,曾经押注的男性赛道,作品或扑街、或迟迟无法播出、或一直开不了机,或在平台调转发展方向、施行“缩预算、砍集数”方针的影响下,传来了项目“开 新闻分类:其他新闻 浏览:1524 阅读全文
被买爆的大疆Pocket3:“产品流量感”激发品牌势能活水 文 | 品牌议题 01、直男品牌,竟被女生买爆了 一部 2023 年 10 月上线的口袋相机大疆 Pocket 3,竟然在 2025 年 3 月依然断货。“电子茅台”名不虚传,太不可思议了。 一机难求,也有黄牛插脚的原因。第三方平台溢价普遍达 200-500 元,部分商家甚至效仿奢侈品行业的“配货模 新闻分类:行业新闻 浏览:5421 阅读全文
昆仑万维做短剧:收入1.67亿元,月均流水千万美元 文 | DataEye 近日,互联网大厂昆仑万维发布 2024 年年报及 2025 年一季报。 昆仑万维 2024 年度总营收 56.6 亿元,同比增长 15.2%,但归母净亏损 15.95 亿,公司由盈转亏(2023 年净利润达 12.58 亿元)。到了一季度,公司营收达 17.64 亿元,同比增 新闻分类:科技新闻 浏览:5388 阅读全文
取消了“仅退款”,商家就可以高枕无忧了吗? 随着拼多多、淘宝、抖音、快手、京东等多个平台逐步修改售后规则并征求意见,对于“仅退款”问题,各大平台都在征求意见中明确,平台不主动介入消费者的“仅退款”申请。这或许意味着,曾经备受市场争议的“仅退款”问题,宣告落下帷幕。 在过去的“仅退款”条例中,在消费者遇到商品质量存在问题,或与描述不符的情况时, 新闻分类:国际新闻 浏览:4225 阅读全文