超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

新智元报道 编辑:LRST Meta 开源 DepthLM,首证视觉语言模型无需改架构即可媲美纯视觉模型的 3D 理解能力。通过视觉提示、稀疏标注等创新策略,DepthLM 精准完成像素级深度估计等任务,解锁 VLM 多任务处理潜力,为自动驾驶、机器人等领域带来巨大前景。 在当前多模态 AI 发展浪
阅读全文
浙大推出首个「多图应用题」基准GSM8K-V,全面评估 VLM数学推理能力

浙大推出首个「多图应用题」基准GSM8K-V,全面评估 VLM数学推理能力

新智元报道 编辑:LRST 人类能通过视觉线索轻松完成购物找零等日常推理,但现有 AI 模型在类似任务中表现欠佳。浙江大学的研究团队将小学数学题转化为多图视觉基准,评估模型能否「看懂」数学,揭示其跨场景推理短板,为下一代通用智能模型发展提供方向。 「小明买了 3 个苹果,每个 5 元,他付了 20
阅读全文
被H-1B签证折磨10年,前微软科学家用AI「掀桌」

被H-1B签证折磨10年,前微软科学家用AI「掀桌」

新智元报道 编辑:元宇 美国签证体系,尤其在科技人才领域,长期被诟病为成本高、周期长、透明度低。前微软科学家 Priyanka Kulkarni 创办 Casium,尝试用 AI 改造签证服务,把3–6 个月的材料准备缩至 10 个工作日左右;部分案例不到 1 个月即可入职。 一位前微软科学家正在用
阅读全文
扎克伯格急了!Meta内部文件曝光:宁用竞品,也要废掉祖传系统

扎克伯格急了!Meta内部文件曝光:宁用竞品,也要废掉祖传系统

新智元报道 编辑:KingHZ 在 AI 竞赛中,Meta CEO 扎克伯格视时间为唯一敌人,以数百亿美元和九位数年薪抢夺顶尖人才,内部革命加速工程部署,从小时级压至分钟级,只为撕开与 OpenAI、谷歌的差距——这一切,是否预示着超级智能的加速到来? 九位数年薪抢人、数百亿美元押注、部署从「小时级
阅读全文
「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声

「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声

新智元报道 编辑:元宇 近段时间,「死亡互联网理论」刷屏硅谷,OpenAI 创始人兼 CEO Sam Altman、Reddit 联合创始人 Ohanian 等纷纷对其发表评论。失去真实性的网络等同于死亡。AI 生成内容正席卷社交平台,从图片、视频到自动化评论。互联网的未来不在真假之争,而在重拾「真
阅读全文
拍个照就能测秃头等级?蚂蚁这AI医疗App我体验了一下

拍个照就能测秃头等级?蚂蚁这AI医疗App我体验了一下

梦瑶发自凹非寺 量子位 | 公众号 QbitAI 你知道“支付宝”已经杀入 AI 医疗赛道了吧…… 还是马云赐的名——AQ。 反正之前为啥做 AI 医疗,我是没理解马云的战略思考,但直到前两天随手用了用蚂蚁 AQ,这才明白—— 蚂蚁这回不是在做什么医疗 AI,而是拿“看病”这个需求,用 AI 能力完
阅读全文
5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

新智元报道 编辑:犀牛 马斯克忙着把人类送上火星时,也正在地球上进行着一项更私密的实验——「设计」自己的孩子。一场围绕「超级婴儿」的豪赌正在硅谷上演,这究竟是人类进化的未来,还是一场收割精英的精心骗局? 马斯克,这个誓言要将人类文明送上火星的男人,正在地球上进行一场更私密、也更具争议的实验——「优化
阅读全文
AI正在改写地图APP!这一次轮到谷歌了

AI正在改写地图APP!这一次轮到谷歌了

谷歌这回整了个大活儿! 即日起,所有开发者可通过 Gemini API 调用谷歌地图工具,以便轻松将位置感知功能整合进其应用中。 简单粗暴地说,现在但凡你的应用跟“位置”沾边,Gemini 都能立刻调用谷歌地图那套庞大的地理数据库——2.5 亿个地点全给它接通了。 这意味着,无论是餐馆推荐、路线规划
阅读全文
Vidu Q2携王炸登场!「参考生」功能全球上线,APP体验全面革新

Vidu Q2携王炸登场!「参考生」功能全球上线,APP体验全面革新

金磊发自凹非寺 量子位 | 公众号 QbitAI AI 视频领域杀疯了! 发布 Vidu Q2 图生视频不到 2 周,Vidu 又又又更新了,而且直接甩出三张王牌。 首先是 AI 创作者们等待良久的Vidu Q2 参考生功能终于要正式发布了。 此外,Vidu 视频延长功能一来就亮绝杀,最高可延长至五
阅读全文
OpenAI也缺卡!僧多粥少,自曝内部抢卡抢到发疯

OpenAI也缺卡!僧多粥少,自曝内部抢卡抢到发疯

闻乐发自凹非寺 量子位 | 公众号 QbitAI OpenAI 正面临绝对的算力稀缺 总裁 Greg Brockman 自曝内部算力资源争夺严重,已经到了用痛苦与煎熬来形容的程度 说起来也不意外,现在 AI 领域但凡想搞点新东西,算力都是绕不开的坎儿。 在最新访谈中,Brockman 提到,算力是所
阅读全文
ChatGPT也遭殃,亚马逊服务器故障,半个互联网都崩了

ChatGPT也遭殃,亚马逊服务器故障,半个互联网都崩了

克雷西发自凹非寺 量子位 | 公众号 QbitAI 亚马逊一声咳嗽,半个互联网都地震了。 由于亚马逊 AWS 服务器宕机,大量互联网服务被迫中断,ChatGPT 也被殃及。 故障发生在美国东部 us-east-1 区域,是 AWS 全球服务最核心的一块。 根据故障追踪平台 Downdetector
阅读全文
我拿AI给神曲《八方来财》做了个MV,真的好魔性!

我拿AI给神曲《八方来财》做了个MV,真的好魔性!

金磊发自凹非寺 量子位 | 公众号 QbitAI 给歌曲做 MV,现在已经是一个 AI 就能搞定的时代了。 来,请欣赏用 AI 给神曲《八方来财》做的东方赛博朋克MV: 视频地址:https://mp.weixin.qq.com/s/Nu0zJ9aYQm_qHhBOl8zxqw 而这整整一分钟的内容
阅读全文
苹果AI选Mamba:Agent任务比Transformer更好

苹果AI选Mamba:Agent任务比Transformer更好

闻乐发自凹非寺 量子位 | 公众号 QbitAI 都说苹果 AI 慢半拍,没想到新研究直接在 Transformer 头上动土。(doge) 「Mamba+ 工具」,在 Agent 场景更能打! 在最新论文《To Infinity and Beyond》中,研究团队发现: 在长任务、多交互的 Age
阅读全文
ChatGPT千亿tokens,干掉麦肯锡5000名顾问

ChatGPT千亿tokens,干掉麦肯锡5000名顾问

Jay 发自凹非寺量子位 | 公众号 QbitAI 魔幻啊魔幻。 全球顶级咨询公司麦肯锡,居然收到了 OpenAI 最近给 Tokens 消耗大客户颁发的奖牌。 麦肯锡自己还怪自豪的,第一时间就把奖牌 po 到了领英上。 等等,好像哪里不对……但凡过遍脑子,都能察觉出“这份荣耀”有点不对味—— 你花
阅读全文
Anthropic 这两天真“忙”:上线网页版 Claude Code,还让 Claude 搞科研

Anthropic 这两天真“忙”:上线网页版 Claude Code,还让 Claude 搞科研

好消息!刚刚,编程门槛又降低了,用 AI 写代码只需一个浏览器。 今天,Anthropic 推出了他家大热 AI 编程助手 Claude Code 的网页版,用户通过浏览器就能打开,无需在本地安装命令行工具,也不再需要在“终端”中输入复杂的命令了。 此前,Claude Code 主要以命令行工具(C
阅读全文
特斯拉“身不由己”

特斯拉“身不由己”

文 | 伯虎财经,作者 | 楷楷 摘掉车标、砍掉灯带、取消天窗、手动方向盘……不少网友吐槽,这哪是特斯拉的“平民车型”,明明就是一台又贵又简陋的“铁皮车”。 近日,传闻已久的廉价版特斯拉终于揭开面纱。特斯拉在北美市场正式推出了 Model Y Standard 和 Model 3 Standard,
阅读全文