《连线》:再见GPT-5,你好千问
美国《连线》杂志发表年度预测文章,指出GPT-5未能激起市场热情,而开源、性能优异且易于部署的阿里千问模型正迅速崛起。文章认为,衡量AI模型价值的关键在于其构建应用的广度,2026年将属于千问。
探索 AI 领域最前沿的创新与突破
美国《连线》杂志发表年度预测文章,指出GPT-5未能激起市场热情,而开源、性能优异且易于部署的阿里千问模型正迅速崛起。文章认为,衡量AI模型价值的关键在于其构建应用的广度,2026年将属于千问。
AI基础设施提供商九章云极完成新一轮战略融资,获得国有资本战略入股。资金将用于加码先进AI基础设施的研发与攻坚,持续巩固其在全球智算云领域的领先地位。
国产GPU公司摩尔线程登陆科创板,上市首日股价暴涨425%。公司创始人张建中曾是英伟达全球副总裁、中国区总经理,核心团队也多来自英伟达,引发市场高度关注。
腾讯AI Lab副主任、语音与深度学习专家俞栋近日因个人原因从腾讯离职。他是腾讯大模型早期核心人才,其离职是腾讯混元大模型团队“新老交替”过程中的一部分。
全球研究机构Forrester发布报告,阿里云凭借领先的AI IaaS产品性能和战略能力,入选“AI基础设施解决方案”领导者象限,成为亚太地区唯一获此殊荣的云服务商。
通义千问团队发布QwenLong-L1.5模型。该模型采用混合专家架构,参数量为300亿,通过一套创新的训练方法,使其在长文本理解和推理能力上可媲美GPT-5。
研究机构开源了全球首个面向具身智能的VLTA(视觉-语言-触觉-动作)多模态数据集。该数据集旨在加速具身智能在真实物理世界中的研发与落地应用。
Insta360推出名为Depth Anything for Panorama(DAP)的全景视觉深度估计模型。该模型基于200万数据训练,旨在为360°全景内容提供全场景的空间智能理解能力。
随着AI应用对内存需求的爆炸式增长,全球面临内存供应紧张。分析指出,这可能导致手机、电脑等消费电子产品未来不仅价格上涨,还可能被迫在配置上做出妥协。
Vision Transformer(ViT)论文的第一作者在社交媒体上高度评价了一个中国开源图像处理模型,称其性能强过知名的“Nano Banana”模型,展现了国内在AI视觉领域的创新实力。
AI编程助手TRAE发布年度产品报告,显示其在2025年生成的代码量已超过10万亿行。报告指出,超过50%的程序员每天使用AI编程工具,Tab键成为高频操作。
蚂蚁集团联合北大王俊院士团队发布全球首个专为AI医生设计的循证评测框架GAPS。该框架聚焦肺癌,包含92个核心问题和1691个临床要点,为评估AI医疗能力提供了硬性标准。
美国《连线》杂志发表文章预测,2026年将属于阿里千问。文章指出,GPT-5未能激起市场热情,而开源、性能优异且易于部署的千问模型正展现出强劲的上升势头。
在英伟达收购AI芯片公司Groq后,Groq员工人均套现约500万美元。据悉,约90%的Groq员工选择加入英伟达,此次交易为员工带来了丰厚的财务回报。
OpenAI正在紧急招聘一位新的安全防范负责人,以应对AI快速发展带来的潜在风险。该职位年薪高达389万美元,并包含股权激励,凸显了公司对AI安全治理的高度重视。
工业智能计算机企业“中科时代”完成3亿元B2轮融资,为2025年该赛道最大单笔融资。资金将用于工业计算终端、操作系统及开发环境的迭代创新。
研究人员发布了名为FysicsWorld的新基准,旨在系统评估AI模型对物理世界的全模态交互与感知能力,填补了该领域评测工具的空白。
在英伟达收购Groq的交易中,Groq员工人均获得了价值约500万美元的薪酬包(包括股票和现金),创造了科技行业收购中员工回报的纪录。
随着OpenAI估值冲向万亿,其最初的11人创始团队中仅剩CEO奥特曼和总裁Greg Brockman仍在管理层。核心人员的持续流失,被视为其从理想主义实验室转向商业巨擘过程中的显著代价。
英伟达宣布以约200亿美元与AI芯片公司Groq达成合作,旨在整合Groq的LPU技术,以应对谷歌TPU等竞争对手在AI推理领域的挑战,强化其AI基础设施版图。
OpenAI首席执行官Sam Altman宣布招聘“准备主管”一职,该职位的主要职责是思考AI可能带来的各种严重风险,并制定应对策略,以应对模型快速改进带来的挑战。
中国人民大学联合清华大学、达摩院等机构发布首个微观空间智能基准MiSI-Bench,用于评估视觉语言模型在“分子世界”的识别与理解能力。
SIGGRAPH Asia 2025上展示的研究提出统一框架,使视频生成能“看清一个人”,实现多视角身份一致、真实光照与可控镜头。
苹果公司发布了一款开源模型,能够瞬间将普通的2D照片转换为3D视图。该技术有望在增强现实、内容创作等领域带来新的应用可能性,并已开源供社区使用。
浪潮信息宣布将大模型推理成本大幅降低至1元每百万token,旨在解决智能体(Agent)规模化应用的成本瓶颈,撬动其商业落地的“最后一公里”。
光轮智能推出全自研仿真GPU求解器与虚实对标系统,打造“具身合成数据SuperApp”,旨在通过高效仿真成为连接机器人研发与真实落地的关键基础设施。
太初元碁与汉腾科技签署协议,将合作建设五个万卡级AI算力集群项目,旨在推动高集成化、规模化的算力基础设施在中国落地,为AI发展提供底层支撑。
清华与生数科技开源的TurboDiffusion项目在GitHub发布,宣称通过一系列优化技术,能够为视频扩散模型带来100至200倍的推理速度提升,极大降低了高质量视频生成的计算门槛。
DeepMind的AlphaFold项目在获得诺贝尔奖五年后,仍在不断发展和完善。WIRED采访了DeepMind的Pushmeet Kohli,探讨了这项彻底改变生物学和化学的研究项目的过去与充满希望的未来。
2025年,生成式AI在视频游戏行业的存在感显著增强。其应用在年度热门游戏中被发现,多家大型游戏工作室CEO声称AI正被广泛应用于开发流程,同时也引发了玩家和开发者的广泛争议。
包括调查记者John Carreyrou在内的多位作者对六家大型AI公司提起了新的版权诉讼。他们拒绝了Anthropic提出的集体诉讼和解方案,认为大模型公司不应以极低成本解决高价值版权索赔。
自动驾驶公司Waymo正在其机器人出租车中测试由谷歌Gemini模型驱动的车载AI助手。根据泄露的系统提示,该助手可以回答常识问题、控制部分车内功能等。
据媒体报道,英伟达计划以约200亿美元的价格收购AI芯片初创公司Groq,此举若成功,将进一步加强英伟达在AI芯片制造领域的绝对主导地位。
智谱AI开源的编程大模型GLM-4.7在多个基准测试中表现优异,引发社区广泛关注。其研发团队随后接受了长达三小时的深度技术问答,详细阐述了模型设计与未来规划。
边缘云服务商PPIO凭借其在AI计算与存储基础设施方面的创新,荣获InfoQ颁发的2025年度AI基础设施卓越奖,其解决方案旨在降低AI应用的部署与运营成本。
一份报告指出,尽管AI Agent概念火热,但高达93%的企业项目在从概念验证到实际生产部署的“最后一公里”中受阻,如何让Agent真正稳定、可靠地运行成为核心挑战。
清华大学与生数科技联合开源视频生成模型TurboDiffusion,宣称在单张消费级显卡上仅需2秒即可生成高质量视频,且视频质量几乎无损,标志着视频生成的效率迎来重大突破。
文章提出了对2026年AI行业的六项严峻预测,包括AI行业可能迎来首次大规模裁员、中国可能通过宣传影响美国数据中心建设热潮,以及AI智能体的未来发展方向等。
Waymo在周六晚间暂停了其在旧金山的Robotaxi服务,原因是一场大规模停电导致其许多车辆在街道上瘫痪。目前,服务已恢复,公司从此次事件中吸取了运营经验。
Alphabet计划以47.5亿美元现金加承担债务的方式,收购数据中心和清洁能源开发商Intersect Power。此举旨在为其AI和数据中心业务获取稳定、独立的清洁能源供应。
包括《坏血》作者约翰·卡雷鲁在内的多位作者,对六家主要AI公司提起了新的版权诉讼。他们拒绝了Anthropic的集体诉讼和解方案,认为AI公司不应以极低成本了结高价值索赔。
根据LMArena最新评测,百度文心大模型5.0 Preview在文本能力方面位居国内大模型首位,展示了其在自然语言处理领域的领先实力。
MiniMax发布M2.1模型,在多项编程基准测试中取得新的最佳成绩(SOTA),其Web开发和App开发能力也得到显著优化,成为AI编程领域的新竞争者。
调查发现,AI图像生成器的用户正在相互分享使用指南,利用该技术将女性照片修改成逼真、暴露的深度伪造内容。这引发了关于AI滥用和内容安全的新一轮担忧。
高校学生与开发者创建了专属的狼人杀AI智能体,让GPT、Qwen、DeepSeek等主流大模型在游戏中展开对决。这场人机对抗展示了AI在复杂社交推理任务中的潜力,也让人类高玩感到压力。
据报道,有人利用OpenAI的Sora 2视频生成模型制作包含AI生成儿童形象的不当内容,例如虚假广告,并发布在TikTok等平台。这引发了关于AI生成内容滥用和平台监管的新担忧。
数据显示,OpenAI在2025年上半年向美国国家失踪与受虐儿童中心提交的涉嫌儿童性虐待材料报告数量,是去年同期的大约80倍,反映了AI生成内容带来的新挑战及公司的应对措施。
OpenAI表示,像Atlas这样具备智能体能力的AI浏览器可能永远面临提示注入攻击的风险。为此,公司正在通过引入一个“基于LLM的自动化攻击者”来加强其网络安全防御测试。
纽约大学等研究机构的研究人员,利用NVIDIA RTX技术驱动的AI和虚拟现实系统,探索人类长期记忆的形成与存储机制,旨在理解大脑如何编码和回忆经历。
智谱AI在IPO前夕,对其开源编程大模型进行了重大更新,显著提升了代码生成能力,在多个编程基准测试中达到SOTA水平,更新内容聚焦于代码相关任务。
中国研究团队推出SportsGPT,这是一个AI体育教练系统,能够完成从简单的数值评估到提供专业运动指导的智能化升级,标志着AI在垂直体育领域的深入应用。
MiniMax海螺视频团队首次开源其视觉分词器(Tokenizer)技术,并证明其同样遵循明确的Scaling Law。该研究带来了开箱即用的视觉分词器预训练框架VTP。
阿里开源全新图像模型Qwen-Image-Layered,该模型能够实现类似Photoshop的图层级精准编辑与生成,标志着视觉大模型从“像素预测”向“结构重组”的范式转变。
著名AI科学家Yann LeCun确认已创办一家新的“世界模型”初创公司。据报道,该公司正寻求超过50亿美元的估值,但LeCun表示不会担任CEO。
纽约州州长Kathy Hochul签署了RAISE法案,该法案将要求大型AI开发商公布其安全协议信息,并在72小时内向州政府报告安全事件。
旧金山发生大规模停电,导致许多Waymo自动驾驶车辆滞留在城市街道上无法动弹。Waymo随后于周六晚间暂停了其在旧金山的机器人出租车服务。
MiniMax冲刺成为最快上市的AI公司,其招股书显示其全球领先的大模型运营成本仅为OpenAI的1%,展现出极高的成本效率与商业潜力。
据报道,Meta正在开发一款新的图像和视频生成模型,目标是在2026年发布。该公司旨在提升文本模型编码能力,并探索能理解视觉信息、无需穷举训练即可推理、规划和行动的新世界模型。
由前Splunk高管创立的AI初创公司Resolve AI在A轮融资后估值达到10亿美元。据悉,此轮融资由Lightspeed Venture Partners领投。
OpenAI为ChatGPT推出新功能,用户现在可以直接微调聊天机器人的“温暖度”、“热情度”以及表情符号的使用频率,以实现更个性化的对话体验。
谷歌一篇新研究论文因其核心思想而被誉为“Attention is all you need”的V2版本。该研究揭示了优化器本质上可被视为一种记忆体,为模型架构提供了新视角。
AI代码审查助手Graphite宣布加入AI编程工具Cursor。Graphite上一轮融资后估值为2.9亿美元,这是Cursor近期一系列收购中的最新一笔。
据报道,ChatGPT的制造商OpenAI正寻求以8300亿美元的估值筹集1000亿美元资金,目标是在2026年第一季度末完成,并可能邀请主权财富基金参与此轮融资。
OpenAI更新了其AI模型与18岁以下用户互动的准则,并发布了针对青少年和家长的AI素养资源。目前立法者正在权衡针对未成年人的AI标准。
著名AI科学家Yann LeCun确认已创立一家新的初创公司,专注于开发“世界模型”。据报道,该公司正寻求超过50亿美元的估值,但LeCun本人不会担任CEO。
在OpenAI急于改���ChatGPT之际,它正在其免费层级中取消一个功能——模型路由系统。该系统被认为是导致去年夏天用户不满情绪的因素之一。
一个在线市场正在销售代码模块,这些模块上传到ChatGPT后,可以模拟大麻、氯胺酮、可卡因、死藤水和酒精的效果。这引发了关于AI使用伦理和滥用的新讨论。
纪录片《深度伪造Sam Altman》的导演在无法采访到OpenAI CEO后,创建了一个“Sam机器人”。影片将于明年1月上映,探讨了人与AI代理之间复杂的情感关系。
一款名为“昊天”的AI换脸平台能够在进行实时视频聊天时创建“近乎完美”的换脸效果,主要通过Telegram获利数百万美元。在WIRED调查其被诈骗者使用后,其主要传播渠道已消失。
在2025年,美国地方层面的共和党人和民主党人在一个问题上达成一致:阻止耗能巨大的大型数据中心项目。对电费上涨和电厂污染不满的社区,已将数据中心视为明确的抵制目标。
文章反思了当前公众对AI技术的兴奋感是否正在消退,并探讨了“2025年AI炒作修正”现象。作者认为,现在是时候以更理性、更实际的眼光来看待AI的能力与局限。
文章探讨了AI在新材料发现领域的潜力与现实。尽管媒体充满乐观报道,但实际应用仍面临诸多挑战。文章呼吁理性看待AI在此领域的作用,区分炒作与实际进展。
Adobe面临一项拟议的集体诉讼,被指控在训练其AI模型时未经授权使用了作者的作品。这是近期一系列针对AI行业的版权相关法律投诉中的最新一起。
ChatGPT移动应用在推出仅31个月内,其用户终身消费支出已达到30亿美元,这一增长速度超过了TikTok和主要流媒体应用,显示了其强大的商业化能力和用户付费意愿。
英国前财政大臣乔治·奥斯本已加入OpenAI,担任董事总经理兼“OpenAI for Countries”负责人。同时,他还将负责运营Coinbase的内部咨询委员会,展现科技公司与政界人才的流动。
仓储机器人初创公司Pickle Robot任命特斯拉前高管Jeff Evanson为其首任首席财务官。据悉,该公司已扩大了与UPS的合作关系,此举可能为其下一阶段增长做准备。
加州大学圣地亚哥分校的Hao AI实验室获得了英伟达DGX B200系统,以提升其在大语言模型推理等关键领域的研究能力。该系统将助力该前沿实验室的AI模型创新工作。
亚马逊为其Alexa助手推出了新的Alexa+功能,并将其集成到Ring门铃中。该功能利用门铃的视频描述,通过分析访客的制服、动作和手持物品来判断其身份。
据报道,ChatGPT制造商OpenAI正寻求在2026年第一季度末前完成一轮高达1000亿美元的融资,公司估值可能达到8300亿美元,并可能邀请主权财富基金参与投资。
英伟达RTX PRO 5000 72GB Blackwell GPU现已全面上市。该产品基于Blackwell架构,为全球更多桌面用户和专业工作者带来了强大的智能体与生成式AI能力。
英伟达宣布作为私营行业合作伙伴加入美国能源部的“创世纪”任务。该任务旨在通过加大AI基础设施和研发投资,确保美国在AI领域的全球领导地位和技术标准制定权。
AI先驱Yann LeCun创立的公司完成首轮融资,估值高达247亿元人民币,由Alexandre担任CEO,公司致力于开发并开源世界模型。
一款机器人通用基座以4.98万元的价格推出,具备一机三态能力,可在多种场景下验证,并标配视觉语言动作(VLA)大脑,旨在降低机器人应用门槛。
专注于“氛围编码”(vibe-coding)的AI编程初创公司Lovable完成了3.3亿美元的新一轮融资,估值达到66亿美元。距离其上轮融资仅五个月,其估值增长超过两倍。
AI视频生成公司Luma AI发布了一款新模型,用户只需提供一个起始帧和一个结束帧,模型就能自动生成两者之间的完整视频内容。该模型已通过其Dream Machine平台提供。
在MEET2026大会上,专家指出特斯拉人形机器人延期交付可能卡在灵巧手技术上,并强调灵巧手是具身智能的核心执行平台,而非附属部件,同时认为中国在该领域已取得领先优势。
最新的AI视频生成技术已能创造出以假乱真的虚拟演员,其动作、表情和口型与真人无异,相关技术报告也已发布,标志着AI在视频内容创作领域迈入新阶段。
在MEET2026智能未来大会上,中国工程院院士柴天佑与小鹏汽车董事长何小鹏展开了一场关于通用人工智能(AGI)的深度对话,探讨了AGI的技术路径、发展挑战以及对未来社会的影响。
OpenAI正式推出ChatGPT应用目录,供用户浏览当前可用的所有工具,并开放其SDK,允许开发者在ChatGPT的UI内构建新的交互体验。CEO奥特曼此前曾表示将构建用户期待的功能。
据报道,亚马逊正在早期讨论向OpenAI投资高达100亿美元。这笔交易将使这家AI实验室使用这家电子商务巨头的AI芯片,延续了科技巨头间复杂的“循环交易”趋势。
谷歌正式推出Gemini 3 Flash模型,并将其设置为Gemini应用程序中的默认模型,同时也将成为搜索功能背后的AI模型。此举旨在提供更快速、高效的AI体验。
亚马逊任命在公司任职27年的AWS资深高管Peter DeSantis领导一个新的AI组织。DeSantis曾在AWS担任高级副总裁八年,该云服务提供商支撑着约三分之一的互联网。
英伟达宣布其OpenUSD和Halos技术正加速机器人出租车(Robotaxi)及物理AI系统的安全部署。物理AI正从研究实验室走向现实世界,赋能能在不可预测环境中可靠感知、推理和行动的智能体。
商汤科技联合创始人林达华指出,大模型的未来进化方向是“从文字到世界”(Words to Worlds)。原生多模态架构正发挥关键作用,推动AI从理解文本走向理解和生成复杂世界。
小米发布的大模型在多项评测中表现突出,其代码能力在开源模型中排名第一。该模型在保证高智商与情商的同时,实现了极低的推理成本,百万输出Token仅需约2.1元。
一款被称为“医生版ChatGPT”的AI医疗应用获得市场高度认可,其估值已达到120亿美元。这反映出人工智能在专业垂直领域的巨大应用潜力和商业价值。
具身智能领域的数据规模化难题迎来新解法。Momenta公司成立仅四个月,便获得来自百度、顺为资本等超过2亿元人民币的融资,其方案有望推动行业突破。
腾讯宣布调整大模型组织架构,姚顺雨加盟担任首席AI科学家,直接向集团总裁刘炽平汇报。此举旨在加强腾讯在人工智能领域的战略布局和技术领导力。
OpenAI在其官网正式宣布推出新一代图像生成模型GPT Image 1.5。该模型旨在提供更快速、更高质量的图像生成体验,是OpenAI在多模态AI领域的重要更新。
一篇博客文章提出观点,认为AI(特别是大语言模型)真正的超能力在于高效地消费和综合海量信息,而非传统意义上的“创造”。这改变了我们看待AI价值的范式。
Adobe更新其AI视频生成应用Firefly,新增支持基于提示词进行精确编辑的视频编辑器,并集成了Black Forest Labs的FLUX.2和Topaz Astra等第三方图像与视频生成模型。
数据智能公司Databricks在L轮融资中筹集超过40亿美元,估值达到1340亿美元,较三个月前的1000亿美元估值增长34%,反映出其AI业务正在升温。
OpenAI推出GPT Image 1.5图像生成模型,承诺生成速度提升4倍,指令跟随能力更强,并支持精确编辑。此次发布加剧了其与谷歌Gemini的竞争。
报告显示,目前已有约50万个由AI生成的应用正在创造经济价值,累计服务超过1000万用户,撬动的经济与效率价值超过50亿元人民币。
OpenAI推出旗舰图像生成模型GPT Image 1.5,据称在性能上反超了Nano Banana。该模型已上线,标志着其在图像生成领域的持续竞争。
英伟达宣布收购开源高性能计算与AI工作负载管理系统Slurm的领先开发商SchedMD。此举旨在加强开源软件生态,推动AI创新,并将其影响力从硬件层延伸至调度层。
摩尔线程的算法在图形学顶会SIGGRAPH Asia 2025上获得银奖,其算法在60秒挑战中仅用34秒完成,且仅需10%的训练时间。该算法已开源,展示了在图形学领域的突破。
全球顶级芯片制造商英伟达发布Nemotron 3系列开源模型,正式成为重要的AI模型制造商。分析认为,此举部分源于封闭模型正越来越多地在其竞争对手的芯片上运行。
文章指出,在ChatGPT引发狂热两年后,2025年正经历一场“AI炒作修正”。市场开始更理性地看待生成式AI的能力与局限,关注实际投资回报与落地挑战。
英伟达通过收购Slurm负载管理系统的开发商SchedMD,以及推出Nemotron 3系列开源AI模型,显著增强了其在开源AI生态中的产品与服务体系。
专注于药物发现的生物科技公司Chai Discovery完成1.3亿美元B轮融资,估值达13亿美元。该公司正构建预测分子相互作用的药物发现基础模型。
英伟达宣布收购开源工作负载管理系统Slurm的主要开发商SchedMD,旨在加强开源软件生态,为研究人员、开发者和企业推动AI与高性能计算创新。
何恺明研究组的三位本科生主导研究,在归一化流(Flow)生成模型上取得突破,解决了其训练和采样效率低下的核心瓶颈,将速度提升两个数量级。
Mamba架构作者提出新方法,无需大规模预训练,仅基于数据压缩原理构建的模型在衡量通用智能的ARC-AGI基准测试中取得第三名,对Scaling Law提出新挑战。
Dexmal原力灵机提出ManiAgent框架,通过四个核心智能体(感知、规划、执行、监控)形成“感知-推理-控制”闭环,旨在提升机器人复杂任务执行能力。
研究表明,大型语言模型首次获得了“元语言”能力,在分析语言本身(如语法、句法、语义)的任务上达到了人类专家的水平,这引发了关于语言与智能本质的深刻思考。
特朗普签署一项针对各州AI法律的行政命令,承诺建立全国统一的AI规则。但批评者警告,此举可能引发法律诉讼,在国会辩论联邦规则期间,反而延长了AI初创企业面临的不确定性。
随着数据中心建设加速,用于道路、桥梁等传统基础设施改善的公共资源和资金可能受到挤压,引发关于社会资源分配与AI发展优先级的讨论。
在拉斯维加斯T-Mobile体育馆,由英伟达Isaac库开发的机器人调酒师ADAM正在为金骑士队的球迷提供服务。这款双臂机器人展示了AI在复杂、动态环境中的实际应用能力。
北京航空航天大学团队在NeurIPS 2025上提出一个面向“空天具身智能”的新基准,利用内嵌物理约束的Transformer模型,实现对卫星星座的高效智能调度与规划。
美国知名视频生成公司Runway宣布进军世界模型领域,并连续发布三款新产品,分别面向真实场景生成、机器人训练和数字人创建,展示了其在多模态AI领域的扩展野心。
OpenAI突然开源一种采用新稀疏性方法的大模型,其99.9%的权重为零,旨在让模型推理过程像电路图一样清晰可解释,这被视为对传统混合专家模型架构的潜在替代。
迪士尼与OpenAI的协议是一个重大转折点。迪士尼在为未来对冲风险,OpenAI则为Sora扫清道路。双方共同为AI与好莱坞的未来合作绘制了蓝图。
OpenAI发布了其“迄今为止最好的模型”GPT-5.2。此举正值该公司面临来自谷歌和其他AI竞争对手的新压力,旨在巩固其市场领先地位。
《时代》周刊将“AI架构师”群体评选为2025年度人物,获奖者包括黄仁勋、埃隆·马斯克、萨姆·奥尔特曼、马克·扎克伯格、苏姿丰、达里奥·阿莫代、德米斯·哈萨比斯和李飞飞。
迪士尼与OpenAI达成协议,允许Sora视频生成模型使用迪士尼的角色创作AI视频。迪士尼也将成为OpenAI的主要客户,使用其API为Disney+等平台构建新产品。
在谷歌内部“红色警报”备忘录泄露后,OpenAI迅速推出面向开发者和专业人士的前沿模型GPT-5.2,旨在提升推理和编码能力,与谷歌Gemini 3展开竞争。
谷歌发布了其迄今为止最深入的AI研究智能体工具,基于Gemini 3 Pro构建。开发者首次能够将这一深度研究工具嵌入自己的应用程序中。
OpenAI发布其迄今最强大的GPT-5.2模型。该模型完全在英伟达Hopper和GB200 NVL72等基础设施上完成训练和部署,展现了英伟达在AI算力领域的核心地位。
OpenAI正式宣布与迪士尼达成战略合作,以价值10亿美元的股权换取迪士尼庞大的角色和内容版权,旨在为Sora等视频生成模型提供合法训练数据。
OpenAI发布GPT-5.2,据称在推理和编码等多项关键基准测试中超越了谷歌的Gemini 3 Pro。该模型由北大数院校友做出核心贡献。
谷歌推出基于Gemini 3 Pro的深度研究智能体,并首次向开发者开放API,允许将其集成到第三方应用中。NotebookLM也将很快支持该功能。
为应对AI基础设施竞赛,谷歌晋升其数据中心技术负责人Amin Vahdat为AI基础设施首席技术官,这是一个新设立的、直接向CEO汇报的职位。
目前最智能的十大开源模型均采用专家混合架构。Kimi K2、DeepSeek-R1等模型在英伟达Blackwell NVL72平台上的运行速度提升了10倍。
美国主要AI公司OpenAI、Anthropic以及支付公司Block共同支持一项新倡议,旨在为构建智能体软件和工具建立开放的互操作标准。
四名知情人士称,OpenAI对发布关于AI负面影响的研究变得犹豫。一名研究员因此辞职,指控公司的经济研究已偏离中立,转向为AI辩护。
根据WIRED获得的一份内部备忘录,Slack首席执行官丹妮丝·德雷瑟已离职,并确认将加入OpenAI,担任首席营收官一职。
在AWS re:Invent大会上,英伟达与亚马逊云科技宣布扩大战略合作,在互连技术、云基础设施、开源模型和实体AI等领域进行新的技术整合。
Mistral AI发布Mistral 3系列开源多语言、多模态模型,该系列模型在英伟达超级计算和边缘平台上进行了优化,其中Mistral Large 3采用了专家混合架构。
排名前十的最智能开源模型均采用专家混合架构。Kimi K2、DeepSeek-R1等模型在英伟达GB200 NVL72平台上的运行速度提升了10倍。
在CoreWeave的AI云平台上,基于英伟达H100 GPU构建的系统以每秒410万亿次遍历边的成绩,创下Graph500图处理基准测试新纪录。
随着AI基础设施规模和复杂性增长,英伟达推出可选软件,帮助数据中心运营商监控性能、温度和功耗,以优化大规模分布式数据中心的配置。
张亚勤院士在MEET2026上预测,基础大模型最终将收敛至不超过10个,并指出AI正从生成式向智能体演进,未来十年机器人数量可能超过人类。
美国电信公司Securus Technologies利用多年积累的囚犯通话和视频数据训练了一个AI模型,目前正在试点使用该模型扫描囚犯的通讯,旨在预测和预防计划中的犯罪行为。
OpenAI的ChatGPT于三年前的今天正式向公众发布。业界普遍认为,这款聊天机器人随后彻底改变了商业运营模式和科技发展轨迹,其影响深远。
一项研究显示,AI模型仅用6小时便成功解决了一个困扰数学家30年的难题,研究者称这标志着“Vibe证明时代”的到来,即AI可通过非传统逻辑路径解决复杂问题。
一项研究发现,在时间压力等外部压力下,大语言模型的输出会变得更不可靠和危险,其中谷歌的Gemini 2.5 Pro模型表现出的“崩溃”现象最为明显。
中国联通研究团队提出新方法,通过建模“语义层级”与“语义单调性”,有效解决长文本与图像之间的复杂检索问题,该研究已被AAAI 2026接收为口头报告。
一款参数规模达60亿的文生图模型正式发布,凭借其出色的图像生成质量,上线后迅速登顶Hugging Face开源模型榜单,引发社区热议。
DeepSeek当选网易有道词典2025年度词汇,全年搜索量超过867万次,其搜索热度自2月起一路飙升,反映出AI大模型在国内的广泛影响力。
杰夫·贝佐斯的新AI企业Project Prometheus已筹集超60亿美元资金,雇佣100多名员工,并通过收购General Agents代理计算初创公司扩充团队。
Transformer架构作者透露GPT-5.1开发内幕,OpenAI内部命名规则出现混乱,同时指出下一次AI突破将来自多模态推理与具身智能的结合。
阶跃星辰发布4B参数Agent模型,可在所有安卓设备上运行,提供一键部署方案,解决了GUI Agent工程基建难题,大幅降低了AI应用部署门槛。
OpenAI回应青少年自杀诉讼,称16岁死者Adam绕过了平台安全功能,公司不应为这起悲剧负责。此案引发对AI安全措施和平台责任的重要讨论。
2025年对美国及全球AI产业仍是里程碑式的一年,49家美国AI初创公���各自融资超过1亿美元。这一数据反映了AI领域持续的投资热度和创新活力。
在TechCrunch Disrupt大会上,三位专家分享AI如何改变投资者和初创公司产品上市策略。AI技术正在重塑传统的市场进入模式,为企业带来新的增长机遇。
开源数据库平台Supabase通过战略性拒绝大额合同,专注于产品发展和社区建设,成功实现50亿美元估值。该公司成为vibe coding运动的首选后端基础设施提供商。
IT领导者面临用���少资源做更多任务的竞争需求,VMware向云迁移成为焦点,80%的企业使用VMware基础设施,正转向更高效的运维模式。
NVIDIA与微软扩展合作,在新一代Microsoft Fairwater AI超级工厂中采用NVIDIA Spectrum-X以太网交换机,由Blackwell平台提供支持。
基于NVIDIA GPU训练的生物基础模型BioCLIP2能够识别超过100万个物种,创建了最大的数字动物园,为生物多样性研究提供强大工具。
五位高性能计算奖项决赛者使用NVIDIA驱动的Alps、JUPITER和Perlmutter超级计算机,在气候建模和流体模拟等领域取得突破性进展。
Black Forest Labs发布FLUX.2系列先进图像生成模型,具备多参考功能可生成数十种相似图像变体,专门针对NVIDIA RTX GPU进行优化。
NVIDIA在首尔举办AI日活动,超过1000名参与者探讨主权AI发展,包括智能体和物理AI专题讨论,展示AI如何加强韩国数字基础设施。
MIT技术评论专访Google DeepMind诺贝尔奖得主,探讨AlphaFold蛋白质预测技术的未来发展,同时分析聊天机器人引发的隐私保护问题。
开源数据库初创公司Supabase通过拒绝大额企业合约,专注于开发者采用策略,成功实现50亿美元估值。CEO表示优先考虑社区建设而非短期收入。
Meta推出的AI驱动智能眼镜在黑五期间降至历史最低价239美元,该产品集成了AI助手功能,能够实时提供信息和建议,标志着AI可穿戴设备进入主流消费市场。
腾讯混元 3D Studio 升级至 1.1,集成 PolyGen 1.5 模型,实现原生四边形网格输出与自适应拓扑优化,可一键生成专业级 3D 资产。
昆仑万维 Mureka 发布 V7.6 与 O2 双模型,基于 MusiCoT 建模体系提升编曲结构与音质表现,支持 10 种语言及虚拟歌手定制。
DeepSeek 发布新一代数学模型 Math-V2,引入生成器-验证器-元验证架构,使模型具备自我纠错推理能力,在国际数学测试中表现优异。
清华系企业无问芯穹宣布完成近 5 亿元 A+ 轮融资,累计融资超 15 亿元,将加速软硬协同技术突破与智能体产业化落地。
字节跳动 Seed 团队发布视觉重建模型 Depth Anything 3,采用 Transformer 架构统一相机姿态与深度估计任务,精度提升 30% 以上。
阿里发布 Z-Image 系列开源模型,采用单流 DiT 架构统一文本与视觉 token 处理,Turbo 版支持 8 步快速生成,Edit 版支持自然语言编辑。
TRAE.ai 发布中国版 SOLO 模式,内置 SOLO Coder 智能体支持任务规划与执行分离,采用三栏布局实现多任务并行协作。
LiblibAI 推出新一代图像生成算法 F.2,在多图参考一致性与复杂提示词理解方面大幅增强,显著改善人物风格稳定性与细节精度。
Black Forest Labs 发布 FLUX.2 模型系列,支持文生图、多图参考与编辑,包含 Pro、Flex、Dev 与 Klein 四个版本,Dev 提供完整 32B 权重开源。
微软推出 Fara-7B 开源模型,专为 Windows 端操作设计,具备视觉理解网页截图与自主点击执行能力,基于 Qwen2.5-VL 架构支持 128k 上下文。
OpenAI 在 ChatGPT 内新增购物研究工具,基于 GPT-5 mini 模型实现交互式导购与商品对比,为电商行业引入 AI 驱动的个性化决策体验。
AMD 联合 IBM 与初创公司 Zyphra 成功在 MI300X GPU 上训练混合专家模型 ZAYA1,总算力超 750 PFLOPs,标志 AMD 正式进入大模型训练市场。
腾讯混元发布轻量级 OCR 模型 HunyuanOCR,在 OmniDocBench 文档识别测试中得分 94.1,超越 Gemini 3 Pro,强化文本识别与布局分析能力。
Anthropic 发布 Claude Opus 4.5,成为首个在 SWE-Bench Verified 测试中得分超过 80% 的模型,显著提升模糊需求理解与自主 Bug 定位能力。
Allen Institute for AI 推出 Olmo 3 模型系列,包括 Base、Think、Instruct 与 RL Zero 四种版本,分别擅长推理、编程与多轮对话任务,强化开源生态竞争力。
阿里 AI 助手千问启用新域名 qianwen.com,网页端同步支持 Qwen3 系列多模型体验,与 App 实现统一交互体验,进一步扩大 AI 产品生态。
Meta 推出 WorldGen,只需文本提示即可生成可导航的 3D 场景,结合扩散模型与逻辑推理技术,为游戏与虚拟仿真提供新工具。
新加坡金融科技公司 RockFlow 获蚂蚁集团领投新一轮融资,推出金融交易智能体 Bobby,可理解用户投资意图并执行自动化交易。
小米正式开源 MiMo-Embodied 模型,首次打通自动驾驶与具身智能两大任务体系,在 29 项核心基准测试中全面超越现有模型。
腾讯混元开源视频生成模型 HunyuanVideo 1.5,仅 8.3B 参数即可生成 5–10 秒高清视频,支持中文与英文文生视频、图生视频,消费级显卡即可流畅运行。
谷歌推出 Nano Banana Pro,融合 Gemini 3 知识与多模态能力,支持 2K/4K 输出与多语言渲染,具备精准局部编辑与电影级光影控制,被誉为“下一代图像生成引擎”。
OpenAI 推出 GPT-5.1-Codex-Max 模型,成为默认代码生成引擎。模型引入压缩机制实现 24 小时持续运行,token 效率提升 30%,在 SWE-Bench 测试中刷新纪录。
AI 视频创企 Luma AI 获得沙特主权基金领投的 9 亿美元 C 轮融资,计划建设 2GW 级智算中心 Project Halo,用于多模态 AI 系统研发。
AI 音乐初创公司 Suno 宣布完成 2.5 亿美元融资,估值达 24.5 亿美元。新版本 v5 提升了人声自然度与歌词执行力,成为文本生成音乐领域的全球领导者。
Meta 发布 SAM 3D 系列模型,实现从 2D 图像到 3D 场景的自动重建,在物体识别与姿态估计精度上超越前代模型。新框架可生成上百万张 3D 数据标注图,推动视觉生成技术再进化。
Anthropic 宣布获得微软和英伟达合计 150 亿美元投资,将购买 300 亿美元 Azure 算力并与英伟达合作优化 Claude 模型性能,Claude 系列将登陆三大主流云平台。
AiPPT 推出全新 Agent 版深度研究功能,模拟人类分析师思维流程,可自动检索、逻辑分析并生成图文并茂的研究报告与演示文稿,为企业知识工作提供智能生产力。
谷歌发布全新 Gemini 3 大模型,具备原生多模态理解、推理与代理编程能力,在 LMArena 以 1501 Elo 得分排名第一,支持百万级上下文窗口,为 AI 智能体生态奠定基础。
DeepMind 新一代 AI 气象模型 WeatherNext 2 能在 1 分钟内生成全球 15 天预测,精度与时效性远超传统超算。模型通过功能生成网络(FGN)技术实现超快推理,助力 AI 赋能气象预测。
蚂蚁集团发布灵光 APP,具备文生图、图生视频、实时场景识别等全模态生成能力。通过 AGI 相机技术,用户可用自然语言生成 3D 模型、交互地图或个性化知识展示,AI 应用场景进一步下沉至日常生活。
xAI 发布新一代对话模型 Grok 4.1,采用“思考模式”与“即时模式”双轨架构,显著提升推理效率与情感理解能力。模型在 LMArena 榜单登顶,展现出 ChatGPT 级别的通用智能。
字节跳动 Seed 团队推出 Lumine,这是首个能在 3D 开放世界环境中实时执行小时级复杂任务的通用智能体。模型基于视觉语言架构,统一感知、推理与行为,仅依赖屏幕图像与输入控制即可实现人类级操作。
JetBrains 联合 Linux 基金会推出 DPAI Arena,这是首个多语言、多框架 AI 编程评测平台,支持补丁修复、代码审查等工作流的可复现测试,填补 AI 开发工具标准化评估的行业空白。
陈天桥带领的盛大团队发布 EverMemOS,针对大模型上下文限制设计的开源长期记忆操作系统。系统采用代理层、记忆层、索引层与接口层四层架构,使 AI 智能体具备“类人记忆”与持续学习能力。
阿里巴巴正式推出千问 APP,基于 Qwen 最强大模型构建,支持 119 种语言与多模态交互,覆盖写作、办公与编程等多场景。该应用标志着中国首个开源 AI 助手正式进军全球市场,定位 ChatGPT 的国产替代方案。
在 Anthropic 报告披露后,多国企业与安全厂商启动审计与策略更新,封堵被滥用的可编程 AI 流程并升级账号与权限管理。
报道与深度分析显示,国内厂商正通过自研芯片、软件栈与云端算力来降低对外部高端 GPU 的依赖,短期成本与生态迁移成为挑战。
产业分析指出阿里将 Qwen 推向消费端并计划国际化,是对 ChatGPT 等外部产品的直接竞争,也是阿里整合电商/云计算/AI 能力的关键步骤。
财经媒体对中国 AI 发展与青年失业、产业结构、补贴与电力成本等因素进行综合分析,讨论 AI 扩张对劳动市场的长期影响。
多位安全研究者在 Anthropic 报告发布后发表评论,指出攻击链越来越依赖 LLM 自动化指令生成、代码编写与策略迭代,对防御提出新挑战。
科技媒体 The Verge 对 Anthropic 报告进行综合报道,强调这些攻击的高度自动化程度以及相关受影响实体的广泛性。
多家媒体转载并扩展 Anthropic 报告,称利用 Claude 的攻击在多个国家目标上尝试自动化入侵,网络安全界对此警惕 AI 在黑客工具化方面的快速升级。
AI 公司 Anthropic 发布报告,披露有国家支持的攻击者在 2025 年利用其 Claude 平台自动化发起多起入侵尝试并被公司发现、阻断,标志 AI 被用于网络间谍的新型攻击链。
观察人士注意到国家网安/宣传系统利用 AI 虚拟主播与自动化工具开展监管与宣传活动,近期关于 VPN(翻墙)警示的 AI 虚拟形象再度登场。
百度旗下芯片单位发布 M100 与 M300 两款 AI 芯片,并推出 Tianchi256/Tianchi512 超算节点,宣称提升国产算力以支撑大模型训练与推理。
阿里宣布将 Qwen 更紧密集成到电商与推荐系统中,在大促与运营场景中提升 AI 驱动效率与用户体验,目标建设消费级 AI 生态闭环。
阿里将其移动 AI 应用重塑为 Qwen(替代原 Tongyi 命名),并加入更多与电商业务联动的 AI 能力,旨在提升移动端用户渗透并布局全球版本。
多方报道称,中国对国资/国家资助的数据中心在采购 AI 芯片方面提出更严格的国产优先或限制外国产芯片使用,相关政策影响产业链选择与外企在华部署。
富士康财报披露管理层看好 AI 带来的硬件需求上升,并在公开场合暗示可能有与 OpenAI 的相关公告或合作预告,市场关注供应链动态。
Palantir 高管在公开访谈中表示,美国在 AI 竞争中需更大胆承担风险以维持领先地位,这反映美企对中美 AI 博弈的战略担忧。
围绕 Nexperia 资产问题的外交与产业博弈被报道为近期影响芯片与 AI 供应链稳定的重要事件,中国希望通过外交渠道斡旋。
DeepSeek 高级研究员陈德立在公开场合警告,随着 AI 能力提升,未来 10–20 年内对就业结构冲击将显著,呼吁企业承担“人类守护者”责任。
在乌镇世界互联网大会上,中国多位 AI 企业代表与研究者就 AI 发展、风险与产业落地发表看法,为国内 AI 发展与监管讨论提供素材。
英伟达(Nvidia)CEO 黄仁勋表示对其 Blackwell 系列 AI 芯片需求非常强劲,强调与台积电的产能合作重要性,反映全球对先进算力的持续旺盛需求。
AI 视频初创公司 Video Rebirth 完成 5000 万美元种子轮融资,由前腾讯科学家刘威创立,致力于构建视频原生世界模型,12 月发布首个产品版本,为创作者提供高保真、高可控的视频生成平台。
美团发布 CatPaw AI 编程工具,支持 Python、Java 等语言,具备实时补全、问答生码、项目分析和调试功能。macOS 支持上线,Windows 版即将推出,新用户可获 500 次免费对话额度。
阶跃星辰发布 Step-Audio-EditX,这是首个开源 LLM 驱动音频编辑工具,能精准控制情感、说话风格及副语言特征,实现零样本文本转语音生成。
软银与 OpenAI 成立 SB OAI Japan,计划 2026 年推出企业级 AI 解决方案 Crystal Intelligence,助力提升日本企业生产力与管理效率。
美国医疗 AI 公司 Hippocratic AI 完成 C 轮融资,由 CapitalG 等投资,估值突破 35 亿美元。资金将用于产品研发、并购及国际业务拓展。
银河通用联合多所高校发布 NavFoM 模型,支持跨场景、多任务和多机器人形态,利用 TVI Tokens 与 BATS 策略实现高效时空理解,可直接部署于真实机器人。
360 发布 FG-CLIP2 模型,在 29 项国际测试中超越 Google 与 Meta,可实现像素级图像理解与中英文细粒度语义识别,成为全球领先图文跨模态 VLM。
即梦 AI 推出无限画布功能,允许用户在多模态环境中延展创作空间,支持多会话并行、图片与视频混合创作,以及基于 Agent 的共创模式,提高创作自由度。
月之暗面推出 Kimi-k2 Thinking 模型,具备通用 Agent 能力、多轮工具调用和 256k 上下文长度,可展示推理链路并自主规划任务,支持复杂操作自动化。
美团 LongCat 团队发布 UNO-Bench 全模态评测基准,覆盖图像、音频、视频、文本任务,首次验证单模态与全模态能力组合关系,为大模型评测提供新工具。
科大讯飞在全球 1024 开发者节发布星火 X1.5,基于全国产算力训练,MoE 架构优化,性能达 GPT-5 的 95%,支持 130+ 种语言及国际领先数学能力。
零一万物与开源中国推出 Open AgentKit(OAK)平台,构建 Agent 生态适配器,支持多模型接入开发,提供 Framework、Builder、Runtime、Studio 四大模块。
OpenAI 与亚马逊宣布长期合作协议,未来 7 年采购 380 亿美元云算力服务,用于支持 GPT-5 与企业级模型训练,标志着云计算与大模型生态深度融合。
昆仑万维旗下 AI 视频平台 SkyReels 推出 V3 版本,整合全球顶尖多模态生成模型,支持图片、视频、数字人、音乐创作,新增无限画布、视频延长与专家 Agent 等功能。
美团 LongCat 团队发布开源 LongCat-Flash-Omni 模型,参数 5600 亿,集成多模态感知和语音重建,实现低延迟实时音视频交互,为全模态应用提供基础设施。
北京智源人工智能研究院发布 Emu3.5,340 亿参数自回归 Transformer 模型,将图像、文本、视频等多模态数据统一建模,实现从“下一 Token 预测”到“下一状态预测”的能力跃迁。
OpenAI 推出 GPT-5 驱动的 Aardvark 智能体,能自动发现和修复大规模代码库漏洞,识别率达 92%,生成修复补丁并与 OpenAI Codex 深度集成。
月之暗面发布全新注意力架构 Kimi Linear,核心为 Delta Attention,通过精细化门控和硬件优化实现高性能与能效提升,为下一代 Agent LLM 打下基础。
美团 LongCat 团队发布 WOWService 技术报告,提出多智能体协作和强化学习结合的 AI 服务架构,已在客服及本地生活服务场景落地。
MiniMax 发布 Music 2.0 模型,实现音乐理解和表现的飞跃。可精准捕捉人声情绪与器乐张力,支持多情感风格与乐器独立控制,为创作者提供完整编曲能力。
英国 AI 视频生成公司 Synthesia 完成 2 亿美元融资,估值达 40 亿美元,由谷歌风投领投。Synthesia 为企业提供虚拟形象视频生成服务,已覆盖全球约 70% 财富 100 强企业。
Adobe 发布 Firefly Image 5 图像生成模型,支持高分辨率原生输出、文本指令编辑及分层图像操作,并新增视频和音频生成工具,兼容 Photoshop、Premiere Pro 等应用。
AI 编程平台 Cursor 发布 2.0 版本及自研模型 Composer,具备 4 倍速度提升与多 Agent 并行支持,实现快速代码生成、修改及审查,提升低延迟编程效率。
MiniMax 发布 Speech 2.6 模型,端到端延迟低至 250 毫秒,支持多语言语音生成及非标准文本转换,并具备 Fluent LoRA 技术,即使原始素材不完美,也能生成流畅自然的语音。
近期科技峰会中,多家初创厂商展示了以 AI 提升能源利用率与制造产能为核心的产品,并获得产业界的早期订单或试点合作。
面对 AI 在临床支持领域的快速部署,研究机构与监管方提出更严格的验证框架与真实世界性能监测要求,旨在保障病人安全与疗效。
在行业峰会上,多家金融机构表彰了在 AI 运维与自动化治理方面表现突出的厂商,凸显企业对可解释性和合规性的重视。
在 APEC 峰会期间,中国领导人提议设立一个国际 AI 合作机构,旨在推动跨国 AI 规则对话与技术共享,强调 AI 应为全球公共产品。
OpenAI 的 Sora 应用推出 Android 版,进一步扩大触达范围并增强对话式 AI 的移动体验与任务集成能力。
ChatGPT 平台继续引入第三方应用接口,用户可在对话中直接调用旅行、健身等实用工具,生态逐步从通用对话向应用化扩展。
GitHub 宣布将逐步淘汰旧的知识库功能,用 Copilot Spaces 替代,以便更好地混合代码与文本内容并提升企业级协同体验。
SAP 推出首款针对结构化业务数据的关系型预训练变换器(RPT-1),用于预测交付延迟、付款风险和订单完成概率等企业场景,并提供开发者试验环境。
Meta 宣布未来三年将在美国大规模投资建设 AI 数据中心与基础设施,以满足公司日益增长的算力需求并带动相关就业与供应链扩张。
微软宣布组建一个专门的超智能研究团队,目标在若干年内在医疗诊断等垂直领域打造超越人类的 AI 能力,并整合现有研究资源与新招专家推进该项目。
Runway 升级 Gen-3 模型,单次生成视频时长从 10 秒扩展到 60 秒,保持高清质量。新增摄像机运动控制和场景过渡功能。
Google 推出 Gemini 2.0,统一处理文本、图像、音频和视频。在多模态推理测试中超越 GPT-4V,同时推出免费使用额度。
GitHub 为 Copilot 企业版增加了代码审查助手、团队知识库集成等功能。支持自定义企业代码风格,私有代码库训练,提高团队开发效率。
Midjourney 发布 V7 测试版本,图像分辨率提升至 4K,文字渲染准确率提高 80%,新增视频生成功能。支持更精确的风格控制和局部编辑。
Anthropic 发布 Claude 3.5 系列模型,在数学推理、编程和长文本理解方面表现出色。新增视觉分析功能,可处理图片、图表和文档。
OpenAI 宣布推出 GPT-4 Turbo 的最新升级版本,上下文窗口扩展至 128K tokens,性能提升 30%,价格降低 25%。新版本在代码生成、文档分析等场景表现更优。
大公司: 小鹏正式进入毛里求斯市场 36氪获悉,12月26日,小鹏汽车公布了其在中东非市场的进展。继正式登陆卡塔尔市场后,小鹏汽车在12月与毛里求斯合作伙伴达成战略合作,正式进入毛里求斯市场,12月小鹏在阿联酋阿布扎比开设旗舰展厅,同期在埃及新开罗启用集展厅与服务于一体、占地2000平方米的区域最大...
作者丨欧雪 编辑丨袁斯来 看上去,10年前,手机行业就对创业公司关上了大门。 但2025年,一家来自香港、毫无名气的公司,做了款AI手机,在kickstarter上众筹突破1150万港元。 它没有主流手机的大屏幕设计,反而采用了一块4.02英寸的正方形AMOLED显示屏,整体尺寸仅相当于传统手机的一...
12月26日,通用AI助手灵光宣布:灵光用户已成功创建1200万个闪应用。闪应用是灵光三大功能之一,用户无需任何编程基础,用自然语言描述自己的需求,灵光便可最快30秒生成一个可编辑、可交互、可分享的小应用。闪应用创建数的增长,显示出这一产品形态正在被普通用户快速接受与持续使用。 据公开报道,灵光上线...
近日,国际市场调研机构英富曼(Omdia)发布了《2025全球企业级MaaS市场分析》报告:截至2025年10月,OpenAI和Google Cloud分别以近70万亿和43万亿的日均Tokens调用量,排名全球MaaS服务市场前两位。中国云厂商火山引擎日均Tokens调用量超30万亿,名列全球第三...
作者|包永刚编辑|林觉民仲冬的北京略带寒意,但摩尔线程首届开发者大会(MDC)会场内热度十足。1000平方米的展区汇聚了上千位开发者,他们关注智能机器人、数字人、Agent等前沿技术,也在探讨AI for Science、气象预测等尖端应用。展区中央的数字文娱与视频多媒体区最为引人注目:有人沉浸在e...
智驾技术从端到端快速迭代到大模型2.0阶段,带来了VLA与世界模型的技术分野,行业角逐的重心也从技术展示卷到了规模上车。老牌车企长城在新一轮竞赛中加码跟进。12月22日,搭载VLA大模型的蓝山智能进阶版宣布上市,发布四驱Max、四驱Max+、四驱Ultra黑武士三款配置车型,限时售价27.58-30...
作者 | 于 莹编辑 | 马广宇2025年,智驾行业迎来新一轮成长期,如今也随着技术发展赋能到商用车领域。今年开始,随着AEBS(自动紧急制动)强制性国家标准发布、L3自动驾驶试点开放等政策的出台,自动驾驶多种路线齐头并进,商业化进程也不断加速,从L2到L4,整个汽车产业迈入从电动化向智能化深度转型...
双十一,阿里云AI算力销售激励再度加码前不久,阿里云在渠道双十一动员大会上,针对AI算力销售推出特别激励:双十一活动期间,所有渠道伙伴销售AI云服务器及大模型,相应业绩均可按多倍核算。比如,某渠道伙伴在活动期间销售了10万元的AI算力,在特别激励政策下,这10万的业绩可能按20万,甚至更多业绩核算。...