商业电讯

YOLO Vision 2025 深圳场精彩回顾丨我们聊的不只是 AI 视觉,而是未来如何被更好的「看见」


10月26日,YOLO Vision 2025(YV25)在深圳华侨城创意文化园首次亮相中国。本次大会吸引了200多名与会者亲临现场,还有许多的伙伴们通过Bilibili和YouTube在线参加了活动,在Bilibili共计有2w+的观看量。

这是继今年9月在伦敦举办的YOLO Vision之后,今年举办的第二届YOLO Vision,也是YOLO Vision首次来到中国,我们非常开心能够在深圳和Vision AI社区的小伙伴们一起见面,也非常的荣幸能够邀请到AI领域内知名的企业以及社区一同分享大家的成果以及洞见。

Ultralytics YOLO模型的发展历程

Ultralytics 创始人兼首席执行官Glenn Jocher带来了当天的首场主题演讲,分享了Ultralytics YOLO模型如何从一次研究突破,现在成长为全球最广泛应用的视觉人工智能模型之一。

Glenn 回顾道,自己在早期的核心目标其实很简单——让YOLO更易用。他将模型迁移至PyTorch框架,完善了文档,并将所有成果开源共享,让世界各地的开发者都能在此基础上创新。

正如他回忆的那样:“2018年我一头扎进了这个领域,当时我就知道——这就是我未来要走的路。”

从一位开发者的个人探索开始,YOLO最终发展成了一场全球性的开源浪潮。

Glenn Jocher在深圳YOLO Vision 2025大会上发言

如今,Ultralytics YOLO模型每天为全球数十亿次推理提供动力。Glenn在演讲中提到,这样的成就并非一人之功,而是来自无数人的共同努力。来自世界各地的研究者、工程师、学生、爱好者与开源贡献者,一起把YOLO打磨成了如今这款被广泛使用的视觉AI模型。

“在全球范围内,有近千名贡献者参与其中。我们对此深表感激——没有他们,就没有今天的YOLO。”

Ultralytics YOLO26:迈向更快、更强、更智能的下一代视觉模型

在今年早些时候的YOLO Vision 2025伦敦站上,Ultralytics首次发布了YOLO26。而在深圳站,Glenn Jocher带来了这一模型的最新进展,向AI社区展示了过去数月中它的成长与演进。

Glenn介绍道,YOLO26的设计目标十分明确:让模型更小、更快、更准,同时依然足够实用,适应真实世界的落地场景。过去一年,团队不断打磨架构、在多设备上进行性能基准测试,并广泛吸收社区和研究领域的反馈。团队的核心理念是——在不增加部署难度的前提下,追求最先进的性能表现。

YOLO26的新特性亮点

超参数优化新策略:YOLO26将引入专门的超参数调优机制,从“完全从零训练”转向基于更大数据集的精调策略。这一改变更贴近实际应用场景,让模型更高效地适应多样任务。

更简洁的模型结构:移除了DFL层,使模型结构更轻、更快,同时保持原有精度不变。

原生端到端推理支持:YOLO26原生支持 End-to-End Inference,无需独立的NMS层。这大大简化了模型导出与部署流程(如ONNX、TensorRT等格式),让其在边缘设备上部署更加轻松。

更强的小目标检测能力:新的损失策略优化了对小目标的识别表现,解决了计算机视觉中长期存在的难题。

全新混合优化器(Hybrid Optimizer):受大语言模型(LLM)训练研究启发,YOLO26引入了全新的混合优化器,进一步提升模型精度,并已集成至最新版本的Ultralytics Python包中。

与YOLO11相比,YOLO26在CPU上的推理速度提升最高可达43% ,同时在精度上也实现了显著优化。这让YOLO26尤其适用于嵌入式设备、机器人以及边缘计算系统。

目前,YOLO26计划支持与YOLO11相同的任务类型和模型规模,共计25个模型变体,涵盖检测、分割、姿态估计、旋转框检测及分类等任务,从Nano级到Extra Large一应俱全。

更值得期待的是,团队还在研发5个可提示式(Promptable)模型变体。这类模型能直接根据文本提示生成检测框,无需额外训练,为基于指令的视觉工作流奠定基础,让模型在不同场景下的适应性更强,也更具灵活性。

目前,YOLO26系列仍在积极开发中,但从早期测试结果来看,性能表现相当出色。

Ultralytics Platform:让视觉AI工作流更简单、更开放

在介绍完YOLO26的最新进展后,Ultralytics 产品工程负责人Prateek Bhatnagar登台,为大家带来了Ultralytics Platform的现场演示。

这是一款正在打造中的视觉AI平台,旨在将计算机视觉工作流的关键环节整合到一起——从数据集探索、图像标注、模型训练到结果对比,都能在同一环境中完成。

Prateek Bhatnagar现场演示Ultralytics Platform

Prateek在演讲中强调,平台延续了Ultralytics的开源精神,并引入了两个全新的社区空间:

Dataset Community(数据集社区)

Projects Community(项目社区)

开发者可以在这里共享数据集、复用模型、改进他人项目,让开源协作更加高效。

现场演示中,他展示了平台的多项功能:包括AI辅助标注、便捷的云端训练,以及无需本地GPU即可直接在社区中微调模型的能力。

目前,该平台仍在开发阶段。Ultralytics团队也正在中国扩充研发力量,以更好地支持平台的正式发布与本地化发展。

走进YOLO的幕后:听作者们讲述他们的故事

随着现场氛围不断升温,活动进入了圆桌论坛环节,本次论坛的嘉宾包括Glenn Jocher、Ultralytics高级机器学习工程师 邱靖、YOLOv10 & YOLOE作者之一陈辉,以及YOLOv6作者之一张勃。

YOLO模型发展圆桌论坛嘉宾(从左到右:黄雪莹、陈辉、张勃、邱靖、Glenn Jocher)

本次讨论的核心聚焦在YOLO如何在真实应用中不断演进。 嘉宾们提到,正是实际部署中的挑战不断的推动了YOLO的进步,例如如何在边缘设备上高效运行、提升小目标检测能力,以及简化模型导出流程等。相比单纯追求精度,嘉宾们强调在生产环境中,速度、可用性与稳定性之间的平衡同样重要。另一个共同观点是:持续迭代与社区反馈是推动YOLO成长的关键。

以下是讨论中一些有趣的观点:

开放词汇检测(Open-Vocabulary Detection)正在兴起:新一代YOLO模型展示了视觉-语言对齐与基于提示的工作流如何突破固定类别,实现更灵活的目标检测。

轻量化注意力机制的崛起:嘉宾们讨论了如何在模型中使用高效注意力机制,而非全局注意力,以在保证推理轻量化的同时提升精度,这对边缘设备尤其重要。

与社区“早迭代、快反馈”:嘉宾们倡导“构建—测试—改进”的开发理念,通过更早发布模型、从用户中学习,比漫长的闭门开发周期更能带来优质成果。

从前沿研究到产业落地:视觉AI的新方向

来自全球AI社区的领军人物在现场分享了视觉AI的最新发展趋势——从数字人和机器人,到多模态推理与高效的边缘部署。

以人为中心的 AIGC 与虚拟人技术

来自阿里巴巴通义实验室的张鹏博士介绍了通义实验室Human-AIGC团队在基于视频大模型的可控人物视频生成和实时交互数字人方面的工作与探索。

阿里巴巴通义实验室张鹏博士

他深入解析了当前人物视频生成领域所面临的困境——如生成过程中的可控性不足、过度依赖“抽卡式”结果等问题。随后,他介绍了Human-AIGC团队近期开源的两项成果Wan-S2V与Wan-Animate。这两项模型分别可通过输入音频或模板视频,实现更高可控度的人物生成,如讲话、演唱、动作模仿与视频人物替换等。在此基础上,团队还在探索如何将视频大模型应用于实时、交互式数字人场景。目前的研究方向包括:(1)实时的上下文免训练(in-context zero-shot)的人物形象、动作、音频风格联合克隆(2)wan-animate的lite版本,实时从摄像头的视频驱动图片形象(3)手机端实时运行的极地成本数字人。

软硬协同赋能机器人智能感知

地瓜机器人开发者生态副总裁胡春旭在分享中指出,机器人的“眼睛”和“大脑”正面临前所未有的挑战:复杂多变的场景、实时的决策需求,与有限的功耗和成本之间存在着巨大的矛盾。

地瓜机器人开发者生态副总裁胡春旭

地瓜机器人通过深度软硬件协同设计,推出了高性能、低功耗的计算平台Sunrise以及一站式开发套件RDK,为机器人与视觉应用提供5至128TOPS的强大算力支持。配合高度优化的算法工具链,让YOLO、OCC、双目深度等视觉算法能够快速、高效地转化为机器人稳定可靠的实时感知能力。这不仅让机器人“看得清”,更“看得懂”——能够灵活应对现实世界中瞬息万变的复杂环境,实现真正意义上的智能感知与决策。

PaddleOCR:提取PDF和图片中的结构化数据

百度高级产品经理张晶

在本次分享中,来自百度的高级产品经理张晶回顾了YOLO与PaddleOCR在真实场景中的应用,展示了两者在车牌识别、无人机巡检、文档智能等任务中如何实现从“看见”到“读懂”的协同能力。同时,他介绍了PaddleOCR的发展历程及其在2025年发布的多语言文档解析模型PaddleOCR-VL。他指出,在大模型时代,YOLO与PaddleOCR的结合将为视觉理解和智能应用带来更深层次的合作与创新潜力。

DEEPX与Ultralytics YOLO:端侧与物理世界中的AI实践

在本次大会上,DEEPX销售总监郑韩彬和金禹光分享了与Ultralytics建立合作伙伴关系后的最新进展,介绍了双方在中国与欧洲地区的技术协作与应用落地情况。现场还展示了基于YOLO系列模型的多项性能对比结果,从帧率、AI精度、功耗与能效比等多个维度,与竞品进行了全面对标,充分体现出YOLO在性能与效率上的优势。

DEEPX销售总监郑韩彬和金禹光

同时,DEEPX团队还展示了其主要产品与核心技术,并通过YOLO系列DEMO呈现了端侧视觉AI的实际应用效果。大会还带来了第五代百度飞桨OCR DEMO,并公布了与RTX 2080 Ti平台的性能对比结果,展示了PaddleOCR的强劲表现。最后,双方也分享了DEEPX与百度飞桨的合作进度,展现了在AI生态共建与模型优化方向上的深度协同与探索。

Ultralytics YOLO和CV类模型在E300 SOC上的部署实践

摩尔线程端侧技术负责人刘令飞介绍了E300 AI模组的最新进展。摩尔线程E300 AI模组凭借CPU+GPU+NPU异构融合算力,在端侧实现四路1080P高清视频下YOLOv8s/m模型分别跑到170/101 FPS,充分展现50TOPS INT8稠密算力的实战价值。通过MTNN编译器一键完成INT8量化,与前处理融合,配合Torch-MUSA AOT静态编译,部署时间从小时级缩至分钟级;msys可视化性能分析工具快速锁定瓶颈,指导优化。

摩尔线程端侧技术负责人刘令飞

团队已在Gitee开源40+CV模型,覆盖检测、分割、姿态、OCR、人脸识别等场景,提供从转模型、调优到落地的全套示例,显著降低开发者门槛。未来将继续完善工具链,推动更多YOLO系列及Transformer视觉模型在边缘端高效运行,让“高性能+低功耗”的端侧AI真正触手可及。

RWKV在视觉模型中的应用

围绕“RWKV在视觉领域的应用”,元始智能高级算法工程师岳紫寅详细介绍了RWKV架构在视觉应用的技术优势以及活跃的技术生态,并分享了多篇知名产学研机构使用RWKV技术进行视觉优化的论文与重要成果。

元始智能高级算法工程师岳紫寅

技术展区:看见视觉AI的无限可能

如果说主会场的演讲让人看见了视觉AI的未来,那么展区的现场展示,则让大家切身感受到它已经如何改变现实。在这里,来自众多公司的团队带来了各自最新的技术成果与创新产品,让参会者能够近距离观看模型实时运行、体验不同硬件平台的差异,并与研发团队面对面交流,了解背后的故事与灵感。

从鼓舞人心的主题演讲,到沉浸式的实操展示,YOLO Vision 2025深圳大会充分展现了Ultralytics社区的创新精神与凝聚力。在这场为期一整天的盛会中,研究人员、工程师、学生与开发者们畅所欲言,分享从模型训练到部署落地的实践经验,讲者与参会者们思想碰撞、探索前沿技术,共同描绘出对人工智能未来的愿景,也为Ultralytics YOLO的下一个篇章奠定了坚实的起点。

YOLO Vision的故事仍在继续,未来,我们再相聚于创新的前沿!

来源:大众报业·半岛网


注:此文属于本网登载的商业信息,文章内容不代表本网观点,仅供参考,不作买卖依据。


【责任编辑:崔岳莺】

2025“我要上智运”金石滩总决赛收官,六大项目冠军荣耀诞生

作为对接全国智力运动会唯一的综合性网络赛事,第四届全民健身线上运动会暨中国移动2025“我要上智运”·全民棋牌全国网络大赛总决赛于11月22日在大连金石滩国家旅游度假区圆满落幕。来自全国的212名选手,经过4个月的线上角逐,从数百万参与用户中脱颖而出,展开六大项目的巅峰对决,为公众呈现了一场水准高、互动强、广参与的全民智力运动盛典。

ISPO亚洲运动用品与时尚展厦门开幕 开启沉浸式运动体验

11月21日,ISPO亚洲运动用品与时尚展(厦门站)在厦门国际会议展览中心活力开幕。本届展会在厦门市体育局、厦门市商务局会展处、思明区文旅局、厦门体育集团、厦门会展集团、厦门市贸促会等单位的支持下,积极响应厦门市优化体育营商环境、促进体育消费结构升级、推动运动产业融合发展的城市规划和发展战略。通过“馆内展会+馆外场景”的联动模式,联通全城运动场景,打造户外运动生活周。

联合国 COP30 聚焦全球气候方案,绿之源以室内微生态革命注入中国智慧

当地时间11月16日,《联合国气候变化框架公约》第三十次缔约方大会(COP30)在巴西贝伦召开。作为联合国可持续发展目标"绿色经济解决方案生态伙伴"(2025年9月认证),绿之源品牌代表中国环保企业亮相大会,以"从室内微生态到全球气候行动"为主题发表主旨演讲,将进博会绿色贸易实践成果与全球气候治理议题深度衔接,提出室内空气净化新范式,引发国际社会广泛关注。

锚定“十五五”,“新淮海战役” 以实招硬功书写淮海冠军新篇!

“十五五”开局,国家深入推进制造业高质量发展,轻微型新能源车辆产业进入加速转型的关键阶段。淮海锚定终端突围与招商破局的核心目标,以“新淮海战役”统筹系列终端动销举措,涵盖千城万店网络深耕、区域爆款产品研发、经销商全周期扶持等销售与招商动作,此次《隐形冠军》央视主持人探厂,正是这一"战役"的重要里程碑。国家级权威背书3.27亿次曝光 淮海中国名牌口碑深度渗透从品牌曝光层面,《隐形冠军》央视主持人探厂

丝路融合新引擎!北京丝路融合规划院两大专业委员会在京成立

日前,北京丝路融合规划院宣传工作委员会、中亚工作委员会成立仪式在京隆重举行。2026年联合国秘书长候选人、国际奥委会执行董事会成员、奥林匹克运动会未来举办地委员会主席、克罗地亚前总统科琳达·格拉巴尔·基塔罗维奇一行亲临现场见证,全球政商学界代表齐聚一堂,共绘丝路融合发展新蓝图。

一张小票根,一月暖童心:“儿童友好奇妙品牌月”构建宁波产业友好新生态

11月的一个周末,中国邮政宁波开明街邮政综合体里罕见地迎来了一群儿童小顾客,格外热闹。孩子们手持一本粉黄色小册子,在家长的陪伴下认真挑选着城市主题明信片和科普杂志。带着儿子前来打卡的张女士站在一旁,满眼笑意地说:“这是上周在小宁奇妙快闪乐园领取的门票,里面附有许多品牌的福利和宁波儿童公益活动的报名方式。

「智屏视界」重磅发布,开启OTT营销新纪元

11月18日,上海,由智屏(电视淘宝)、小米电视、海信电视三方联合发起的“2026 OTT营销峰会暨「智屏视界」及AI产品发布会”成功举办。以“营销新主力,上场!”为主题,本次盛会不仅见证了一个全新平台的诞生,更宣告OTT营销正式迈入有规模、有数据、有效果、有AI的新阶段。

欢聚Q3持续回馈:2025-2027年回购与派息规划共9亿美元

11月20日,欢聚集团发布2025年第三季度财报。欢聚集团Q3总收入5.4亿美元,环比增长6.4%。其中,直播业务收入3.88亿美元,实现连续两个季度环比增长;广告技术平台BIGO Ads收入加速增长,达1.04亿美元,同比增长33.1%,环比增长19.7%

百惠金控:香港资本市场具增长空间 AI新股建立正向循环

2025 年,香港资本市场重新走进国际投资者的目光。随着美国通胀降温、全球流动性改善,以及亚洲区内科技及製造业链回流,香港市场交投量回升、新股上市活动增加,呈现出实质復甦迹象。百惠金控指出,港股目前估值仍处吸引水平,加上离岸人民币需求增加,使香港再次成为全球资金佈局的重要节点。

我国首个配置冷却塔的“华龙一号”核电机组建设工作全面启动

11月18日,我国首个配置冷却塔的“华龙一号”核电机组——中广核山东招远核电项目1号机组顺利完成核岛第一罐混凝土浇筑,标志着该项目一期工程建设全面启动。这是党的二十届四中全会作出“建设能源强国”重大部署后首个全面启动建设的核电项目。山东招远核电项目位于烟台招远市张星镇,是中广核在全国布局的第十个核电基地,规划建设6台“华龙一号”核电机组。

咪咕生态大会官宣:中国移动咪咕与亚足联(AFC)开启合作新篇章

11月18日,在2025咪咕生态大会现场,中国移动咪咕与亚洲足球联合会(AFC,简称 “亚足联”)正式官宣签约,达成战略媒体版权合作——咪咕将成为中国大陆多项亚足联国家队及俱乐部赛事的官方媒体合作伙伴,以数字科技内容赋能亚洲足球发展,为亿万球迷打造更优质的观赛与互动体验。作为国内第一体育内容平台,咪咕多年来持续深耕体育领域,并与亚足联建立了深厚的合作基础。

2025敦煌网黑五大促全球启幕:三大战略驱动商家掘金全球市场

年度跨境电商增长重头戏正式登场!敦煌网宣布,2025黑五网一大促全面启动。本次大促集结全年顶级资源投入,以“社群裂变”“AI爆款”“文化出海”为三大核心引擎,并同步推出优质标杆计划,通过“好商、好品、好价格”三维保障,助力商家在全球消费旺季实现销量与品牌力的双重爆发。

健合集团2025年前九个月总营收同比稳健增长12.3%达108.05亿元,三大板块持续释放动能

11月18日,致力于成为全球高端营养及健康产业领导者——健合(H&H)国际控股有限公司(股份代号:1112.HK,以下简称“健合集团”),公布2025年前九个月未经审核营运数据。截至2025年9月30日止九个月,健合集团实现营收同比增长12.3%至人民币108.05亿元,三大核心业务单元全面增长,继续保持稳健的盈利水平与健康的经营现金流转化。

超级工厂+权威认证,淮海与经销商共赴增长新程

近日,央视主持人雷雨甜携《隐形冠军》栏目走进淮海客车智能制造基地,以权威视角全景呈现淮海在轻微型新能源车辆领域的制造实力与战略布局。此次探厂不仅是对一座现代化超级工厂的纪实,更向市场传递出清晰信号,淮海乘用车产业已迈入“智造主导”的全新阶段,正以强劲实力引领行业挣脱价格战泥潭,迈向价值竞争的新高度。

跨区带娃求学难?花生好车为单亲爸爸铺就安心路

38 岁的陈先生是一名单亲爸爸,独自抚养 8 岁的女儿朵朵。为了让朵朵接受更好的教育,他特意将女儿送进了市区的优质小学,可自己租住的老小区在城郊,跨区通勤的难题从此成了他生活的主旋律。直到遇上花生好车,低压力的购车方案不仅解决了接送困境,更让父女俩的亲子时光变得温馨又从容。

2025“我要上智运”大连金石滩总决赛即将开赛,咪咕快游赋能赛事新体验

11月21日至22日,第四届全民健身线上运动会暨中国移动2025“我要上智运”全民棋牌全国网络大赛总决赛将在大连金石滩国家旅游度假区燃情启幕。赛事凭借其权威性、专业性和广泛影响力,持续推动智力运动与全民健身深度融合,并积极探索“赛事+文旅”的创新模式,打造“智力竞技+文旅体验”的全民参与新范式。

太二酸菜鱼公益再升级,为十所高校流浪猫筑“暖房”

太二酸菜鱼旗下公益项目“何英俊猫粮”又有新动作——携手首都爱护动物协会发起“送流浪猫1套房”活动,计划为全国十所高校的流浪猫搭建专属庇护所,将公益关怀从“口粮支持”延伸至“居住保障”,进一步践行品牌“商业向善”的理念。

亚洲纪录荣耀启幕,树立亚洲卓越成就新标杆

近日,聚焦亚洲各领域杰出成就与优秀人才的全新权威荣誉平台——“亚洲纪录”(The Asia Records)正式成立。作为承载亚洲发展期许的权威荣誉项目,“亚洲纪录”致力于重塑亚洲成就认定体系,树立兼具专业性与影响力的全新标准。

透过彩臻板和零醛超净板,看兔宝宝板材里藏着的绿色与智慧

在家居装修的世界里,板材是极不起眼的部分,它隐匿于橱柜、地板之下,默默支撑起整个家的光鲜亮丽,却常常被人们所忽视,俨然一位无名英雄。然而,当人们将目光聚焦于行业头部品牌兔宝宝板材后,才发现这些板材看似普通,却蕴含着环保与健康的密码。
返回
顶部