2014年雷达币研讨会,2014年虚拟货币研讨会官网

  

     

  

  6月19日-23日,全球人工智能计算机视觉领域的顶级国际会议CVPR 2022(计算机视觉与模式识别)在美国新奥尔良举行,线上会议同步举行。尚科技和联合实验室共有71篇论文入选本届CVPR,再创新高,其中近四分之一被聘为口头报告,涵盖了三维视觉、自动驾驶等多个前沿研究领域和方向,继续巩固了在全球计算机视觉研究领域的领先势头。   

  

  自成立以来,商汤和联合实验室在学术峰会上发表了700多篇论文,在各种比赛中获得了70多个世界冠军。同时,商汤也没有把论文数量作为衡量公司技术发展的标准。尚科技联合创始人、研究院院长博士表示:“我们希望通过为研究人员提供高效研究的良好环境,鼓励和引导年轻研究人员从解决行业实际问题的角度出发,做高水平、高质量的研究。”   

  

  在本次CVPR上,商汤科技也参加了多项学术比赛,也取得了令人瞩目的成绩。比如商汤科技、中科院自动化所、上海人工智能实验室联合参加Embodied AI 2022(2022 Embodied Intelligence challenge),在RxR-Habitat circuit获得冠军。作为国际上具身AI研究领域的权威比赛,大赛要求通过自然语言控制来解决室内机器人的导航问题。商汤的方法在效果上实现了90%以上的提升,导航准确率从24.08%提升到45.82%,导航保真度从37.39%提升到55.43%。同时,在为推广基于深度学习的视觉编码技术而举办的CLIC(Challenge on Learned Image Compression)大赛中,商汤科技团队提供的方案成功获得了图像编码赛道的称号,不仅在三个测试码点上都取得了最好的主观评测成绩,而且在所有深度学习方案中解码速度最快。   

  

  推动技术赋能产业,以创新引领行业突破   

  

  尚科技一直鼓励研究团队,关注行业需求和痛点,将研究工作与实际业务场景相结合。近年来,依托SenseCore尚汤艾设备等AI基础设施的建设,商汤在前沿研究领域有了更强的支撑,进一步推动了与行业协作的深化,以AI技术创新引领行业发展。   

  

  例如,在论文《Bailando: 3D Dance Generation via Actor-Critic GPT with Choreographic Memory》中,研究人员提出了一种新的音乐到舞蹈框架Bailando,它可以驱动3D角色随着音乐跳舞,既能保证动作的规范和美感,又能在时间上与不同的音乐节奏保持一致。目前,在AI、云计算等技术能力提升的背景下,数字人的应用范围日益丰富,在社交、游戏、直播、虚拟偶像等领域逐渐融入我们的生活。这项研究无疑为未来的数字人类产业创造更加智能和个性化的角色,满足多样化的需求提供了一个潜在的方向。   

  

     

  

  点云跟踪框架的PTTR图   

  

  近年来,随着自动驾驶和激光雷达技术的发展,基于点云的目标跟踪越来越受到重视。针对点云数据的独特挑战和现有算法的缺陷,商汤研究团队在论文《PTTR: Relational 3D Point Cloud Object Tracking with Transformer》中提出了新颖的点云跟踪框架PTTR,显著提高了多数据集上目标跟踪的精度,为自动驾驶的安全运行奠定了基础。   

  

  尚科技与北京航空航天大学教授联合举办了Robust Models Towers开放世界复杂场景分类大赛。大赛旨在推动安全可靠的人工智能模型研究,鼓励创造更安全可靠的人工智能,支持人工智能技术更可持续的发展。比赛吸引了286支队伍和416名参赛者。6月19日,竞赛在CVPR 2022鲁棒性艺术研讨会上正式宣布了获胜者。   

  

  加强基础设施与生态建设,助力成果生成   

  

  尚科技在学术研究和技术创新方面取得的突出成绩,离不开领先的软硬件基础设施集成的强大计算基础和领先的算法能力,以及商汤学术生态和开源生态建设的长期积累。通过建设并不断完善以SenseCore尚汤艾为核心的基础设施,商汤为技术研发和落地提供了重要的基础支撑。科研人员可以高效地进行科学研究,快速实验和验证新的想法,加快创新和迭代,促进高水平论文的产生,解决产业发展中的问题。   

  

  商汤非常重视学术生态的建设。2017年以来,商汤科技先后与上海交通大学、南洋理工大学、浙江大学成立联合研究院或实验室,与清华大学建立“感知计算”产学研专项,推动建立全球人工智能高校学术联盟,通过与学术界的紧密联系,促进了各类学术成果的产生和国际学术交流与合作。今年6月11日,商汤科技联合全球高校人工智能学术联盟成功举办了“无尽的研究:   

商汤论文分享会”活动,汇聚来自商汤科技以及香港中文大学、浙江大学、南洋理工大学、北京大学等高校的研究学者嘉宾,在线解读在3D视觉、姿态估计、底层视觉、表征学习、场景理解等领域的CVPR 2022 Oral 论文,分享宝贵学术经验。

  

此外,商汤持续巩固开源生态建设。基于视觉算法的开源项目OpenMMLab目前在GitHub已经拥有超过5万颗星,并成功向研究者和业界开源上千个模型。基于决策智能的OpenDILab去年在WAIC大会发布并向学术和工业界开源。在大模型方向,商汤与上海人工智能实验室及高校联合发布了通用视觉技术体系书生INTERN,并开源了OpenGVLab,助力通用人工智能基础研究和生态构建。OpenMMLab还在CVPR期间举办了主题为《OpenMMLab:计算机视觉研究和生产基础平台》的研讨会,邀请学术大咖参与分享讨论,共建开源生态。

  

随着基础设施的构建完善,学术与开源生态的培育,人工智能技术研究的基础将能够更加的稳固、更加宽广。商汤将以此为支撑持续引领人工智能技术创新,加强AI产业落地的深化,加快规模化应用,推动人工智能技术与产业发展不断取得突破。

相关文章