人工智能算法完成_ 深度 | 旷视人工智能算法平台Brain 凭什么在乌镇互联网大会获奖?

10月20日至22日,第六届世界互联网大会在中国乌镇召开。 在本次大会的研究方法“世界互联网的顶尖技术成果”的发表活动中,人工智能独角兽发表了被称为Brain的人工智能算法平台。 据联合创始人兼首席技术官唐文斌介绍,BrAIn说:“这是一个端到端的AI算法平台,旨在使研发人员获得从数据到算法产业化的全面技术能力,无需制造车轮就能推动ai的快速着陆。 我们的BrAIn还引进了AutoML技术,可以训练算法,创造ai”

人工智能算法完成

如果算法模型是果实,那么开发它的环境和框架就是培育果树的土壤。 在日常开发中,框架和基础环境并没有受到那么多关注,但是如果没有这些基础技术的支持,就无法实现优秀的想法和想法。 目前,深度学习社区基本上被TensorFlow和PyTorch两个框架所独占。 开源框架具有很高的人气和易用性,但在国际环境变化无法预测的巨大背景下,依赖这些框架是否是充分的保险,同时,如果企业有新的想法和业务需求,开源框架能够完美实现吗? 我能无缝地融入商业吗? 这些都是AI企业应该考虑的问题。

因此,从2014年开始研究深度学习框架,至今构筑了以AI为中心开发的整体系统。 许多人误以为这只是一个深刻的学习框架,或者是企业内部开发的云计算平台。 事实上,Brain是拓展视野、支持内部算法研究与开发的基础。

Brain复盖了深度学习算法开发的整个过程

具体而言,Brain复盖了深度学习算法开发的所有阶段。 从数据的获取、清洗、预处理、标记和存储,到研究人员设计算法框架、设计实验环节、构建培训环境、培训、加速、调整、模型效果评估和生成,BrAIn为视野广泛的研究开发人员提供了一站式全过程ai工程

在总体框架中,Brain主要分为三个部分。 其中包括主体深度学习算法开发框架MegEngine、提供计算能力支持的MegCompute以及提供数据服务和支持的MegData。

Brain人工智能算法平台被视野内的所有员工使用。 2017年获得3个COCO冠军,2018年获得4个COCO冠军,今年推出新的通用物体检测数据集Objects365与Brain的功绩密切相关。

MegEngine :最佳效能

MegEngine的整体体系结构

mega引擎是基于计算图像的深度学习框架,与大部分开源深度学习框架相比,mega引擎具有以下优点

运算速度快: MegEngine具有动态静态耦合的内存优化机制,比TensorFlow快

内存占有量较少:通过分析整个执行方案的内存使用情况,MegEngine能够充分优化内存,尤其是子线性内存的优化,支持复杂的网络结构,自动利用一些冗馀计算来减少内存占有量,达到两个层次,进行更大规模的模型训练

易于使用: MegEngine封装了平台详细信息,使新用户能够立即使用

支持多硬件平台和异构计算: MegEngine支持通用CPU、GPU、FPGA和其他移动设备侧硬件,可以通过多卡机进行培训

训练配置一体化:整个框架在训练的同时支持推理,实现模型的一次训练,实现多种设备配置,避免复杂转换过程造成的性能下降和精度损失。

另外,MegEngine集成了最新的automotive技术,对深度学习算法的关键要素进行了自动化设计、检索和优化。 该技术以One-Shot方法为核心,通过一次训练完成自动化过程,将计算成本降低到传统AutoML方法的1万分之一,寻找可控时间内高性能易于部署的模型结构。

忽略AutoML技术图

与市场上的自动化技术相比,区别化的自动化技术具有以下优点

计算成本很小。 传统的AutoML技术通常需要一些训练模型来遍历一些模型空间,并且计算成本非常昂贵。 开阔视野的AutoML技术在一次训练中能够得到模型空间整体的描绘,大幅度削减了计算成本,但只是通常训练成本的1~3倍。

应用范围广。 以AutoML技术为视角提供了完整的解决方案,涵盖了活体检查、人脸识别、物体检查、语义分割等业务的大部分。

易于部署。 AutoML技术涵盖数据处理、模型训练、模型压缩、模型量化等过程,从数据到着地自动处理。

精度高。 轻视AutoML技术是许多视觉任务,超越了人工设计,是业界最好的。

MegCompute :高效灵活

拥有卓越的深层学习框架和全面的数据平台支持,Brain也需要强有力的计算能力支持才能发挥完整的能力。 基于深刻的学习框架,开发出支持平台整体计算的系统,被称为MegCompute。

MegCompute平台的总体架构

这是一个包括硬件基础设施、数据存储和计算时间表的平台,研究人员可以部署培训环境、设计培训流程、提供计算能力和资源分配服务、监控实验流程、演示视觉效果

MegCompute具有以下特点

高性能: MegCompute拥有丰富的GPU计算资源,同时支持各种硬件,能够灵活有效地分配计算任务。

全过程垄断: MegCompute支持模型构建的全过程,使研究人员能够实现一站式业务应用服务,满足工业级AI能力开发测试、部署在线和业务生产方面的工作。

灵活部署: MegCompute采用Docker容器技术,使用户能够灵活地构建部署培训环境,使用户能够在不使用的情况下立即丢弃资源,从而能够向其他用户释放资源,具有非常灵活的特征。

用户友好:在用户使用期间,通过可视化界面进行环境构筑和训练设计工作,模型测试的结果也可以通过可视化看到,不需要太在意基础技术的细节,易于使用。

支持多种深度学习框架:除了与MegEngine的自我研究深度学习框架紧密结合外,MegCompute也支持TensorFlow和PyTorch的使用。

MegData :数据整合处理

构建模型时也需要大量的数据支持。 Brain的MegData提供了主要包括四个方面的数据服务。 1 )数据管理2 )数据注释3 )数据处理4 )数据安全性。

查看Brain核心组件MegData

考虑到研发过程中需要使用大量图像数据,综合平台需要提供管理、标记、处理和存储安全的服务。 根据演示,MegData提供了完整的数据服务,并为用户提供了完整的流程解决方案。

在自动标注中,采用了很多算法。 例如,使用聚类算法可以将给定标记任务的成本降低到传统的10%。 一些加成任务通过算法辅助检测,效率提高了150%以上。

与其他同类平台相比,MegData在数据级别上为AI模型的研究提供了安全高效的数据存储和处理方法。 与此同时,它还具有很高的灵活性,因为它基于云。 最后,MegData弥补了AI算法研发中数据处理的缺陷,大大提高了研发人员在数据层面的工作效率,节省了时间和研发成本。

总的来说,MegData不像其他两个Brain模块那样受到关注,在系统中发挥着重要的功能,负责深入学习训练前的大部分数据管理、处理、标记和安全工作。 这些都是整个过程不可或缺的。

总之,Brain人工智能算法平台强调了技术开发的三个趋势。 首先,BrAIn是完全自主开发的深入学习系统,复盖了ai业务的整体流程。 这说明我们可以完全掌握核心研发工具和平台。 另外,BrAIn是专门为计算机视觉场景开发的,因为它是一种面向业务的专业ai服务系统,可以拓宽视野,投入大量精力,针对业务需求提出专业的解决方案,新方法可以迅速在实际应用中得到测试和验证,推动业务发展

由于Brain本身具有完全掌握能力,通过计算机视觉相关场景驱动了Brain的发展,因此其反复速度非常快。 目前,新算法层出不穷,企业需要一个能够快速实现算法的人工智能平台,能够将新方法投入实际生产,Brain是一个很好的参考例子。

大家都在看

相关专题