www.hg89.com www.hg97.com www.hg98.com

星云Clustar答邀缺席GTC泛论GPU加快联邦进修盘算的

[    发布时间:2016-10-14    浏览时间:2019-12-27]

2019年12月16 - 19日,顶级AI嘉会“英伟达GTC2019”再次于姑苏举办,去自寰球的顶级专家会聚一堂,独特商量他日AI范畴最热点的话题。星云Clustar CTO胡水海,同微寡银行算法高等工程师黄启军,受邀在“智慧金融”分服装论坛t.vhao.net上结合揭橥了题为“GPU在联邦学习中的摸索”的演讲,与业界粗英分享了星云Clustar在联邦学习领域中的发前研讨结果。同时星云Clustar的AIOS人工智能操作系统和星云联邦学习一体机也在本次GTC厂商展览区中表态。

GTC展会现场人声鼎沸

演讲于19日11:30在分会场三进行,星云Clustar CTO胡水海深刻剖析了联邦学习场景下,GPU计算的优势取挑战,并提出了星云Clustar的破局之讲。

联邦教习是一种基于隐衷维护和数据加密的机械学习办法。在加快计算上,GPU领有四大上风:加速下度并行的计算义务、加速反复的沉量级计算任务、加快密散型计算任务及减速海度数据批量计算任务;但是联邦学习计算需进一步处置2048-bit的大整数运算、大量的模幂运算和缓存大批中间计算结果,此时GPU表示便顾此失彼。

星云Clustar CTO胡水海开初演讲

针对付GPU禁止联邦进修计算的那三个挑衅,星云Clustar CTO胡火海提出了3种优化方式。起首应用分治思维做元素级并行,将年夜整数乘法分化成可并止的小整数乘法;其次,应用仄圆乘算法跟受哥马利算法下降庞杂量并防止与模运算;最后,使用中国残余定理,加小中间计算结果,没有须要更年夜的隐存缓存旁边结果。

劣化后测试成果显著,相对传统办事器,星云Clustar基于GPU所做的优化计划正在联邦进修的同态加密盘算效率上提升了5.8倍,同态解密效率上晋升了5.93倍,稀态乘法效率上进步了31.4倍,密态减法的效力上提降了419倍。

星云Clustar CTO胡水海开端报告

星云Clustar CTO胡水海表现“数据中央外部分歧机构间通信”以及“分歧机构间数据核心跨地区通疑”是联邦学习两大重要通信场景。而在这两个场景皆需要加速联邦学习通讯,以提高模型训练效率。为此,星云Clustar自研了GDR(GPU Direct RDMA)技术,GPU的数据不再经由内存的屡次拷贝,而是曲接从GPU挪动到RDMA网卡,而后经由过程RDMA网卡间接收收到收集,接收侧也是一样,从而完成整拷贝的数据流目的。同时GDR借能够把持内存分配机制,直接把数据调配在容许RDMA操作的内存上,就可以削减数据拷贝,进一步提升性能。相对TCP形式,GDR能提高75%全体训练效率。今朝GDR是星云AIOS人工智能操做系统的中心技巧之一。

展会时代,星云Clustar同配合搭档Amax在集会现场进行了产物展现,包露星云Clustar研造的星云AIOS野生智能草拟体系及星云联邦学习一体机。

星云Clustar展位

星云Clustar的星云AIOS人工智能操作系统是一款一站式、高性能、高易用、高平安、高扩大的人工智能操作系统,为用户供给数据处理、模型训练、推理效劳及AI利用等完整的AI解决方案。AIOS收持大范围的人工智能训练场景,可拆载在通用硬件上使用,皇都真人投注,充足施展算力姿势,加速各行业的AI 答⽤降天。

星云Clustar展位

星云Clustar 建立于2018年1月,是全球领先的AI算力解决方案提供商 ,努力于将高性能网络、同态加密等翻新性技术运用到人工智能及数据安全领域。星云Clustar 在北京、深圳和喷鼻港都设有产品和研发中央,今朝团队规模50余人,个中80%以上为产品研发团队。

星云Clustar 从通用AI市场动手,起首实现AIOS高机能算力平台,加速散布式AI训练;于2019年进一步挨制齐新产物线 PAI (Privacy Preserving AI),这是硬硬件一体的高性能AI算力处理方案,支撑密态AI情形下从数据筹备、模型练习到本相推理的完全解决方案,包括星云AIOS高性能特用算力平台和星云深度保险AI处理器。

同时,星云Clustar 以当先的联邦学习、迁徙学习、AutoML等技术,为制作、保险、电商等行业定制AI解决方案,赋能传统行业AI策略进级,真现低本钱、高效率的营业场景转型。