江达| 婺源| 津南| 临江| 南岳| 多伦| 临夏县| 睢宁| 弓长岭| 宝应| 梅县| 易门| 城口| 召陵| 离石| 会宁| 余江| 零陵| 安庆| 西山| 邯郸| 商南| 米易| 石狮| 卓尼| 华蓥| 怀宁| 济源| 黑山| 龙川| 陆良| 临潭| 佛冈| 昌吉| 石林| 安义| 蓝山| 乡城| 长寿| 广东| 龙江| 武陵源| 山亭| 兴国| 寻甸| 东乡| 昌江| 新和| 新泰| 深州| 明溪| 海安| 安乡| 南康| 高阳| 安图| 理塘| 铁岭市| 青川| 深州| 沾化| 兴化| 成武| 兴仁| 阿城| 卫辉| 麻栗坡| 武进| 宁海| 东兰| 南乐| 宣威| 恩平| 句容| 双辽| 德阳| 牟平| 尼玛| 石龙| 头屯河| 察哈尔右翼中旗| 胶南| 吉首| 札达| 栾城| 保定| 山海关| 嘉禾| 宁化| 台南市| 加格达奇| 榆社| 共和| 泸定| 蛟河| 阜新市| 麦积| 柳林| 合川| 伊川| 新郑| 通海| 南岔| 定结| 南宫| 乌兰浩特| 若尔盖| 乌拉特前旗| 昌江| 临猗| 四方台| 都昌| 博兴| 独山| 醴陵| 佳木斯| 金溪| 长汀| 通化市| 十堰| 红古| 五华| 黄平| 土默特左旗| 襄垣| 大荔| 灵丘| 宝山| 阿鲁科尔沁旗| 南漳| 南川| 兰西| 耒阳| 桂平| 茶陵| 平乡| 革吉| 义马| 雷山| 仁化| 藤县| 灞桥| 略阳| 威海| 太康| 庆阳| 雅江| 舞钢| 苏尼特左旗| 巴林左旗| 鄂伦春自治旗| 柳州| 丰润| 台安| 昌平| 开封市| 富裕| 塔城| 五原| 镶黄旗| 加查| 建平| 阜新蒙古族自治县| 互助| 沐川| 柳江| 大竹| 林周| 岫岩| 金溪| 秭归| 澎湖| 承德县| 庄河| 临安| 微山| 逊克| 雅江| 新青| 天等| 蒙城| 凭祥| 南芬| 洪泽| 遵义市| 博鳌| 民权| 汉沽| 曲麻莱| 金溪| 武城| 措勤| 禄劝| 新民| 长子| 仙游| 遂溪| 石嘴山| 玉树| 荣成| 隆林| 苍梧| 津市| 兴城| 静海| 咸丰| 纳雍| 禹州| 和龙| 喀喇沁旗| 余江| 乌拉特中旗| 日照| 疏附| 梁河| 即墨| 张家口| 四子王旗| 夏津| 平阳| 黄岛| 咸阳| 大新| 津南| 元氏| 晋城| 鲅鱼圈| 隆德| 隆子| 莱西| 横山| 海盐| 和林格尔| 珠穆朗玛峰| 龙凤| 安国| 泸县| 叶城| 洱源| 白朗| 宁乡| 静海| 千阳| 曲麻莱| 古丈| 龙川| 龙泉| 三原| 深圳| 三原| 那曲| 进贤| 额济纳旗| 建宁| 盐都| 金湖| 安福| 南浔| 甘南| 罗山| 射洪| 肥西| 余干| 翁牛特旗| 百度

周强:要不断创新和加强人民法院教育培训工作 切实加强应用法学研究

2019-09-23 23:12 来源:人民经济网

  周强:要不断创新和加强人民法院教育培训工作 切实加强应用法学研究

  百度另外,还在山前大道两侧各500米范围内,规划建设了多个桃园、杏园,所有的农村道路都将做到见树见花,突出激情六月·花的海洋的鹿泉特色。比如,实施人才安居工程,为各类人才提供安居服务,全日制大学本科生及其他各类实用型高技能人才,安居面积标准60平方米左右,硕士、博士安居面积标准分别达到90平方米左右、100平方米左右。

物联网技术的应用推进了精准农业发展,合作社果菜病虫害发生率下降一半,农药使用减少一半,产品达到绿色食品要求。快速升温下,北方偏暖程度已经大于南方河北下周若升至30℃,更是要赶超5月下旬的水平!虽然最高温一路飙升,但各地最低温仍然较低,河北早晚温差大到比肩新疆,早穿棉袄午穿纱……在近日出炉的乱穿衣预警地图上,河北的乱穿衣指数竟为乱到崩溃出门不知道穿啥的,小编教你一个穿衣法则:上薄下厚这个时节主要是要注意下半身及脚的保暖,穿的衣服厚度,最好可以出些微汗。

  范照兵先后考察了元氏县铁屯村代表联络站、龙河新区建设,高邑县万城镇代表之家、冀中南公铁联运智能港,走访了两县人大常委会机关并进行座谈。据宜昌市公共就业服务机构调查,目前七成企业用工缺口得到解决。

  领钱金额也从180元到150元、120元不等。直到战争结束,全村参军的男人就只有刘道新的父亲回来。

州委统战部组建的女子尖刀班,登上海拔1300米的鹤峰县七峰村,带领村民测土壤种药材。

  平均浓度最低的3个城市依次是北京、廊坊和天津,分别为46g/m3、53g/m3和60g/m3,浓度最高的3个城市依次是邯郸、邢台和安阳,分别为104g/m3、97g/m3和97g/m3。

  交通互联互通加速环境:环京新添万亩绿屏廊坊市全境处在京津保中心区生态过渡带中,廊坊一些县(市、区)紧邻北京城市副中心、北京新机场,区位独特,生态环境状况直接关系到首都生态安全。请各地高度重视,积极应对重污染天气,并强化监督检查,切实加大对重污染天气应急预案启动和应急减排措施落实情况的督查力度,确保应急减排措施落实到位,努力完成秋冬季大气污染综合治理攻坚行动目标。

  各职能部门按照管行业就要管行风的要求切实履行监管责任,及时发现和纠正本系统本行业范围内存在的形式主义、官僚主义问题,强化监管、健全制度。

  医师可以按规定申请设置医疗机构,鼓励医师到基层开办诊所。他看我妈一个30多岁的苦命女人带着两个孩子,心生同情,两个同病相怜的人就走到了一起,之后就有了我。

  由于公司的产品都是天价,也不实用,吴女士告诉记者,她到现在也还有30多个单没有换领产品,换领的手机由于速度太慢,放着没用。

  百度在科幻影片经常出现的场面变成现实展现在观众面前,不禁让人啧啧赞叹。

  原标题:湖北春风行动人力资源供需两旺普工工资3千以上湖北日报讯(记者李玉麟、通讯员楚仁煊)记者昨从省就业局获悉,全省各市州年后企业员工平均返岗率在80%以上,今年岗位薪酬较去年上升10%至15%。经过10年的推广,如今,杂交谷子已在非洲6个国家进行了试种,得到国际社会的广泛关注。

  百度 百度 百度

  周强:要不断创新和加强人民法院教育培训工作 切实加强应用法学研究

 
责编:
智驾峰会
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网
人工智能 正文
发私信给程弢
发送

0

周强:要不断创新和加强人民法院教育培训工作 切实加强应用法学研究

本文作者:程弢 2019-09-23 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
百度 原标题:第十七届中国·崇礼国际滑雪节闭幕(图)这个雪季,不是在崇礼,就是在去崇礼的路上。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网(公众号:雷锋网)编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
百度