乐博百万账号注册_乐博现金最新地址_乐博现金登陆

    
当前位置:首页乐博百万账号注册正文
admin

牙齿松动,原创美光入局AI处理器

  3个月前 (12-12)     314     0
简介:原创美光入局AI处理器...

来历:内容由半导体职业调查(ID:icbank)编译自「venturebeta」,谢谢。

早前,全球最大的存储芯片制作商之一的美光科技(Micron Technology)收买了人工智能硬did件和软件草创公司Fwdnxt时,此举或许十分风趣。假如能取得作用,Fwdnxt可以使美光科技与英特尔和英伟达等协作伙伴进行直接竞赛,由于美光科技以为内存和AI核算正在交融到同一个架构中。

美光这个项意图担任人人之一是史蒂夫帕洛夫斯基(Steve Pawlowski),这是前英特尔芯片架构中国烟草师,他具有数十项专利。Pawlowski现在是美光公司高档核算处理方案副总裁。

与美光的存储芯片结合运用时,Fwdnxt(发音为“ forward next”)将使美光可以具有探究数据剖析所需的深度学习AI处理方案的才能,尤其是物联网和边际核算。或许陪同它将制作根据AI的存储芯片,或许包含AI的存储芯片。

小学生灯谜

美光公司首席履行官Sanjay Mehrot醒醒ra说,美光公司正在从事这项作业,由于“昨日的核算体系结构不适用于明日……从久远来看,咱们以为核算最好在内存中完结。”

下面是咱们对美光的一个采访编排:

Steve Pawlowski:2014年,我脱离英特尔时来到了美光,其时他们说:“您想做什么?”我说:“我深信核算和内存的交融关于进步功能和下降推迟至关重要。而你们是一家回忆公司。你们具有技能,我想在这儿处理这个问题。”他们说,“好。”

我有一个小组,专心于发现核算和内存的问题。咱们先可以开端测验,开端将概念引进产品中,但不会添加本钱。我在英特尔学到了一件事,这是我永久不会忘掉这个故事:咱们从前具有数学协处理器。80287,80387。咱们在387上赚了可观的钱。咱们有一个聪明的主见,那便是假如将协处理器集成到486中,咱们可以更快更好地做到。咱们做到了,突然之间咱们没有了满足的脚印(footprint.)。不需求它的人说:“您不需求为此死区向我收费。”而需求它的人说,“您将与其别人相同交给我,由于我是一个有利的客户。”实际上,整个事务归于零。

我在傍边获取的经历是:直到有绝大多数人从中取得真实价值之前,您不能添加更多的复杂性和本钱,并期望人们当即付出费用。因而咱们重视的重点是找到人们今日可以从中取得价值的要害事物,然后看看您是否可以跟着时刻的推移扩展泡沫。我将其视为八到十年的旅程。在那些年底,我或许回头一看,认识到我耗费了他们。或许我可以回头说:“哇,咱们或许还没到这儿,可是咱们做得很好。”

VentureBeat:关于此或许发作的成果,这引发了许多想象力,可是您是否会暗示某些特定的内容?

Pawlowski:有一件事,你在这儿现已听过许屡次了,那便是AI在边际。咱们重视这个问题的原因是,没有一个现成的编程模型或现成的架构可以让你与商场竞赛。可以说,每个人都在争着进入同一个商场。寻觅时机去那里做点什么。人们不会看着你说:“美光是一家内存公司。你为什么要谈这个?“他们是这样看的——咱们在FPGA上有这种才能,咱们的高功能内存和架构映射在FPGA上。咱们担任处理全部的笼统,所以你不用成为一个VHDL程序员。您乐意开端处理数据集的问题吗?

风趣的是,我并不需求去推进它。咱们一直在参与FPGA会议之类的活动。主要是政府机构来说,“咱们这儿有个问题。咱们想在这方面多做些测验。“政府的问题是,他们很早就振奋起来了,但假如你想做什么事,那就得花很长时刻。”收买周期很长。合同是长时刻的,还有其他全部。

咱们决议着眼于一般商场。有一家轿车公司来了,他们说,“咱们还没有到达Level 5,但咱们必定可以出产到达Level 3,Level 4的自动驾驶轿车,咱们期望可以运用网络告知咱们正在发作什么。这看起来是风趣的。你乐意和咱们一同作业吗?内部许多人说:“他们为什么对与你协作感兴趣?”“这是由于我不会进来告知他们需求做什么。我说,“这便是咱们所具有的。咱们能为您做些什么?牙齿松动,原创美光入局AI处理器他们说:“好吧,你乐意听咱们的。这是咱们的问题。”

信不信由你,我从2005年AMD推出的Opteron中吸取了经历。其时咱们仍在推行7千兆位处理器、33级流水线,并且没有人去那里。咱们去了华尔街,那是 您想要爬进贝壳的一刻,由于它们的确被照亮了。但我说:“你能再给咱们一次时机吗?”咱们能坐下来了解一下咱们的作业量吗,和你一同工legend作,然后我回收那句话,咱们牙齿松动,原创美光入局AI处理器可以发明更好的产品吗?咱们做到了。

瑞银(UBS),我记住他们在一篇专栏文章中写道,“你或许造不出最大的芯片,也造不出最好的芯片,但你来了,就了解了我的问题。”“这是真实了解客户和他们的问题,以及你能做什么。假如你这么做了,却没有协助他们,嘿,你学到了一些东西。

VentureBeat:那是不是以为着你们在开发一种新的回忆体,仍是弄清楚了在哪里进行处理?

Pawlowski:答案是必定的。但它是真实了解动态的。趁便说一下,这取决于模型。我方才和下面的人聊了聊有些言语模型需求100 GB透析的参数。当你看到有人说,“嘿,我有2 GB,4 GB时,”这适用于大多数类型,但不是全部类型。模型真的在进化。

这也取决于处理方案的推迟。我不知道你们是否看过下面OHSU的视频那位女士患了乳腺癌。他们需求许多的数据,由于他们想把全部的电子显微镜图画放在一同,树立一个3D卷积模型,即肿瘤的3D表明。他们没有满足的时刻进行评论,由于他们想要在一天甚牙齿松动,原创美光入局AI处理器至一个小时内取得可操作的见地。生物咱们与CERN的协作,现在需求数据。咱们有必要在微秒内做出决议。这是风趣的工作仍是咱们将其放在地板上?

不同的处理方案需求不同类型的存储。英特尔的阅历让我清楚知道程贫血吃什么序中的指令是什么。我也知道他们是如安在机器中履行的,然后进入体系。所以当我来到美光时,我仅有看到的便是地牙齿松动,原创美光入局AI处理器址和指令。读/写指令和地址。我彻底不了解牙齿松动,原创美光入局AI处理器,这个东西是把15个不同的东西仿制到不同的元素(elements)上,仍是掩盖,仍是什么?有了咱们在6月协作和收买的公司,咱们就邓力群可以构建这些算法,运转它们,看看全体作用怎么。

咱们的首要方针是,咱们可以在内存存储中做什么以缩短处理方案的时刻?咱们总是可以树立更高的带宽,但那不用定能让你到达意图。有什么可以做的,例如散射张量阵列(scatter tensor arrays)?假如咱们可以树立一个可以引进矩阵的缓冲区,并且让咱们可以一口气将矩阵搬运过来,而不仅仅随意找东西去寻觅,这或许会有很大的优点。

终究,咱们还要看到的是-其间大多数是乘法和累加架构,十分简牙齿松动,原创美光入局AI处理器单。它们仅仅被仿制了数千次。实际上,一旦晶体管变得更好一点,您就可以树立一个适当好的乘法并在存储设备中进行累加。终究,您能否选用该架构,然后将其放入存储设备自身?这是久远的愿景。

我想做的是,不管咱们做什么,咱们都要树立一个编程基础设施和一个典范,这样人们就不用每次搬迁时都重写他们的代码。在我看来,这便是英特尔的巨大成功。当咱们做386的时分,还没有32位的软件。但它的确能很好地运转16位代码。人们买它便是为了这个。你有许多渠道,然后人们说,“好吧,现在咱们去优化32位。“486在六到八年后边世时,就有软件可以运用它,它变成了一台永不回头的机器。

从内存开端,首先是存储,咱们能做什么。然后咱们就会看到,跟着时刻的推移,什么可以真实搬迁。答案或许是什牙齿松动,原创美光入局AI处理器么都不是。答案或许是全部。我想是在中心的某个当地。这取决于你把“针千佛山”移到哪里。

VentureBeat:您门现已和Fwdnx优格姐姐t携手。他们能统共一个适当全面的著作,那么您还需求找到许多协作伙伴吗?

Pawlowski:咱们将需求许多的协作伙伴和数据科学家。Fwdnxt具有一批现已开发了五年,十年,十二年,具有资深推理引擎架构经历的人。一起他们也有不同公司和不同的学术布景。创立它的人是普渡大学的教授。他们一直在优化该架构。他们有一个适当不错的编译器,可以运用Open Network Exchange前端,然后将其映射到其硬件。

后边我需求的是数据科学家,我需求运用。我还以为咱们将需求动态的运转时/调度程序(runtime/scheduler)。假如您真的有这样的模型——假如今日我在硬件上,在Intel处理器上写了一个网络,那么三年今后,您依然可以运转相同的程序。这全部都是经过指令集来笼统的。我在这儿要做的是笼统网络,这意味着咱们将需求某种类型的动态运转时。这便是说,“好吧,这东西有8,000个乘法和累加单元。这有1,000个。我可以把那东西分散一点。或许说,哦,这150个单元逝世(die)了。我不想在上面组织任何东西倾世皇妃,但我依然期望可以运用该部件。”

有一些实体正在研讨处理动态运转时(dynamic runtime )问题,我以为这将十分重要。特别是。我从前从一个在Intel担任L石家庄学院itho的人那里听到,他们信任当到达5nm以下时,他们以为30%的设备在制作时将会超出标准。

VentureBeat:这是否意味着和Intel和Nvidia有更多的竞赛?

Pawlowski:其实是将有愈加协作。任何人在数据中心很难与英特尔和英伟达竞珍妃争。Nvidia的练习时长也现已坐稳。即便人们提出了许多新的处理方案。但不止一家草创公司告自来也诉过我,哪些做超大规模练习的人告知他们:“将咱们的练习算法从GPU移出是如此困难。他们也做得很好了,但他们依然在给咱们带来功能提高。所以不要再花时刻做这样的事了。”并且,我听到的最终一个,我听到的最终一个统计数据是,推理的很大一部分仍在至强处理器上进行。

咱们一直在聚集,假如咱们要在数据中心中做任何工作,这将为Nvidia和Intel之类的客户供给协助。可是,假如从内存存储的视点来看有或许发作任何立异,那么让咱们从边际进行研讨。这便是咱们将取得最大功率和规模经济的当地。

VentureBeat:摩尔定律部分还好吗?你按计划吗?

Pa汤圆煮多久wlowski:这是一个应战,但这并没有阻挠咱们持续微缩。老实说,我有必要永久坚持摩尔定律。您不可对摩尔定律说不好!由于那是第十一条诫命。当人们问我的时分,正是Dennard缩放的缓慢和中止才真实推进了立异。现在,咱们或许不会每两年取得两倍的晶体管添加。时刻或许会添加到每三四年一次。可是,咱们将在第三维度下手。所以这并没有阻挠咱们。问题的要害是什么才是最经济的办法。而工程师正在寻觅处理难题处理方案。

月亮陆景云
声明感谢您对我们网站的认可,非常欢迎各位朋友分享本站内容到个人网站或者朋友圈,
转转请注明出处:http://www.meilele8.com/articles/1708.html
点赞 打赏

打赏方式:

支付宝扫一扫

微信扫一扫

扫一扫
QQ客服:111111111
工作日: 周一至周五
工作时间: 9:00-18:00