小呦萝论坛
添加时间:(雷锋网出品)图1:Turing-NLG 17B 模型(蓝线和绿线)和Megatron-8B 模型(橙线)在验证困惑度上的对比图。虚线表示当前性能最佳模型实现的最低验证损失。图中从蓝线到绿色的转换,代表 Turing-NLG 模型的性能从弱于当前性能最佳模型到超越当前性能最佳模型的转变。据图显示,Turing-NLG 模型在验证困惑度上的表现也始终要比Megatron-LM 模型要好。
左图:与Megatron-LM相比吞吐量的程度。右图:使用和不使用ZeRO时,对于单独使用数据并行性的可训练模型大小比较。如上图所示,DeepSpeed在规模、速度、成本、可用性这四个方面标新都非常出色。规模:当前最先进的大规模训练,例如OpenAI GPT-2,NVIDIA Megatron-LM和Google T5,其大小也就分别是15亿、83亿和110亿个参数。而有ZeRO加持的DeepSpeed能够运行1000亿个参数。
2019年Q1,核心电商板块息税及摊销前利润(EBITA)达275亿,同比增长24%,低于营收增速,原因是利润率跌了9个百分点。但按照阿里的价值观,与中小微企业共克时艰是题中应有之义。2019财年,核心电商版块息税摊销前总利润1362亿。但菜鸟、外卖业务都以增长为第一要务,低费率是重要的竞争策略,所以该版块利润无疑来自电商。
值得关注的是,虽然次新基金相继开始建仓,但由于投资方向不同,其净值表现也出现了较大分化。数据显示,在上述134只次新基金中,截至11月23日,有25只年内净值跌幅超过2%,9只超过5%。其中跌幅最深的基金,自8月10日成立以来下跌超过17%。
“方案已经报给了(广东)省政府相关部门,但还需要等待审议通过。”一位知情人士告诉记者,只有获得相关政府部门的决策会议通过,并拿到批准文件,才能进行后续基金的筹建工作以及正常的流程。该知情人士同时透露,早在今年7、8月间,针对资本市场的深度调整和广东省部分上市公司或控股股东方面遭受流动性压力而带来的风险问题,粤财控股、易方达等就分别向广东省政府有关方面报过方案,提出了对其中优质的上市公司或控股股东等进行援助的建议,并与有关政府部门进行了沟通。
出现大量集中连号遭质疑9月28日,曾有自媒体消息称,杭州未来科技城的云蔚轩3号楼、4号楼的摇号结果中出现大量的集中连号,摇中号码集中在900至1100号之间,引发网友质疑。9月29日,负责此次摇号公证工作的浙江省杭州市国立公证处就此事回应称,已将摇号电脑和光盘送相关司法鉴定机构进行检测。