“与东部相比,西部的大数据的产业链有明显的短板。如果只注重于数据存储和计算,这是一个重资产和算力环节,投资大回报长,仅仅依靠财政补贴电费和土地出让金这种方式来吸引数据中心入驻,是很难持久的。”在4月21日的IDC行业Discovery大会上,谈到“东数西算”话题时,中国工程院院士邬贺铨这样表示。
“东数西算”,是指通过构建新型算力网络体系,把东部算力需求以及大量生产生活数据输送到西部地区进行存储、计算、反馈,并在西部地区建立国家算力枢纽节点,有助于改善数字基础设施不平衡的布局,最大限度发挥数据要素的价值。
随着新基建、数字经济的深入推进,我国数据中心和相关服务业业务收入保持连续增长的趋势。中国信通院数据显示,2021年我国数据中心市场收入已达到1500亿元。今年2月,国家“东数西算”工程正式启动,IDC行业迎来重要机遇,成为数据通信行业的一块“练兵场”。而如何建设布局“东数西算”、探寻新发展方向,成为整个行业共同关注的话题。例如,世纪互联创始人陈升认为, “东数西算”目前发布的八大节点和十大集群仅仅是冰山一角,“东数西算作为国家战略性工程的巨大潜能还隐藏在水面以下”,甚至有望成为超越互联网的新一代网络空间基础设施 。
邬贺铨今日表示,东数西算”的实质是要做到四个“优化”:一是优化算力效率,实现全国算力规模化集约化发展;二是优化能源效率,能就近消纳西部的绿色能源;三是优化区域协同,使得算力布局更合理,提升数据安全;四是优化产业结构,带动其产业上下游的发展。
他同时指出,目前西部地区数据中心仍面临一定挑战,如上架率偏低、市场吸引力不够、数据中心价值难以体现、以及人才缺乏等问题。“西部地区要从全产业链角度出发,进一步完善数据中心生态。”
例如,数据分为冷数据和热数据,通常冷数据要占到整个数据总量的80%,而从数据中心的能耗构成来看,IT识别占了45%,供电损耗占10%,散热损耗占了43%。因此,西部数据中心要善于处理调度时间没那么频繁的冷数据,而且更有低碳的优势。
邬贺铨表示,作为西部,要从规划设计运维的全生命周期来提升数据中心的价值,数据中心首先要规划好,立足长远建设能效更高的大型数据中心,”能建大型数据中心就不建小型的,能建超大型就不建大型的。因为越大型能效越好。“但是,需要按需分期建设、分步投入,因为通常数据中心的服务器每三到四年就可更新为能效更好的服务器。
他同时透露,目前西部数据中心的上架率偏低,全国平均的上架率大概50%,而西部更低于50%。现在来看,用高密度的机架并提升上效率,可以提升高能效,还可以降低每千瓦的成本。邬贺铨援引数据举例,北美的机架平均功率为8.5千瓦,跟4.5千瓦的数据中心相比,每千瓦的成本可以下降68%,此外数据中心需要靠高时效和安全管理等增值服务来开拓市场。
还有一个现实是,“西部的数据中心目前多数是以服务器和机架等出租或者托管服务为主,市场吸引力不高,数据中心的价值也难以体现。”事实上,这也是此前业界人士所关心的,不能把数据中心简单理解为机房,只关心机柜多不多、算力够不够,而是要在高速算力的基础上求高质量、跨区域布整体不具体的均衡性等等纵深发展。
因此他提出,西部要注意提升算力网络的性能,如果丢包率高,则要引起重传,这就要浪费很多算力资源。有资料统计,对重要的业务0.1%的丢包率将导致算力损失50%,还会增加能耗。此外,西部数据中心的一大挑战是人才,尤其是运维管理人才和市场开拓队伍人才短缺。
目前来看,尽管企业的数据增长速度很高,但是真正企业的数据,目前只有32%的是被利用被激活的,所以未来要发展数据中心,吸引更多的企业数据进数据中心。
邬贺铨建议,从全产业链来完善数据中心的生态,其中,数据预处理是劳动密集的环节,数据存储和数据计算是重资产和算力环节,而数据挖掘是智力密集环节,它们相应需要有各种各样的硬件软件和服务来支撑,而不能仅仅是注重于数据存储和计算。
此前有机构预测,今年全球的全球边缘计算市场能达到133亿美元的规模。2020年,我国大数据产业规模超1万亿元,到2025年能突破3万亿元,年增25%。邬贺铨称,这说明产业实际上不限于大数据,数据服务只是其中之一,还有产业基础设施、各种各样的软硬件以及算力应用于各行各业。2020年我们国家算力产业规模达到2万亿元,直接和间接分别等带动经济产出1.7万亿元和6.3万亿元,只在算力产业中投入产出比是1:3~4。
完善数据中心生态从向上游拓展来看,包括了发展数据预处理产业,如数据的标注、清洗脱敏,并且开展本地数据的挖掘服务;向下游,包括引进大数据产业链里头的硬件,包括服务器边缘计算机房设施的生产,以及建立工程和运维队伍,提供数据中心机房建设的工程服务产业等等。
对于数据中心行业如何进一步迈向高质量发展,中国信通院云大所所长何宝宏今日也建议,IDC行业要紧跟新基建浪潮,打造高能效、高技术、高安全、高算力的“四高”新型数据中心,实现“数云协同”、“云边协同”、“数网协同”。