工业物联网,车联网和实时欺诈风控的需求正在飞速发展,越来越多的企业新应用需要的是快速响应客户需求,并同时学习和适应不断变化的行为模式。同时,随着5g网络、容器云、高性能存储硬件水平的不断提高,数据增长进入了空前的发展阶段。
和以往不同的是,无处不在的物联网、自动驾驶汽车等边缘计算所产生的数据源源不断,就像开着的水管,数据源一直在流出。
目前大数据处理平台最常见的lambda架构,它的优势在于满足了实时处理与批处理需求,但是,从存储的角度看其缺点也很明显,可以总结为如下三点:①实时处理、批处理不统一,不同的处理路径采用了不同的存储组件,增加了系统的复杂度,导致了开发人员的额外学习成本和工作量。
②数据存储多组件化、多份化,同样的数据会被存储在elastic search 、s3对象存储系统、kafka等多种异构的系统中,而且考虑到数据的可靠性,数据还都是多份冗余的,这就极大的增加了用户的存储成本。而往往对于企业用户来说,0.1%的存储冗余都意味着损失。
③系统里存储的组件太多太复杂,也增加了使用的运维成本。并且大部分现有的开源项目还处于“强运维”的产品阶段,对于企业用户来说又是很大的开销。
每种类型的数据都有其原生的属性和常用访问模式,对应有最佳的适用场景以及最合适的存储系统。为了解决如上提出的三个问题:降低开发成本、减少存储成本与减少运维成本,自然也就需要新的存储类型。在这里,我们将从最新的数据类型出发,探讨5g时代下数据存储新思路。
计算是原生的流计算,而存储却不是原生的流存储。从存储的视角来说,存储架构的设计需要首先明确所存储的数据的特点。在物联网、自动驾驶汽车、金融等实时应用场景中,所需要存储的数据一般被称之为“流数据”,流数据一般被定义为:流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。
我们将流数据定义为第四种数据类型,传统数据库这类基于事务的程序适合采用块存储系统。文件共享场景下需要在用户间共享文件进行读写操作,因此适合采用分布式文件 (nas) 存储系统。而需要无限扩展并支持rest接口读写的非结构化的的图像/音视频文件则非常适合采用对象存储系统。
颜值最高血统最纯的小米机:小米5C首拆解
Exar展出突破性低成本数字电源
双十一买TWS耳机你Pick谁?音质、降噪、便捷体验我全都要
应广科技单片机PS173微控制器作为编码器计数器的实例应用
功率计三种分类详解
5G时代下大数据存储面临的挑战
低压电器的定义是什么_低压电器可分为几大类
NVIDIA官方回应不会发布RTX2080TiSuper显卡
设计师想有更出彩的设计体验?选它—HKC T2751Q显示器
LED灯珠的生产过程全面解析
基于STM32的HC-SRF04超声波测距proteus仿真设计
通过小脚丫板载的两个数码管来显示字符
杭州捷配信息科技有限公司:让创新更简单、方便、快捷
雷诺发布L4级自动驾驶技术无人概念车
继富士康登录A股之后还有什么巨头值得期待?华为否认参与A股传闻
iPhone8未来 苹果股价已经启动达到133.29美元 市值创新高
叶面积指数测量仪的用途及功能特点的介绍
凌力尔特推出65V输入同步降压型转换器LTC3630
物联锁企业nokelock提出1+2战略将开启物联网即时驱动应用的下一个十年
盛群半导体推出HT45B0F SPI to UART Bridge IC