访问控制中PIP的典型流程和关键点思考

一
pip的定位
企业abac中访问控制机制的部署实施有几个重要的功能“点”，用于检索和管理策略的服务节点，其中包含了用于处理策略上下文或工作流、以及检索和评估属性的一些逻辑组件。下图给出了这些功能点：策略执行点（pep）、策略决策点（pdp）、策略信息点（pip）和策略管理点（pap）。这些组件处于同一环境中，相互配合以实现访问控制决策和策略执行。
策略决策点（pdp）：通过评估适用的dp和mp来计算访问决策。pdp的主要功能之一是根据mp调节或消除dp间的冲突。
pep执行pdp做出的策略决策：策略执行点（pep）：以执行策略决策的方式响应主体对受保护客体的访问请求；访问控制决策由pdp生成。
pdp和pep功能可以是分布式的或集中式的，并且可以在物理和逻辑上彼此分离。例如，企业可以建立一个集中控制的企业决策服务，该服务评估属性和策略，生成策略决策并传递给pep。这种方式方便对主体属性和策略进行集中管理和控制。或者，企业内的本地组织可以利用集中的dp存储库，实现独立的pdp。acm组件的设计和部署需要一个管理单元来协调abac的各组件功能。
要计算策略决策，pdp必须具有有关属性的信息，这些信息由pip提供。本文件中的pip定义为：策略信息点（pip）：作为属性或策略评估所需数据的检索源，提供pdp做出决策所需的信息。
在执行这些策略决策之前，必须对它们进行彻底的测试和评估，以确保它们满足预期的需要，这些功能由pap执行。pap可定义为：策略管理点（pap）：提供一个用户接口，用于创建、管理、测试和调试dp和mp，并将这些策略存储在适当的策略库中。
二
pip的定位及关键点思考
● pip应属于支撑平台的一个组件，不直接面向客户。● pip能统一的处理各方面的数据，当数据源和pip对接时，尽量减少数据源的改动，降低对数据源的要求，而把主要工作负荷都放到pip里。● pip的工作不是简单的收集存储数据源的属性，而应该具备数据清洗，关联，统计分析并产生新的属性的能力。● 数据源和pip的分工边界：数据源需要上报只有其才可以拿到的固有属性，比如：账号，ip，设备码，运行的软件，打开的端口等，不建议让数据源上报复杂的统计分析类属性，比如：1小时登录的次数，是否运行了违规软件，登录过的地点等。pip在接收数据源上报的基础属性以后，可以对属性进行加工，关联，并通过运算产生如上新的属性。● 未来pip占用系统资源数量级会远超系统其他模块。
三
典型流程
pip系统处理流程等同于典型的etl数据处理流程，先从各种数据源收集各种数据，再通过统一的数据处理流程，将多维度的数据统一过滤整合，最后统一存储，一个标准的流程架构(pip)如下图：
其中消息中间件，数据处理，数据存储均可以分离部署，并均可采用分布式部署。
数据处理部分通常是根据不同的业务选用不同的处理方式，目前业界综合使用最多的是基于flink的流式处理。目前基于文件的处理框架（比如hadoop+hbase）不太流行了，流式处理框架里主流的flink相对比storm具备更好的吞吐量（也就是性能更好），并且自身支持批处理及状态记录，这些优势导致其目前成为流式处理的主流框架，具体如下图（比较重要指标是：
延迟，滑动窗口，吞吐量，状态，流批一体）
数据存储方面，目前业界综合使用最多的是es，或es结合某个列式存储数据库比如hbase，或文档数据库比如mangodb。es结合其他数据库的方式只用于海量数据的查询检索，如果数据量未到该量级（比如单次查询的数据量约小于1亿条记录）则无需这么做
四
pdp和pip对接
pdp和pip对接可以采用2种对接方案，如下图：
http主动通知结合http主动查询，
即pip计算出最新的数据后主动通知pdp，或pdp需要用到某些属性时主动找pip查询。该方式实时性较好，但会严重降低pdp乃至整个系统的性能，不推荐。
共享redis结合共享数据库，
pip运行时会把数据在数据库和redis里都存放一份，数据库和redis均为异步更新，数据库更新周期远大于redis。pdp启动后从数据库或redis加载数据到自己内存，并周期性从redis更新数据到内存，决策过程中只读内存。该方案优势在于性能较高，但pdp实时性会降低，推荐该方案。
五
总结
基于目前的资源分配情况及需要处理的数据量，暂时无需额外引入其他开源框架（比如flink或其他文档数据库），这些开源框架本身也要占用系统资源，在数据量并不大的情况下反而会导致资源占用不均衡（比如框架占用了4g内存，本身处理只占用2g内存）。
该方案内所涉及功能组件已经在实际使用，经过了长期运行证明可以适应目前的业务，而从零开发性价比太低并且没有任何业务驱动。
该方案已经实现了数据的统一收集，过滤，分析统计，存储等一系列流程，并且可以实现灵活配置处理规则（业界大多数做法都是写死的）实现了和pdp的闭环对接，在数据量并不大的情况下无需引入新的流程。
未来如果数据量大到一定程度则可以在该架构上持续改造（比如把flink结合进来）
注意，这种改造的好处是可以将pdp和pip分离，分不同的进程甚至部署到不同的服务器上，但在目前硬件资源有限的情况下没有实际意义，这么配置会带来2方面负面作用：
● 虽然pdp的资源占用大幅减少，但其一大半工作被pip分担，pip同样会占用硬件资源，启动2个服务肯定比单个服务占用更多的资源，同时增加了额外的数据交互开销（比如原来用户信息和设备信息等直接通过登录请求携带过来，但流程分离后需要在pip里单独开启用户和设备数据同步流程）。
● 本来pdp和pip在一个进程全部读写内存效率最高，分离后至少也要用redis做数据同步，处理性能和实时性两者必有一个会严重下降。
综合评估，大数据处理是建立在大量硬件资源的前提上，采用硬件换取效率，在资源不够的情况下，整个系统还是交互越少效率越高。

高压电缆分支箱为何深受高度重视，其原因是什么
三星给出打孔屏特别解决方案
小米6最新消息：小米6新机变二手，价格瞬间降千元，还想全款预售吗？
技嘉AorusRTX2080TiXtreme11G显卡高清拆解图赏
智能照明迎来了怎样的机会
访问控制中PIP的典型流程和关键点思考
DS26528收发器的初始化和配置
2022年可穿戴设备总出货量将达1．904亿
无线网络连接上但上不了网
我国的自动驾驶技术研发接连取得重大突破
无线充电器充电原理是什么？无线充电的形式有哪些
浅谈安全驱动器
推荐几款Type-C千兆网卡转换器，电脑没有网络也能照样使用
华为创新行业应用启航：打造5G 2B“样板房”
三极管怎样通过各级电压判断工作状态呢？
WiFi已成为招揽人气的标配，商业WiFi要想成为物联网入口还差什么？
笔记本电脑电池日常损耗多少，正常范围是多少
高通推出面向5G智能手机的毫米波天线模组，满足了厂商对终端尺寸的要求
美国智库从美国角度说他们对中国发展半导体的看法
微控制器识别RS-485系统中的地址