在numpy中,数组可以看作是一系列数值的有序集合,可以通过下标访问其中的元素。 处理数组的过程中,经常需要用到数组过滤功能。
过滤功能可以在处理数据时非常有用,因为它可以使数据更加干净和可读性更强。 例如,在进行数据分析时,通常需要去除异常值,过滤掉不必要的元素可以使数据更加易于分析和处理。
numpy本身提供了很多针对特定要求的过滤函数, 不过本篇只介绍最基本的过滤方式,通过最基本的过滤方式来揭示其过滤的原理。
比较比较是过滤的前提,因为通过比较才能确定过滤的条件。
数组和单个数字import numpy as nparr = np.random.randint(0, 10, (3, 3))print(arr)#运行结果[[4 1 4] [7 6 1] [8 9 5]]print(arr > 5)#运行结果[[false false false] [ true true false] [ true true false]]数组和单个数字比较,也满足上一篇介绍的广播原则,也就是数组arr的每个元素都和数字5进行了比较。
比较的结果是和arr相同结构的数组,数组中的元素是bool值。 满足比较条件是true,不满足比较条件的是false。
数组和数组除了和单个数字比较之外,数组之间也是可以比较的。
arr1 = np.random.randint(0, 10, (3, 3))print(arr1)#运行结果[[9 7 3] [2 8 5] [2 2 3]]arr2 = np.random.randint(0, 10, (3, 3))print(arr2)#运行结果[[1 6 0] [0 1 8] [9 0 5]]print(arr1 > arr2)#运行结果[[ true true true] [ true true false] [false true false]]数组之间的比较就是相同位置的元素之间比较,如果两个数组的结构不一样,会按照上一篇介绍的广播计算方式来扩充数组。 比如:
arr1 = np.random.randint(0, 10, (3, 3))print(arr1)#运行结果[[9 6 0] [1 4 9] [1 1 4]]arr2 = np.random.randint(0, 10, (3, 1))print(arr2)#运行结果[[1] [0] [9]]print(arr1 > arr2)#运行结果[[ true true false] [ true true true] [false false false]]上面的数组arr2,按广播规则被扩充成:
[[1 1 1]
[0 0 0]
[9 9 9]]
掩码所谓掩码,其实就是上面的各个示例中的比较结果。 也就是只包含bool值的数组,比如:
[[ true true false]
[ true true true]
[false false false]]
我们就是根据这个掩码,来过滤出数组中的true 或者 false 位置的元素。
过滤过滤就是根据掩码,选择出符合条件的元素。
单条件过滤arr = np.random.randint(0, 10, (3, 3))print(arr)#运行结果[[8 4 0] [2 2 9] [9 5 9]]print(arr[arr > 5])#运行结果[8 9 9 9]最后得到的是arr中值大于5的元素数组。 其中 arr > 5 的结果就是上一节提到的掩码,最后过滤出的元素就是根据这个掩码得到的。
除了跟单独的数字比较,也可以和数组比较:
arr1 = np.random.randint(0, 10, (3, 3))print(arr1)#运行结果[[3 4 7] [4 6 2] [7 2 1]]arr2 = np.random.randint(0, 10, (3, 3))print(arr2)#运行结果[[2 3 1] [7 7 7] [1 6 4]]print(arr1[arr1 > arr2])#运行结果[3 4 7 7]多条件过滤多条件过滤使用 & 和 | 来连接不同的条件。
arr1 = np.random.randint(0, 10, (3, 3))print(arr1)#运行结果[[1 0 5] [7 4 9] [8 5 4]]arr2 = np.random.randint(0, 10, (3, 3))print(arr2)#运行结果[[6 4 1] [0 1 1] [8 5 8]]print(arr1[(arr1 > 5) & (arr1 > arr2)])#运行结果[7 9]过滤arr1中大于5** 并且 **对应位置比arr2大的元素。
arr1 = np.random.randint(0, 10, (3, 3))print(arr1)#运行结果[[1 0 5] [7 4 9] [8 5 4]]arr2 = np.random.randint(0, 10, (3, 3))print(arr2)#运行结果[[6 4 1] [0 1 1] [8 5 8]]print(arr1[(arr1 > 5) | (arr1 > arr2)])#运行结果[5 7 4 9 8]过滤arr1中大于5 或者对应位置比arr2大的元素。
总结回顾本篇主要介绍了过滤的基本原理,首先从比较开始,比较的结果是掩码,最后通过掩码过滤数组。
挂式无线蓝牙耳机防水通音膜是如何实现IP67级防水的
苹果自研汽车,连接器供应将花落谁家?
环境网格化微型监测系统为城市环境保驾‘护航’
全球首座采用免涂装耐候钢的跨海大桥南岸主塔正式封顶
Ansys携手索尼推新一代汽车图像传感器仿真
Numpy基础之数组过滤功能介绍
乐视收购北美市占率第一电视品牌Vizio最快要等到2017年
德勤分析:全球电动车到2030年前或将达到3110万辆
OpenAI最新大模型曝光!剑指多模态,GPT-4之后最大升级!
安防监控领域如何选用红外热成像仪的关键技术指标
浅谈卷积运算在数字信号处理的应用与优势
基于GR47模块和PIC18f6720单片机实现GPRS通信系统的设计
Virtual Antenna™技术改变物联网设备的研发与制造
华为云通过端云协同技术优势,帮助和赋能互联网企业出海
工业机器人强大后的挑战有哪些
有方科技亮相欧洲电力及新能源展 助力能源物联网优化升级
5G/IoT设备必不可少的体温计——热敏电阻
Note 10系列相册已经可以与OneDrive云存储进行同步
APUS李涛受聘为深圳人工智能行业协会专家委员会专家
如何为物联网传感器选择合适的电流隔离技术