前言
数组类型是各种编程语言中基本的数组结构了,本文来盘点下Python中各种“数组”类型的实现。
- list
- tuple
- array.array
- str
- bytes
- bytearray
其实把以上类型都说成是数组是不准确的。这里把数组当作一个广义的概念,即把列表、序列、数组都当作array-like数据类型来理解。
注意本文所有代码都是在Python3.7中跑的^_^
0x00 可变的动态列表list
list应该是Python最常用到的数组类型了。它的特点是可变的、能动态扩容,可存储Python中的一切对象,使用时不用指定存储的元素的类型。
使用非常简单
>>> arr = ["one","two","three"] >>> arr[0] 'one' # 动态扩容 >>> arr.a<em>本文来源[email protected]搞@^&代*@码2网</em>ppend(4) >>> arr ['one', 'two', 'three', 4] # 删除一个元素 >>> del arr[2] >>> arr ['one', 'two', 4]
0x01 不可变的tuple
tuple的操作与list类似。它的特点是不可变,不能扩容,可存储Python中的一切对象,使用时不用指定存储的元素的类型。
>>> t = 'one','two',3 >>> t ('one', 'two', 3) >>> t.append(4) AttributeError: 'tuple' object has no attribute 'append' >>> del t[0] TypeError: 'tuple' object doesn't support item deletion
tuple可以使用+运算符,这个运算将创建一个新的tuple对象用于存储数据。
>>> t+(1,) ('one', 'two', 3, 1) >>> tcopy = t+(1,) >>> tcopy ('one', 'two', 3, 1) >>> id(tcopy) 4604415336 >>> id(t) 4605245696
可以看出tuple执行+运算符之后两个对象的地址是不一样
0x02 array.array
如果在Python中要用到其它语言中类似“数组”的数据结构,就需要用到array模块了。它的特点是可变的、存储相同类型的数值,不能存储对象。
因为array在使用的时候要指定元素数据类型,因此它比list和tuple都有比较高效空间性能。
# 使用时指定元素数据类型为`float` >>> arr = array.array('f', (1.0, 1.5, 2.0, 2.5)) >>> arr array('f', [1.0, 1.5, 2.0, 2.5]) # 修改一个元素 >>> arr[1]=12.45 >>> arr array('f', [1.0, 12.449999809265137, 2.0, 2.5]) # 删除一个元素 >>> del arr[2] >>> arr array('f', [1.0, 12.449999809265137, 2.5]) # 增加一个元素 >>> arr.append(4.89) >>> arr array('f', [1.0, 12.449999809265137, 2.5, 4.889999866485596]) # 如果将一个字符串类型数据存储到一个浮点数的数组将会报错 >>> arr[0]='hello' TypeError: must be real number, not str
array中元素的数据类型可以参考下表
Type code | C Type | Python Type |
---|---|---|
‘b’ | signed char | int |
‘B’ | unsigned char | int |
‘u’ | Py_UNICODE | Unicode character |
‘h’ | signed short | int |
‘H’ | unsigned short | int |
‘i’ | signed int | int |
‘I’ | unsigned int | int |
‘l’ | signed long | int |
‘L’ | unsigned long | int |
‘q’ | signed long long | int |
‘Q’ | unsigned long long | int |
‘f’ | float | float |
‘d’ | double | float |