盘点 Python 10 大常用数据结构(上篇)

开发 后端
如果你还处于Python入门阶段,通常只需掌握list、tuple、set、dict这类数据结构,做到灵活使用即可。这个专题,尽量使用最精简的文字,借助典型案例盘点Python常用的数据结构。

Python 常用数据结构学习目的

这个专题,尽量使用最精简的文字,借助典型案例盘点Python常用的数据结构。

如果你还处于Python入门阶段,通常只需掌握list、tuple、set、dict这类数据结构,做到灵活使用即可。

然而,随着学习的深入,平时遇到实际场景变复杂,很有必要去了解Python内置的更加强大的数据结构deque、heapq、Counter、OrderedDict、defaultDict、ChainMap,掌握它们,往往能让你少写一些代码且能更加高效的实现功能。

 

我的施工之路

学习目标

  • 学习数据结构第一阶段:掌握它们的基本用法,使用它们解决一些基本问题;
  • 学习第二阶段:知道何种场景选用哪种最恰当的数据结构,去解决题问题;
  • 学习第三阶段:了解内置数据结构的背后源码实现,与《算法和数据结构》这门学问里的知识联系起来,打通任督二脉。

下面根据定义的这三个阶段,总结以下10种最常用的数据结构:

1. list

基本用法 废话不多说,在前面单独有一个专题详述了list的使用列表专题

使用场景 list 使用在需要查询、修改的场景,极不擅长需要频繁插入、删除元素的场景。

实现原理 list对应数据结构的线性表,列表长度在初始状态时无需指定,当插入元素超过初始长度后再启动动态扩容,删除时尤其位于列表开始处元素,时间复杂度为O(n)

2. tuple

元组是一类不允许添加删除元素的特殊列表,也就是一旦创建后续决不允许增加、删除、修改。

基本用法 元组大量使用在打包和解包处,如函数有多个返回值时打包为一个元组,赋值到等号左侧变量时解包。

  1. In [22]: t=1,2,3                                          
  2. In [23]: type(t)                               
  3. Out[23]: tuple 

实际创建一个元组实例

使用场景 如果非常确定你的对象后面不会被修改,则可以大胆使用元组。为什么?因为相比于list, tuple实例更加节省内存,这点尤其重要。

  1. In [24]: from sys import getsizeof                                               
  2.  
  3. In [25]: getsizeof(list())                                                       
  4. Out[25]: 72 # 一个list实例占用72个字节 
  5.  
  6. In [26]: getsizeof(tuple())                                                      
  7. Out[26]: 56 # 一个tuple实例占用56个字节 

所以创建100个实例,tuple能节省1K多字节。

3. set

基本用法 set是一种里面不能含有重复元素的数据结构,这种特性天然的使用于列表的去重。

  1. In [27]: a=[3,2,5,2,5,3]                                                         
  2.  
  3. In [28]: set(a)                                                                  
  4. Out[28]: {2, 3, 5} 

除此之外,还有知道set结构可用于两个set实例的求交集、并集、差集等操作。

  1. In [29]: a = {2,3,5}                                                             
  2.  
  3. In [30]: b = {3,4,6,2}                                                           
  4.  
  5. In [31]: a.intersection(b) # 求交集                                                       
  6. Out[31]: {2, 3} 

使用场景 如果只是想缓存某些元素值,且要求元素值不能重复时,适合选用此结构。并且set内允许增删元素,且效率很高。

实现原理 set在内部将值哈希为索引,然后按照索引去获取数据,因此删除、增加、查询元素效果都很高。

4. dict

基本用法 dict 是Python中使用最频繁的数据结构之一,字典创建由通过dict函数、{}写法、字典生成式等,增删查元素效率都很高。

  1. d = {'a':1,'b':2} # {}创建字典 
  2.  
  3. # 列表生成式 
  4. In [38]: d = {a:b for a,b in zip(['a','b'],[1,2])}                               
  5. In [39]: d                                                                       
  6. Out[39]: {'a': 1, 'b': 2} 

使用场景 字典尤其适合在查询多的场景,时间复杂度为O(1). 如leetcode第一题求解两数之和时,就会使用到dict的O(1)查询时间复杂度。

同时,Python类中属性值等信息也都是缓存在__dict__这个字典型数据结构中。

但是值得注意,dict占用字节数是list、tuple的3、4倍,因此对内存要求苛刻的场景要慎重考虑。

  1. In [40]: getsizeof(dict())                                                       
  2. Out[40]: 248 

实现原理 字典是一种哈希表,同时保存了键值对。

以上4种数据结构相信大家都已经比较熟悉,因此我言简意赅的介绍一遍。接下来再详细的介绍下面6种数据结构及各自使用场景,会列举更多的例子。

  • 5.  deque
  • 6.  Counter
  • 7.  OrderedDict
  • 8. heapq
  • 9. defaultdict
  • 10. ChainMap

 

责任编辑:赵宁宁 来源: Python与算法社区
相关推荐

2020-08-02 23:13:29

python开发数据结构

2012-04-28 14:21:47

Java数据结构线性结构

2011-03-30 09:07:46

数据库

2021-04-12 10:02:02

JavaList集合

2011-05-23 17:11:54

云端数据迁移

2014-07-01 15:49:33

数据结构

2019-04-14 22:22:28

Python数据结构算法

2021-07-16 07:57:34

Python数据结构

2023-04-27 09:13:20

排序算法数据结构

2017-03-15 14:20:46

2021-07-15 06:43:12

Python数据结构

2021-07-13 07:52:03

Python数据结构

2017-03-01 13:58:46

Python数据结构链表

2023-09-21 16:13:20

Python数据结构

2019-09-18 08:31:47

数据结构设计

2023-10-31 08:51:25

数据结构存储数据

2011-03-31 15:41:51

Cacti数据表结构

2017-03-14 13:39:08

2017-12-20 09:25:45

2017-08-03 11:11:05

点赞
收藏

51CTO技术栈公众号