为什么PyMySQL获取一条数据会让内存爆炸

开发 前端
当Python 有读写 MySQL 数据的需求时,我们经常使用PyMySQL这个第三方库来完成。

 当Python 有读写 MySQL 数据的需求时,我们经常使用PyMySQL这个第三方库来完成。

[[317112]]

有时候如果一张表里面的数据非常大,但是我们只需要读取一条数据,此时我们可能会想当然地使用cursor.fetchone()这个方法,以为这样就真的可以只读取一条数据:

 

  1. import pymysql 
  2.  
  3.  
  4. connection = pymysql.connect(host='localhost'
  5.                              user='user'
  6.                              password='passwd'
  7.                              db='db'
  8.                              charset='utf8mb4'
  9.                              cursorclass=pymysql.cursors.DictCursor) 
  10.                               
  11. with connection.cursor() as cursor
  12.     db = 'select * from users where age > 10' 
  13.     cursor.execute(db) 
  14.     one_user = cursor.fetchone() 

但实际上,上面这段代码,与下面这段代码没有任何区别:

 

  1. ... 
  2. with connection.cursor() as cursor
  3.     sql = 'select * from users where age > 10' 
  4.     cursor.execute(sql) 
  5.     all_users = cursor.fetchall() 
  6.     one_user = all_users[0] 

这是因为,当我们执行到cursor.execute(sql)的时候,PyMySQL就已经把表里面所有的数据读取到内存中了。而后面的cursor.fetchall()或者cursor.fetchone()只不过是从内存中返回全部数据还是返回1条数据而已。

我们来看PyMySQL的源代码[1]。在cursor.execute()方法代码如下图所示:

 

 

其中第163行调用了self._query方法。我们再去到这个方法里面:

 

看到代码第322行,调用了self._do_get_result()方法。我们再去这个方法里面看看:

 

注意代码第342行,此时已经把所有数据存放到了self._rows列表中。

现在我们来看cursor.fetchone()方法:

 

可以看到,这里不过是从列表里面根据下标读取一条数据出来而已。

再看cursor.fetchall()方法:

 

如果之前先多次调用过cursor.fetchone(),那么self.rownumber会持续增加。而调用cursor.fetchall()时,跳过之前已经返回过的数据,直接返回剩下的全部数据即可。如果之前没有调用过cursor.fetchone(),那么直接返回全部数据。

所以,单纯使用cursor.fetchone()并不能节省内存,如果表里面的数据非常大,还是会有内存爆炸的危险。

那么真正的解决办法是什么呢?真正的解决办法在创建数据库连接的时候指定游标类型。pymysql.connect有一个参数叫做cursorclass,把它的值设定为pymysql.SSDictCursor即可解决问题。

我们来看一下如何正确使用它:

 

  1. import pymysql 
  2.  
  3.  
  4. connection = pymysql.connect(host='localhost'
  5.                              user='user'
  6.                              password='passwd'
  7.                              db='db'
  8.                              charset='utf8mb4'
  9.                              cursorclass=pymysql.cursors.SSDictCursor) 
  10.                               
  11. with connection.cursor() as cursor
  12.     db = 'select * from users where age > 10' 
  13.     cursor.execute(db) 
  14.     for row in cursor
  15.         print('对 cursor 直接进行迭代,每循环一次,从数据库读取一条数据。不会提前把所有数据读取到内存中。'
  16.         print(row['name']) 

 

责任编辑:华轩 来源: 未闻Code
相关推荐

2023-06-18 23:13:27

MySQL服务器客户端

2019-06-24 11:07:34

数据数据库存储

2020-09-03 20:10:23

Elasticsear存储数据

2019-03-28 10:09:49

内存CPU硬盘

2018-03-30 09:42:05

2024-04-19 07:31:58

MySQL数据库

2023-09-01 14:07:00

ChatGPTGPT数据分析

2022-10-18 08:38:16

内存泄漏线程

2012-11-08 14:28:16

2021-02-09 09:50:21

SQLOracle应用

2024-02-01 18:07:37

2021-12-02 15:30:55

命令内存Linux

2018-04-24 14:58:06

内存降价涨价

2020-03-27 16:05:49

数据库数据MySQL

2012-06-20 16:22:57

2013-06-19 10:55:40

Disruptor并发框架

2022-05-31 13:58:09

MySQL查询语句

2022-05-18 08:25:59

MySQLutf8字符集数据库

2010-04-13 16:57:01

2020-10-26 08:02:28

SQL慢查询索引
点赞
收藏

51CTO技术栈公众号