September 20, 2019

分析MySQL Server has gone away报错, MySQL Server has gone away解决方案

By Gideon Php / Pear / Mysql / Node.js 0 Comments

在执行一个sql文件时mysql -h 127.0.0.1 -uroot study -e"source b.sql"，报错MySQL server has gone away。上网查解决办法，按照网上的解决方法一步步操作，最终找到原因并且解决了，觉得有必要总结下这个问题发生的原因及解决办法，避免后面再继续踩坑。

原因1. MySQL 服务宕了

判断是否属于这个原因的方法很简单，执行以下命令，查看mysql的运行时长

$ mysql -uroot -p -e "show global status like 'uptime';"
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Uptime        | 68928 |
+---------------+-------+
1 row in set (0.04 sec)

或者查看MySQL的报错日志，看看有没有重启的信息

$ tail /var/log/mysql/error.log
130101 22:22:30 InnoDB: Initializing buffer pool, size = 256.0M
130101 22:22:30 InnoDB: Completed initialization of buffer pool
130101 22:22:30 InnoDB: highest supported file format is Barracuda.
130101 22:22:30 InnoDB: 1.1.8 started; log sequence number 63444325509
130101 22:22:30 [Note] Server hostname (bind-address): '127.0.0.1'; port: 3306
130101 22:22:30 [Note]   - '127.0.0.1' resolves to '127.0.0.1';
130101 22:22:30 [Note] Server socket created on IP: '127.0.0.1'.
130101 22:22:30 [Note] Event Scheduler: Loaded 0 events
130101 22:22:30 [Note] /usr/sbin/mysqld: ready for connections.
Version: '5.5.28-cll'  socket: '/var/lib/mysql/mysql.sock'  port: 3306  MySQL Community Server (GPL)

如果uptime数值很大，表明mysql服务运行了很久了。说明最近服务没有重启过。如果日志没有相关信息，也说明mysql服务最近没有重启过，可以继续检查下面几项内容。

原因2. 连接超时

如果程序使用的是长连接，则这种情况的可能性会比较大。即，某个长连接很久没有新的请求发起，达到了server端的timeout，被server强行关闭。此后再通过这个connection发起查询的时候，就会报错server has gone away

$ mysql -uroot -p -e "show global variables like '%timeout';"
+----------------------------+----------+
| Variable_name              | Value    |
+----------------------------+----------+
| connect_timeout            | 30       |
| delayed_insert_timeout     | 300      |
| innodb_lock_wait_timeout   | 50       |
| innodb_rollback_on_timeout | OFF      |
| interactive_timeout        | 28800    |
| lock_wait_timeout          | 31536000 |
| net_read_timeout           | 30       |
| net_write_timeout          | 60       |
| slave_net_timeout          | 3600     |
| wait_timeout               | 28800    |
+----------------------------+----------+

mysql> SET SESSION wait_timeout=5;


# Wait 10 seconds

mysql> SELECT NOW();
ERROR 2006 (HY000): MySQL server has gone away
No connection. Trying to reconnect...
Connection id:    132361
Current database: *** NONE ***

+---------------------+
| NOW()               |
+---------------------+
| 2013-01-02 11:31:15 |
+---------------------+
1 row in set (0.00 sec)

如果你的 wait_timeout 为 10，或者比较小的数字，你可以通过重新设置 wait_timeout 为 28800 （即默认的8个小时）。

我的理解是：比如讲wait_timeout值设置为100s意思是说在你访问数据库的间隔超过100s服务器会与客户端断开连接，再次访问数据库则能再次建立连接。

有时候需要同时设置interactive_timeout和wait_timeout才会生效。只需要对MySQL的配置文件进行修改就可以了。
1. Windows下，配置文件路径为MySQL安装的根目录中。my.ini
2. Linux系统下，配置文件为路径/etc/my.cnf

文件中加入

[mysqld]   
wait_timeout=20  
interactive_timeout=20

重启mysql

sudo /etc/init.d/mysql restart

然后重新查询

show global variables like '%timeout';

如果没有变化的话，那么修改的my.cnf的文件不对，因为服务器内，可能有多个my.cnf。你可以通过查找文件看到：

sudo find /etc/ -name "my.cnf"

# 结果
# /etc/alternatives/my.cnf
# /etc/my.cnf
# /etc/mysql/my.cnf

可以尝试：

sudo vi /etc/mysql/my.cnf

# 如果上面的也没有，可以尝试
# sudo vi /etc/mysql/mysql.conf.d/mysqld.cnf

添加

[mysqld]
wait_timeout = 31536000
interactive_timeout = 31536000

保存后，重启msyql

sudo service mysql restart

原因3. 进程在server端被主动kill

这种情况和情况2相似，只是发起者是DBA或者其他job。发现有长时间的慢查询执行kill xxx导致。

$ mysql -uroot -p -e "show global status like 'com_kill'"
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Com_kill      | 0     |
+---------------+-------+

原因4. Your SQL statement was too large.

当查询的结果集超过 max_allowed_packet 也会出现这样的报错。定位方法是打出相关报错的语句。用select * into outfile 的方式导出到文件，查看文件大小是否超过 max_allowed_packet ，如果超过则需要调整参数，或者优化语句。

mysql> show global variables like 'max_allowed_packet';
+--------------------+----------+
| Variable_name      | Value    |
+--------------------+----------+
| max_allowed_packet | 16777216 |
+--------------------+----------+
1 row in set (0.00 sec)

计算发现SQL执行文件最大只能是16M，而文章开头执行的a.sql有24M。
修改参数，max_allowed_packet 调整为28M。

mysql> set global max_allowed_packet=1024*1024*28;
Query OK, 0 rows affected (0.00 sec)

mysql> show global variables like 'max_allowed_packet';
+--------------------+----------+
| Variable_name      | Value    |
+--------------------+----------+
| max_allowed_packet | 29360128 |
+--------------------+----------+
1 row in set (0.00 sec)

修改 max_allowed_packet 的方法，也可以参照 原因三 中 wait_timeout 修改方法，方法完全一样，真是改一下参数名称和参数的值。

重新再执行`mysql -h 127.0.0.1 -uroot study -e”source b.sql”“成功，说明原因是情况4造成的。

应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server has gone away。

大概浏览了一下，主要可能是因为以下几种原因：
一种可能是发送的SQL语句太长，以致超过了max_allowed_packet的大小，如果是这种原因，你只要修改my.cnf，加大max_allowed_packet的值即可。

还有一种可能是因为某些原因导致超时，比如说程序中获取数据库连接时采用了Singleton的做法，虽然多次连接数据库，但其实使用的都是同一个连接，而且程序中某两次操作数据库的间隔时间超过了wait_timeout（SHOW STATUS能看到此设置），那么就可能出现问题。最简单的处理方式就是把wait_timeout改大，当然你也可以在程序里时不时顺手mysql_ping()一下，这样MySQL就知道它不是一个人在战斗。

解决MySQL server has gone away1、应用程序（比如PHP）长时间的执行批量的MYSQL语句。最常见的就是采集或者新旧数据转化。
解决方案：
在my.cnf文件中添加或者修改以下两个变量：
wait_timeout=2880000
interactive_timeout = 2880000
关于两个变量的具体说明可以google或者看官方手册。如果不能修改my.cnf，则可以在连接数据库的时候设置CLIENT_INTERACTIVE，比如：
sql = “set interactive_timeout=24*3600”;
mysql_real_query(…)

2、执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理
解决方案：
在my.cnf文件中添加或者修改以下变量：
max_allowed_packet = 10M(也可以设置自己需要的大小)
max_allowed_packet 参数的作用是，用来控制其通信缓冲区的最大长度。

第一种方法：
当然是增加你的 wait-timeout值，这个参数是在my.cnf(在Windows下台下面是my.ini）中设置，我的数据库负荷稍微大一点，所以，我设置的值为10，（这个值的单位是秒，意思是当一个数据库连接在10秒钟内没有任何操作的话，就会强行关闭，我使用的不是永久链接（mysql_pconnect),用的是mysql_connect,关于这个wait-timeout的效果你可以在MySQL的进程列表中看到（show processlist) ），你可以把这个wait-timeout设置成更大，比如300秒，呵呵，一般来讲300秒足够用了，其实你也可以不用设置，MySQL默认是8个小时。情况由你的服务器和站点来定。

第二种方法：
这也是我个人认为最好的方法，即检查 MySQL的链接状态，使其重新链接。
可能大家都知道有mysql_ping这么一个函数，在很多资料中都说这个mysql_ping的 API会检查数据库是否链接，如果是断开的话会尝试重新连接，但在我的测试过程中发现事实并不是这样子的，是有条件的，必须要通过 mysql_options这个C API传递相关参数，让MYSQL有断开自动链接的选项（MySQL默认为不自动连接），但我测试中发现PHP的MySQL的API中并不带这个函数，你重新编辑MySQL吧，呵呵。但mysql_ping这个函数还是终于能用得上的，只是要在其中有一个小小的操作技巧：

这是我的的数据库操作类中间的一个函数

function ping(){
    if(!mysql_ping($this->link)){
        mysql_close($this->link); //注意：一定要先执行数据库关闭，这是关键
        $this->connect();
    }
}

我需要调用这个函数的代码可能是这样子的

$str = file_get_contents('//www.ikeepstudying.com');
$db->ping();//经过前面的网页抓取后，或者会导致数据库连接关闭,检查并重新连接
$db->query('select * from table');

ping()这个函数先检测数据连接是否正常，如果被关闭，整个把当前脚本的MYSQL实例关闭，再重新连接。
经过这样处理后，可以非常有效的解决MySQL server has gone away这样的问题，而且不会对系统造成额外的开销。

本文：分析MySQL Server has gone away报错, MySQL Server has gone away解决方案

Tags:MySQL Server has gone away解决方案, 分析MySQL Server has gone away报错

Just Code

分析MySQL Server has gone away报错, MySQL Server has gone away解决方案

原因1. MySQL 服务宕了

原因2. 连接超时

原因3. 进程在server端被主动kill

原因4. Your SQL statement was too large.

About Author

Gideon

Add a Comment

原因1. MySQL 服务宕了

原因2. 连接超时

原因3. 进程在server端被主动kill

原因4. Your SQL statement was too large.

Related Posts

Related Posts

About Author

Gideon

Add a Comment