概述
sql.DB
不是一个连接,它是数据库的抽象接口。它可以根据 driver 打开关闭数据库连接,管理连接池。正在使用的连接被标记为繁忙,用完后回到连接池等待下次使用。所以,如果你没有把连接释放回连接池,会导致过多连接使系统资源耗尽。
使用 DB
导入 driver
这里使用的是 MySQL drivers
1 | import ( |
连接 DB
1 | func main() { |
sql.Open
的第一个参数是 driver 名称,第二个参数是 driver 连接数据库的信息,各个 driver 可能不同。DB 不是连接,并且只有当需要使用时才会创建连接,如果想立即验证连接,需要用 Ping()
方法,如下:
1 | err = db.Ping() |
sql.DB 的设计就是用来作为长连接使用的。不要频繁 Open,Close。
比较好的做法是,为每个不同的 datastore 建一个 DB 对象,保持这些对象 Open。如果需要短连接,那么把 DB 作为参数传入 function,而不要在 function 中 Open, Close。
读取 DB
如果方法包含 Query
,那么这个方法是用于查询并返回 rows 的。其他情况应该用 Exec()
。
1 | var ( |
上面代码的过程为:db.Query()
表示向数据库发送一个 query,defer rows.Close()
非常重要,遍历 rows 使用 rows.Next()
, 把遍历到的数据存入变量使用 rows.Scan()
, 遍历完成后检查 error。有几点需要注意:
- 检查遍历是否有 error
- 结果集 (rows) 未关闭前,底层的连接处于繁忙状态。当遍历读到最后一条记录时,会发生一个内部 EOF 错误,自动调用
rows.Close()
,但是如果提前退出循环,rows 不会关闭,连接不会回到连接池中,连接也不会关闭。所以手动关闭非常重要。rows.Close()
可以多次调用,是无害操作。
单行 Query
err 在 Scan
后才产生,所以可以如下写:
1 | var name string |
修改数据,事务
一般用 Prepared Statements 和 Exec()
完成 INSERT
, UPDATE
, DELETE
操作。
1 | stmt, err := db.Prepare("INSERT INTO users(name) VALUES(?)") |
事务
db.Begin()
开始事务,Commit()
或 Rollback()
关闭事务。Tx
从连接池中取出一个连接,在关闭之前都是使用这个连接。Tx 不能和 DB 层的 BEGIN
, COMMIT
混合使用。
如果你需要通过多条语句修改连接状态,你必须使用 Tx,例如:
- 创建仅对单个连接可见的临时表
- 设置变量,例如
SET @var := somevalue
- 改变连接选项,例如字符集,超时
Prepared Statements
Prepared Statements and Connection
在数据库层面,Prepared Statements 是和单个数据库连接绑定的。客户端发送一个有占位符的 statement 到服务端,服务器返回一个 statement ID,然后客户端发送 ID 和参数来执行 statement。
在 GO 中,连接不直接暴露,你不能为连接绑定 statement,而是只能为 DB 或 Tx 绑定。database/sql
包有自动重试等功能。当你生成一个 Prepared Statement
- 自动在连接池中绑定到一个空闲连接
Stmt
对象记住绑定了哪个连接- 执行
Stmt
时,尝试使用该连接。如果不可用,例如连接被关闭或繁忙中,会自动 re-prepare,绑定到另一个连接。
这就导致在高并发的场景,过度使用 statement 可能导致 statement 泄漏,statement 持续重复 prepare 和 re-prepare 的过程,甚至会达到服务器端 statement 数量上限。
某些操作使用了 PS,例如 db.Query(sql, param1, param2)
, 并在最后自动关闭 statement。
有些场景不适合用 statement:
- 数据库不支持。例如 Sphinx,MemSQL。他们支持 MySQL wire protocol, 但不支持 “binary” protocol。
- statement 不需要重用很多次,并且有其他方法保证安全。例子
在 Transaction 中使用 PS
PS 在 Tx 中唯一绑定一个连接,不会 re-prepare。
Tx 和 statement 不能分离,在 DB 中创建的 statement 也不能在 Tx 中使用,因为他们必定不是使用同一个连接使用 Tx 必须十分小心,例如下面的代码:
1 | tx, err := db.Begin() |
*sql.Tx
一旦释放,连接就回到连接池中,这里 stmt 在关闭时就无法找到连接。所以必须在 Tx commit 或 rollback 之前关闭 statement。
处理 Error
循环 Rows 的 Error
如果循环中发生错误会自动运行 rows.Close()
,用 rows.Err()
接收这个错误,Close 方法可以多次调用。循环之后判断 error 是非常必要的。
1 | for rows.Next() { |
关闭 Resultsets 时的 error
如果你在 rows 遍历结束之前退出循环,必须手动关闭 Resultset,并且接收 error。
1 | for rows.Next() { |
QueryRow () 的 error
1 | var name string |
如果 id 为 1 的不存在,err 为 sql.ErrNoRows,一般应用中不存在的情况都需要单独处理。此外,Query 返回的错误都会延迟到 Scan 被调用,所以应该写成如下代码:
1 | var name string |
把空结果当做 Error 处理是为了强行让程序员处理结果为空的情况
分析数据库 Error
各个数据库处理方式不太一样,mysql 为例:
1 | if driverErr, ok := err.(*mysql.MySQLError); ok { |
MySQLError
, Number
都是 DB 特异的,别的数据库可能是别的类型或字段。这里的数字可以替换为常量,例如这个包 MySQL error numbers maintained by VividCortex
连接错误
NULL 值处理
简单说就是设计数据库的时候不要出现 null,处理起来非常费力。Null 的 type 很有限,例如没有 sql.NullUint64
; null 值没有默认零值。
1 | for rows.Next() { |
未知 Column
rows.Columns()
的使用,用于处理不能得知结果字段个数或类型的情况,例如:
1 | cols, err := rows.Columns() |
关于连接池
- 避免错误操作,例如 LOCK TABLE 后用 INSERT 会死锁,因为两个操作不是同一个连接,insert 的连接没有 table lock。
- 当需要连接,且连接池中没有可用连接时,新的连接就会被创建。
- 默认没有连接上限,你可以设置一个,但这可能会导致数据库产生错误 “too many connections”
db.SetMaxIdleConns(N)
设置最大空闲连接数db.SetMaxOpenConns(N)
设置最大打开连接数- 长时间保持空闲连接可能会导致 db timeout