使用 Python 解析并“篡改”MySQL的 Binlog( 三 )

这个 Binlog 的两个 insert 是在一个事务里面完成的 , 我们可以两个事务之间插入 xid、Anonymous_Gtid、Query 等三个事件把一个事务切割成两个事务 。 Rows_query 这个事件不用插入 , 这个事件是注释掉了的 , 记录的是执行的 SQL , 这个事件只有在参数 binlog_rows_query_log_events 为 on 时才会有 , 默认是 off。
相应的 Python 程序如下:
# cat splitTran.py #! /usr/bin/python3import sysif len(sys.argv) != 3:print ('Please run splitTrans.py inputBinlog changedBinlog.')sys.exit()inputBinlog=open(sys.argv[1],"rb")changedBinlog=open(sys.argv[2],"wb")changedBinlog.write(inputBinlog.read(429))# read from the head ofinput binlog file to the first insert, then write into the changed binlog file.firstInsert=inputBinlog.tell()inputBinlog.seek(567,0)# locate to the xid eventchangedBinlog.write(inputBinlog.read(31))# read from 567 to 598, write xid event, into the changed binlog file.inputBinlog.seek(154,0)# locate to the Anonymous_Gtid, Query events.changedBinlog.write(inputBinlog.read(137))# read from 154 to 291, write Anonymous_Gtid, Query events into changed binlog file.inputBinlog.seek(firstInsert)while True:line = inputBinlog.readline()if not line:breakchangedBinlog.write(line)inputBinlog.close()changedBinlog.close()我们执行这个 Python 程序 , 生成一个新的 Binlog, 然后把新的 Binlog 应用到 MySQL 。
$./splitTran.py scut.000025 scut.000025_ch$ mysqlbinlog scut.000025_ch |mysql我们看看执行地效果:
mysql> show binlog events in 'scut.000026';+-------------+-----+----------------+-----------+-------------+------------------------------------------------------------------------------------------------------------------------------------+| Log_name| Pos | Event_type| Server_id | End_log_pos | Info|+-------------+-----+----------------+-----------+-------------+------------------------------------------------------------------------------------------------------------------------------------+| scut.000026 |4 | Format_desc|1024 |123 | Server ver: 5.7.31-0ubuntu0.16.04.1-log, Binlog ver: 4|| scut.000026 | 123 | Previous_gtids |1024 |154 ||| scut.000026 | 154 | Anonymous_Gtid |1024 |219 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'|| scut.000026 | 219 | Query|1024 |287 | BEGIN|| scut.000026 | 287 | Rows_query|1024 |439 | # BINLOG 'EbA7XxMABAAAMAAAAIcBAAAAAG8AAAAAAAEABHRlc3QAA3R0MQAB/gL+QAEYYumNEbA7Xx4ABAAAJgAAAK0BAAAAAG8AAAAAAAEAAgAB//4BMeeyFcw=' || scut.000026 | 439 | Table_map|1024 |487 | table_id: 111 (test.tt1)|| scut.000026 | 487 | Write_rows|1024 |525 | table_id: 111 flags: STMT_END_F|| scut.000026 | 525 | Xid|1024 |556 | COMMIT /* xid=425 */|| scut.000026 | 556 | Anonymous_Gtid |1024 |621 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'|| scut.000026 | 621 | Query|1024 |689 | BEGIN|| scut.000026 | 689 | Rows_query|1024 |841 | # BINLOG 'F7A7XxMABAAAMAAAABECAAAAAG8AAAAAAAEABHRlc3QAA3R0MQAB/gL+QAE+WKbjF7A7Xx4ABAAAJgAAADcCAAAAAG8AAAAAAAEAAgAB//4BMmfP2Zk=' || scut.000026 | 841 | Table_map|1024 |889 | table_id: 111 (test.tt1)|| scut.000026 | 889 | Write_rows|1024 |927 | table_id: 111 flags: STMT_END_F|| scut.000026 | 927 | Xid|1024 |958 | COMMIT /* xid=432 */|+-------------+-----+----------------+-----------+-------------+------------------------------------------------------------------------------------------------------------------------------------+14 rows in set (0.00 sec)我们看到两个 insert 已经分开到两个事务里面了 。
后记ROW 模式下 , 即使我们只更新了一条记录的其中某个字段 , 也会记录每个字段变更前后的值 , 这个行为是 binlog_row_image 参数控制的 , 这个参数有 3 个值 , 默认为 FULL , 也就是记录列的所有修改 , 即使字段没有发生变更也会记录 。 这样我们就可以实现类似 Oracle 的 flashback 的功能 , 我个人估计 MySQL 未来的版本从可能会基于 Binlog 推出这样的功能 。 了解了 Binlog 的结构 , 再加上 Python 这把瑞士军刀 , 我们还可以实现很多功能 , 例如我们可以统计哪个表被修改地最多?我们还可以把 Binlog 切割成一段一段的 , 然后再重组 , 可以灵活地进行 MySQL 数据库的修改和迁移等工作 。