****欧欧美毛片4,国产午夜精品视频,97视频在线观看免费视频,久久七国产精品

數據恢復咨詢熱線:400-666-3702??

歡迎訪問南京兆柏數據恢復公司,專業數據恢復15年

兆柏數據恢復公司

?常見問題

?當前位置: 主頁 > 常見問題

MySQL事務已提交,數據卻丟了,趕緊檢查下這個配置

瀏覽量: 次 發布日期:2023-10-11 19:27:14

MySQL事務已提交,數據卻丟了,趕緊檢查下這個配置

  有個水友提問:

  沈老師,我們有一次MySQL崩潰,重啟后發現有些已經提交的事務對數據的修改丟失了,不是說事務能保證ACID特性么,想問下什么情況下可能導致“事務已經提交,數據卻丟失”呢?

  這個問題有點復雜,得先從redo log說起。

  為什么要有redo log?

  事務提交后,必須將事務對數據頁的修改刷(fsync)到磁盤上,才能保證事務的ACID特性。

  這個刷盤,是一個隨機寫,隨機寫性能較低,如果每次事務提交都刷盤,會極大影響數據庫的性能。

  隨機寫性能差,有什么優化方法呢?

  架構設計中有兩個常見的優化方法:

  (1)先寫日志(write log first),將隨機寫優化為順序寫;

  (2)將每次寫優化為批量寫;

  這兩個優化,數據庫都用上了。

  先說第一個優化,將對數據的修改先順序寫到日志里,這個日志就是redo log。

  假如某一時刻,數據庫崩潰,還沒來得及將數據頁刷盤,數據庫重啟時,會重做redo log里的內容,以保證已提交事務對數據的影響被刷到磁盤上。

  一句話,redo log是為了保證已提交事務的ACID特性,同時能夠提高數據庫性能的技術。

  既然redo log能保證事務的ACID特性,那為什么還會出現,水友提問中出現的“數據庫崩潰,丟數據”的問題呢?一起看下redo log的實現細節。

  redo log的三層架構?

  畫了一個丑圖,簡單說明下redo log的三層架構:

  (1)粉色,是InnoDB的一項很重要的內存結構(In-Memory Structure),日志緩沖區(Log Buffer),這一層,是MySQL應用程序用戶態;

  (2)屎黃色,是操作系統的緩沖區(OS cache),這一層,是OS內核態;

  (3)藍色,是落盤的日志文件;

  redo log最終落盤的步驟如何?

  首先,事務提交的時候,會寫入Log Buffer,這里調用的是MySQL自己的函數WriteRedoLog;

  接著,只有當MySQL發起系統調用寫文件write時,Log Buffer里的數據,才會寫到OS cache。注意,MySQL系統調用完write之后,就認為文件已經寫完,如果不flush,什么時候落盤,是操作系統決定的;

  畫外音:有時候打日志,明明printf了,tail -f卻看不到,就是這個原因,操作系統還沒有刷盤。

  最后,由操作系統(當然,MySQL也可以主動flush)將OS cache里的數據,最終fsync到磁盤上;

  操作系統為什么要緩沖數據到OS cache里,而不直接刷盤呢?

  這里就是將“每次寫”優化為“批量寫”,以提高操作系統性能。

  數據庫為什么要緩沖數據到Log Buffer里,而不是直接write呢?

  這也是“每次寫”優化為“批量寫”思路的體現,以提高數據庫性能。

  畫外音:這個優化思路,非常常見,高并發的MQ落盤,高并發的業務數據落盤,都可以使用。

  redo log的三層架構,MySQL做了一次批量寫優化,OS做了一次批量寫優化,確實能極大提升性能,但有什么副作用嗎?

  畫外音:有優點,必有缺點。

  這個副作用,就是可能丟失數據:

  (1)事務提交時,將redo log寫入Log Buffer,就會認為事務提交成功;

  (2)如果寫入Log Buffer的數據,write入OS cache之前,數據庫崩潰,就會出現數據丟失

  (3)如果寫入OS cache的數據,fsync入磁盤之前,操作系統崩潰,也可能出現數據丟失;

  畫外音:如上文所說,應用程序系統調用完write之后(不可能每次write后都立刻flush,這樣寫日志很蠢),就認為寫成功了,操作系統何時fsync,應用程序并不知道,如果操作系統崩潰,數據可能丟失。

  任何脫離業務的技術方案都是耍流氓:

  (1)有些業務允許低效,但不允許一丁點數據丟失;

  (2)有些業務必須高性能高吞吐,能夠容忍少量數據丟失;

  MySQL是如何折衷的呢?

  MySQL有一個參數:

  innodb_flush_log_at_trx_commit

  能夠控制事務提交時,刷redo log的策略。

浦東數據恢復

  目前有三種策略:

  策略一:最佳性能(

  innodb_flush_log_at_trx_commit=0)

  每隔一秒,才將Log Buffer中的數據批量write入OS cache,同時MySQL主動fsync。

  這種策略,如果數據庫崩潰,有一秒的數據丟失。

  策略二:強一致(

  innodb_flush_log_at_trx_commit=1)

  每次事務提交,都將Log Buffer中的數據write入OS cache,同時MySQL主動fsync。

  這種策略,是InnoDB的默認配置,為的是保證事務ACID特性。

  策略三:折衷(

  innodb_flush_log_at_trx_commit=2)

  每次事務提交,都將Log Buffer中的數據write入OS cache;

  每隔一秒,MySQL主動將OS cache中的數據批量fsync。

陸家嘴數據恢復

  畫外音:磁盤IO次數不確定,因為操作系統的fsync頻率并不是MySQL能控制的。

  這種策略,如果操作系統崩潰,最多有一秒的數據丟失。

  畫外音:因為OS也會fsync,MySQL主動fsync的周期是一秒,所以最多丟一秒數據。

  講了這么多,回到水友的提問上來,數據庫崩潰,重啟后丟失了數據,有很大的可能,是將

  innodb_flush_log_at_trx_commit參數設置為0了,這位水友最好和DBA一起檢查一下InnoDB的配置。

  可能有水友要問,高并發的業務,InnoDB運用哪種刷盤策略最合適?

  高并發業務,行業最佳實踐,是使用第三種折衷配置(=2),這是因為:

  (1)配置為2和配置為0,性能差異并不大,因為將數據從Log Buffer拷貝到OS cache,雖然跨越用戶態與內核態,但畢竟只是內存的數據拷貝,速度很快;

相關推薦