遠程數據同步工具
rsync命令 是一個遠程數據同步工具,可通過LAN/WAN快速同步多臺主機間的文件。rsync使用所謂的“rsync算法”來使本地和遠程兩個主機之間的文件達到同步,這個算法只傳送兩個文件的不同部分,而不是每次都整份傳送,因此速度相當快。 rsync是一個功能非常強大的工具,其命令也有很多功能特色選項,我們下面就對它的選項一一進行分析說明。
rsync [OPTION]... SRC DEST
rsync [OPTION]... SRC [USER@]host:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
rsync [OPTION]... [USER@]HOST::SRC DEST
rsync [OPTION]... SRC [USER@]HOST::DEST
rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]
對應于以上六種命令格式,rsync有六種不同的工作模式:
rsync -a /data /backup
rsync -avz *.c foo:src
rsync -avz foo:src/bar /data
rsync -av root@192.168.78.192::www /databack
rsync -av /databack root@192.168.78.192::www
rsync -v rsync://192.168.78.192/www
-v, --verbose 詳細模式輸出。
-q, --quiet 精簡輸出模式。
-c, --checksum 打開校驗開關,強制對文件傳輸進行校驗。
-a, --archive 歸檔模式,表示以遞歸方式傳輸文件,并保持所有文件屬性,等于-rlptgoD。
-r, --recursive 對子目錄以遞歸模式處理。
-R, --relative 使用相對路徑信息。
-b, --backup 創建備份,也就是對于目的已經存在有同樣的文件名時,將老的文件重新命名為~filename。可以使用--suffix選項來指定不同的備份文件前綴。
--backup-dir 將備份文件(如~filename)存放在在目錄下。
-suffix=SUFFIX 定義備份文件前綴。
-u, --update 僅僅進行更新,也就是跳過所有已經存在于DST,并且文件時間晚于要備份的文件,不覆蓋更新的文件。
-l, --links 保留軟鏈結。
-L, --copy-links 想對待常規文件一樣處理軟鏈結。
--copy-unsafe-links 僅僅拷貝指向SRC路徑目錄樹以外的鏈結。
--safe-links 忽略指向SRC路徑目錄樹以外的鏈結。
-H, --hard-links 保留硬鏈結。
-p, --perms 保持文件權限。
-o, --owner 保持文件屬主信息。
-g, --group 保持文件屬組信息。
-D, --devices 保持設備文件信息。
-t, --times 保持文件時間信息。
-S, --sparse 對稀疏文件進行特殊處理以節省DST的空間。
-n, --dry-run現實哪些文件將被傳輸。
-w, --whole-file 拷貝文件,不進行增量檢測。
-x, --one-file-system 不要跨越文件系統邊界。
-B, --block-size=SIZE 檢驗算法使用的塊尺寸,默認是700字節。
-e, --rsh=command 指定使用rsh、ssh方式進行數據同步。
--rsync-path=PATH 指定遠程服務器上的rsync命令所在路徑信息。
-C, --cvs-exclude 使用和CVS一樣的方法自動忽略文件,用來排除那些不希望傳輸的文件。
--existing 僅僅更新那些已經存在于DST的文件,而不備份那些新創建的文件。
--delete 刪除那些DST中SRC沒有的文件。
--delete-excluded 同樣刪除接收端那些被該選項指定排除的文件。
--delete-after 傳輸結束以后再刪除。
--ignore-errors 及時出現IO錯誤也進行刪除。
--max-delete=NUM 最多刪除NUM個文件。
--partial 保留那些因故沒有完全傳輸的文件,以是加快隨后的再次傳輸。
--force 強制刪除目錄,即使不為空。
--numeric-ids 不將數字的用戶和組id匹配為用戶名和組名。
--timeout=time ip超時時間,單位為秒。
-I, --ignore-times 不跳過那些有同樣的時間和長度的文件。
--size-only 當決定是否要備份文件時,僅僅察看文件大小而不考慮文件時間。
--modify-window=NUM 決定文件是否時間相同時使用的時間戳窗口,默認為0。
-T --temp-dir=DIR 在DIR中創建臨時文件。
--compare-dest=DIR 同樣比較DIR中的文件來決定是否需要備份。
-P 等同于 --partial。
--progress 顯示備份過程。
-z, --compress 對備份的文件在傳輸時進行壓縮處理。
--exclude=PATTERN 指定排除不需要傳輸的文件模式。
--include=PATTERN 指定不排除而需要傳輸的文件模式。
--exclude-from=FILE 排除FILE中指定模式的文件。
--include-from=FILE 不排除FILE指定模式匹配的文件。
--version 打印版本信息。
--address 綁定到特定的地址。
--config=FILE 指定其他的配置文件,不使用默認的rsyncd.conf文件。
--port=PORT 指定其他的rsync服務端口。
--blocking-io 對遠程shell使用阻塞IO。
-stats 給出某些文件的傳輸狀態。
--progress 在傳輸時現實傳輸過程。
--log-format=formAT 指定日志文件格式。
--password-file=FILE 從FILE中得到密碼。
--bwlimit=KBPS 限制I/O帶寬,KBytes per second。
-h, --help 顯示幫助信息。
SSH方式
首先在服務端啟動ssh服務:
service sshd start
啟動 sshd: [確定]
使用rsync進行同步
接下來就可以在客戶端使用rsync命令來備份服務端上的數據了,SSH方式是通過系統用戶來進行備份的,如下:
rsync -vzrtopg --progress -e ssh --delete work@172.16.78.192:/www/* /databack/experiment/rsync
work@172.16.78.192's password:
receiving file list ...
5 files to consider
test/
a
0 100% 0.00kB/s 527:35:41 (1, 20.0% of 5)
b
67 100% 65.43kB/s 0:00:00 (2, 40.0% of 5)
c
0 100% 0.00kB/s 527:35:41 (3, 60.0% of 5)
dd
100663296 100% 42.22MB/s 0:00:02 (4, 80.0% of 5)
sent 96 bytes received 98190 bytes 11563.06 bytes/sec
total size is 100663363 speedup is 1024.19
上面的信息描述了整個的備份過程,以及總共備份數據的大小。
后臺服務方式
啟動rsync服務,編輯/etc/xinetd.d/rsync
文件,將其中的disable=yes
改為disable=no
,并重啟xinetd服務,如下:
vi /etc/xinetd.d/rsync
#default: off
# description: The rsync server is a good addition to an ftp server, as it \
# allows crc checksumming etc.
service rsync {
disable = no
socket_type = stream
wait = no
user = root
server = /usr/bin/rsync
server_args = --daemon
log_on_failure += USERID
}
/etc/init.d/xinetd restart
停止 xinetd: [確定]
啟動 xinetd: [確定]
創建配置文件,默認安裝好rsync程序后,并不會自動創建rsync的主配置文件,需要手工來創建,其主配置文件為“/etc/rsyncd.conf”,創建該文件并插入如下內容:
vi /etc/rsyncd.conf
uid=root
gid=root
max connections=4
log file=/var/log/rsyncd.log
pid file=/var/run/rsyncd.pid
lock file=/var/run/rsyncd.lock
secrets file=/etc/rsyncd.passwd
hosts deny=172.16.78.0/22
[www]
comment= backup web
path=/www
read only = no
exclude=test
auth users=work
創建密碼文件,采用這種方式不能使用系統用戶對客戶端進行認證,所以需要創建一個密碼文件,其格式為“username:password”,用戶名可以和密碼可以隨便定義,最好不要和系統帳戶一致,同時要把創建的密碼文件權限設置為600,這在前面的模塊參數做了詳細介紹。
echo "work:abc123" > /etc/rsyncd.passwd
chmod 600 /etc/rsyncd.passwd
備份,完成以上工作,現在就可以對數據進行備份了,如下:
rsync -avz --progress --delete work@172.16.78.192::www /databack/experiment/rsync
Password:
receiving file list ...
6 files to consider
./ files...
a
0 100% 0.00kB/s 528:20:41 (1, 50.0% of 6)
b
67 100% 65.43kB/s 0:00:00 (2, 66.7% of 6)
c
0 100% 0.00kB/s 528:20:41 (3, 83.3% of 6)
dd
100663296 100% 37.49MB/s 0:00:02 (4, 100.0% of 6)
sent 172 bytes received 98276 bytes 17899.64 bytes/sec
total size is 150995011 speedup is 1533.75
恢復,當服務器的數據出現問題時,那么這時就需要通過客戶端的數據對服務端進行恢復,但前提是服務端允許客戶端有寫入權限,否則也不能在客戶端直接對服務端進行恢復,使用rsync對數據進行恢復的方法如下:
rsync -avz --progress /databack/experiment/rsync/ work@172.16.78.192::www
Password:
building file list ...
6 files to consider
./
a
b
67 100% 0.00kB/s 0:00:00 (2, 66.7% of 6)
c
sent 258 bytes received 76 bytes 95.43 bytes/sec
total size is 150995011 speedup is 452080.87
將源目錄同步到目標目錄
$ rsync -r source destination
上面命令中,-r
表示遞歸,即包含子目錄。注意,-r
是必須的,否則 rsync
運行不會成功。source
目錄表示源目錄,destination
表示目標目錄。
多個文件或目錄同步
$ rsync -r source1 source2 destination
上面命令中,source1
、source2
都會被同步到 destination
目錄。
同步元信息
-a
參數可以替代 -r
,除了可以遞歸同步以外,還可以同步元信息(比如修改時間、權限等)。由于 rsync
默認使用文件大小和修改時間決定文件是否需要更新,所以 -a
比 -r
更有用。下面的用法才是常見的寫法。
$ rsync -a source destination
目標目錄 destination
如果不存在,rsync
會自動創建。執行上面的命令后,源目錄 source
被完整地復制到了目標目錄 destination
下面,即形成了 destination/source
的目錄結構。
如果只想同步源目錄 source
里面的內容到目標目錄 destination
,則需要在源目錄后面加上斜杠。
$ rsync -a source/ destination
上面命令執行后,source
目錄里面的內容,就都被復制到了 destination
目錄里面,并不會在 destination
下面創建一個 source
子目錄。
模擬執行的結果
如果不確定 rsync
執行后會產生什么結果,可以先用 -n
或 --dry-run
參數模擬執行的結果。
$ rsync -anv source/ destination
上面命令中,-n
參數模擬命令執行的結果,并不真的執行命令。-v
參數則是將結果輸出到終端,這樣就可以看到哪些內容會被同步。
目標目錄成為源目錄的鏡像副本
默認情況下,rsync
只確保源目錄的所有內容(明確排除的文件除外)都復制到目標目錄。它不會使兩個目錄保持相同,并且不會刪除文件。如果要使得目標目錄成為源目錄的鏡像副本,則必須使用 --delete
參數,這將刪除只存在于目標目錄、不存在于源目錄的文件。
$ rsync -av --delete source/ destination
上面命令中,--delete
參數會使得 destination
成為 source
的一個鏡像。
排除文件
有時,我們希望同步時排除某些文件或目錄,這時可以用--exclude參數指定排除模式。
$ rsync -av --exclude='*.txt' source/ destination
# 或者
$ rsync -av --exclude '*.txt' source/ destination
上面命令排除了所有 TXT
文件。
注意,rsync
會同步以"點"開頭的隱藏文件,如果要排除隱藏文件,可以這樣寫 --exclude=".*"
。
如果要排除某個目錄里面的所有文件,但不希望排除目錄本身,可以寫成下面這樣。
$ rsync -av --exclude 'dir1/*' source/ destination
多個排除模式,可以用多個 --exclude
參數。
$ rsync -av --exclude 'file1.txt' --exclude 'dir1/*' source/ destination
多個排除模式也可以利用 Bash 的大擴號的擴展功能,只用一個 --exclude
參數。
$ rsync -av --exclude={'file1.txt','dir1/*'} source/ destination
如果排除模式很多,可以將它們寫入一個文件,每個模式一行,然后用 --exclude-from
參數指定這個文件。
$ rsync -av --exclude-from='exclude-file.txt' source/ destination
指定必須同步的文件模式
--include
參數用來指定必須同步的文件模式,往往與 --exclude
結合使用。
$ rsync -av --include="*.txt" --exclude='*' source/ destination
上面命令指定同步時,排除所有文件,但是會包括 TXT
文件。