Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

Link zu der Vergleichsansicht

Nächste Überarbeitung
Vorherige Überarbeitung
Nächste ÜberarbeitungBeide Seiten, nächste Überarbeitung
server_und_serverdienste:linux_zfs [2017/04/01 02:38] – angelegt adminserver_und_serverdienste:linux_zfs [2019/07/20 13:38] – [Memorylimit setzen] boospy
Zeile 1: Zeile 1:
 {{datei:zfs-linux.png?nolink}} {{datei:zfs-linux.png?nolink}}
 +
 +====== Linux ZFS ======
 +
  
 ZFS (ursprünglich Zettabyte File System) wird oft als Dateisystem angesehen, was im Grunde genommen ein Missverständnis darstellt. ZFS kann ein Dateisystem sein, aber beherrscht auch noch einiges mehr. Es vereint die Funktionalität eines Logical Volume Managers und eines Software-RAID mit einem Copy-on-Write-Dateisystem (COW). Das heißt, dass es (aufgrund seiner Kenntnisse der Festplattenbelegung) effizienter als jedes Hardware-RAID arbeitet, Daten-Integrität per Transaktionen ähnlich wie bei relationalen Datenbanken sichert und im Falle von Daten-Redundanz (Mehrfachspeicherung) sogar selbständig Daten repariert. ZFS (ursprünglich Zettabyte File System) wird oft als Dateisystem angesehen, was im Grunde genommen ein Missverständnis darstellt. ZFS kann ein Dateisystem sein, aber beherrscht auch noch einiges mehr. Es vereint die Funktionalität eines Logical Volume Managers und eines Software-RAID mit einem Copy-on-Write-Dateisystem (COW). Das heißt, dass es (aufgrund seiner Kenntnisse der Festplattenbelegung) effizienter als jedes Hardware-RAID arbeitet, Daten-Integrität per Transaktionen ähnlich wie bei relationalen Datenbanken sichert und im Falle von Daten-Redundanz (Mehrfachspeicherung) sogar selbständig Daten repariert.
  
-  *  Systemgrundlage: Proxmox 3.4 / 4.X+  *  Systemgrundlage: Proxmox 3.4 / 4.X / 5.0
   *  ZFSutils: 0.6.4.3 /  0.6.5-pve6~jessie   *  ZFSutils: 0.6.4.3 /  0.6.5-pve6~jessie
-  *  Kernel: 3.10.0-10-pve / 4.2.3-2-pve+  *  Kernel: 3.10.0-10-pve / 4.2.3-2-pve / 4.10.17-4-pve
  
 Alles was unter diese Version liegt, ist entweder durch Bugs, oder fehlende Features wie z.B. das ZFS die Geräte per ID anspricht, nicht brauchbar. Alles was unter diese Version liegt, ist entweder durch Bugs, oder fehlende Features wie z.B. das ZFS die Geräte per ID anspricht, nicht brauchbar.
  
  
-====== Option Ashift ======+===== Option Ashift =====
  
  
Zeile 37: Zeile 40:
  
  
-====== Memorylimit setzen ======+===== Memorylimit setzen =====
  
 Wenn man möchte kann man ZFS ein Memorylimit setzten. Wenn man möchte kann man ZFS ein Memorylimit setzten.
Zeile 43: Zeile 46:
   nano  /etc/modprobe.d/zfs.conf   nano  /etc/modprobe.d/zfs.conf
   options zfs zfs_arc_max=10737418240   options zfs zfs_arc_max=10737418240
 +  
 +oder 8GB
 +  8589934592
  
 Danach noch die initram updaten und rebooten. Danach noch die initram updaten und rebooten.
Zeile 50: Zeile 56:
  
  
-====== Anlegen eines neuen Pools im Raid10 und hinzufügen zweier weiteren Festplatten ======+===== Anlegen eines neuen Pools im Raid10 und hinzufügen zweier weiteren Festplatten =====
  
  
Zeile 102: Zeile 108:
   errors: No known data errors   errors: No known data errors
  
-Die Daten werden bei einer Erweiterung nicht gesynct. Somit ist der Erweitungsprozess binnen Minuten abgeschlossen. Unabhängig von der Speichergröße. Daten werden erst dann auf die neuen Platten verteilt wenn diese das erste mal verwendet werden.+Die Daten werden bei einer Erweiterung nicht gesynct. Somit ist der Erweitungsprozess binnen Minuten abgeschlossen. Unabhängig von der Speichergröße. Daten werden erst dann auf die neuen Platten verteilt wenn diese das erste mal geschrieben werden. 
  
 +**Wichtig ist auch zu erwähnen das die neu hinzugefügten Platten zuerst bevorzugt auf den Füllstand der anderen Platten gebracht werden, erst dann werden wieder immer alle HDD's gleichzeitg verwendet.**
  
-====== Anlegen eines neuen Pools im RaidZ10 (entspricht Raid50) ======+ 
 +===== Anlegen eines neuen Pools im RaidZ10 (entspricht Raid50) =====
  
 Annahme ist hier ein Gerät mit 2 SDDs für das OS im Raid1 (läuft bereits). Nun bauen wir 10 Stück SATA Fesplatten mit einer Enterprise SSD für für Cache und Log dazu. Man das ganze nicht auf einmal erstellen, also zuerst die hälfte der Disks + Log und Cache, danach den Rest: Annahme ist hier ein Gerät mit 2 SDDs für das OS im Raid1 (läuft bereits). Nun bauen wir 10 Stück SATA Fesplatten mit einer Enterprise SSD für für Cache und Log dazu. Man das ganze nicht auf einmal erstellen, also zuerst die hälfte der Disks + Log und Cache, danach den Rest:
Zeile 155: Zeile 163:
   errors: No known data errors   errors: No known data errors
  
 +Nachdem dies ein Rpool ist, danach nicht vergessen Grub auf allen hinzugefügten Platten zu installieren. 
  
- +===== Korrupte Daten =====
-====== Korrupte Daten ======+
  
  
Zeile 175: Zeile 183:
  
  
-====== Festplatte ersetzen ======+===== Festplatte ersetzen =====
  
  
Zeile 185: Zeile 193:
  
  
-===== Festplatte im Rpool ersetzen =====+==== Festplatte im Rpool ersetzen ====
  
  
Zeile 257: Zeile 265:
  
  
-====== Die wichtigsten ZFS-Befehle auf einen Blick ======+===== Die wichtigsten ZFS-Befehle auf einen Blick =====
  
  
Zeile 277: Zeile 285:
 | mount /dev/zvol/v-machines/home/vm-<Nummer>-disk-<Nummer> /<mountpoint>| Hängt eine VMdisk vom Zpool "v-machines" am gewünschten Mountpoint ein. | | mount /dev/zvol/v-machines/home/vm-<Nummer>-disk-<Nummer> /<mountpoint>| Hängt eine VMdisk vom Zpool "v-machines" am gewünschten Mountpoint ein. |
 | zpool import -d /dev/disk/by-id/ -a| ersetzt SDX durch die ID der Festplatte | | zpool import -d /dev/disk/by-id/ -a| ersetzt SDX durch die ID der Festplatte |
 +| zpool import v-machines neuepoolname| importiert einen bestehenden Pool mit einem anderen Namen |
 | zfs list -t snapshot| zeigt alle Snapshots an | | zfs list -t snapshot| zeigt alle Snapshots an |
 | zpool set listsnapshots=on rpool| zeigt bei "zfs list" auch snapshots an | | zpool set listsnapshots=on rpool| zeigt bei "zfs list" auch snapshots an |
 | zfs list -r -t snapshot -o name,creation rpool| Snapshots mit Datum anzeigen | | zfs list -r -t snapshot -o name,creation rpool| Snapshots mit Datum anzeigen |
 | zfs get volsize v-machines/HDD-vmdata-KVM/vm-113-disk-1  NAME                                     PROPERTY  VALUE    SOURCE  v-machines/HDD-vmdata-KVM/vm-113-disk-1  volsize   36G      local| zeigt den maximal möglichen Speicher eines Volumes an | | zfs get volsize v-machines/HDD-vmdata-KVM/vm-113-disk-1  NAME                                     PROPERTY  VALUE    SOURCE  v-machines/HDD-vmdata-KVM/vm-113-disk-1  volsize   36G      local| zeigt den maximal möglichen Speicher eines Volumes an |
-| zfs set volsize=32g v-machines/HDD-vmdata-KVM/vm-113-disk-1| Verkleinert das Dataset auf 32GB | +| zfs set volsize=32g v-machines/HDD-vmdata-KVM/vm-113-disk-1| Verkleinert/Vergrößert das zvol auf 32GB \\ (Blockdevice)
-| zfs create -V 5gb tank/vol| legt ein neues Dataset mit einer maximalen Größe von 5G an |+| zfs create -V 5gb tank/vol| legt ein neues zvol mit einer maximalen Größe von 5G an \\ (Blockdevice) | 
 +| zfs set quota=50g tank/backupfolder | setzt die Quota eines normalen Datesets auf 50g | 
 +| zfs rename -p rpool/test rpool/server123 | Verschiebt eine Dataset | 
 +| zfs list -o space | Speicherauslastung inkl. wie viel für Snapshots verbraucht wird | 
 +| mount -t zfs -o ro v-machines/home@rep_home_2017-07-05_00:36:48 /mnt/zfsmountsnap | Snapshot mounten | 
 +| zfs set primarycache=metadata pool/dataset | Optimal für Backups, hier wird der Ramverbrauch erheblich reduziert | 
 +|apt install zfs-auto-snapshot | [[https://forum.proxmox.com/threads/zfs-automatic-snapshot-including-ram.43057/#post-207054|Infolink]] |
  
  
  
-====== ZFS Snapshots und deren Verwaltung ======+===== ZFS Snapshots und deren Verwaltung =====
  
 Snapshots eigenes sich hervorragend für die Datensicherung oder auch wenn man was testet oder auch nur Updates fährt. Man kann sofort wieder zurück. Um nun ein Snapshot von unserem Rootfilesystem zu erstellen geht von wie folgt vor: Snapshots eigenes sich hervorragend für die Datensicherung oder auch wenn man was testet oder auch nur Updates fährt. Man kann sofort wieder zurück. Um nun ein Snapshot von unserem Rootfilesystem zu erstellen geht von wie folgt vor:
Zeile 324: Zeile 339:
  
  
-===== Snapshots Remote abspeichern =====+==== Snapshots Remote abspeichern ====
  
 Um nun auch wirkliche Backups zu generieren muss man die Snapshots natürlich außerhalb des Servers ablegen. In unserem ersten Beispiel senden wir einen Snapshot auf eine Backupfestplatte in unserem Server.  Um nun auch wirkliche Backups zu generieren muss man die Snapshots natürlich außerhalb des Servers ablegen. In unserem ersten Beispiel senden wir einen Snapshot auf eine Backupfestplatte in unserem Server. 
Zeile 358: Zeile 373:
  
  
-===== Snapshots inkrementell abspeichern =====+==== Snapshots inkrementell abspeichern ====
  
 Die beste Methode für Backups ist wohl diese. Es werden hier immer nur die Änderungen gespeichert und man kann auch auf jede einzelne Datei zugreifen. In diesem Fall möchten wir wieder unser home-Dataset auf einer anderen Festplatte abspeichern. Zuerst müssen wir das Dataset auf der Zielfestplatte erstellen. Danach machen wir unser erstes Snapshot und überspielen das auf diese Platte. ACHTUNG: Feature wie Posixacls werden nicht mit aktiviert. Diese mit "zfs set ..." einfach vorher oder nachher nach Wunsch aktivieren.  Die beste Methode für Backups ist wohl diese. Es werden hier immer nur die Änderungen gespeichert und man kann auch auf jede einzelne Datei zugreifen. In diesem Fall möchten wir wieder unser home-Dataset auf einer anderen Festplatte abspeichern. Zuerst müssen wir das Dataset auf der Zielfestplatte erstellen. Danach machen wir unser erstes Snapshot und überspielen das auf diese Platte. ACHTUNG: Feature wie Posixacls werden nicht mit aktiviert. Diese mit "zfs set ..." einfach vorher oder nachher nach Wunsch aktivieren. 
Zeile 389: Zeile 404:
  
  
-==== Snapshot kann nicht gesendet werden ====+=== Snapshot kann nicht gesendet werden ===
  
 Sollte das Snapshot nicht gesendet werden können z.b. hier ein riesiges Homedataset: Sollte das Snapshot nicht gesendet werden können z.b. hier ein riesiges Homedataset:
Zeile 412: Zeile 427:
  
  
-===== Snapshot von einem anderen Ort zurückspielen =====+==== Snapshot von einem anderen Ort zurückspielen ====
  
 Um ein Snapshot zurückspielen zu können muss man zuerst vorhandene lokale Snapshots löschen: Um ein Snapshot zurückspielen zu können muss man zuerst vorhandene lokale Snapshots löschen:
Zeile 423: Zeile 438:
   pigz -d -c /backup/home@bla1.gz | zfs receive -F rpool/home   pigz -d -c /backup/home@bla1.gz | zfs receive -F rpool/home
  
 +==== Snapshot mounten und Daten rausholen ====
 +Sehr praktisch. Um ein Snapshot zu mounten kann den normalen Mountbefehl benutzen. Z.B. 
 +<code>
 +mount -t zfs v-machines/home@rep_home_2017-07-05_00:36:48 /mnt/zfsmountsnap
 +</code>
 +Um das ganze automatisch und elegant mit ZFS zu gestalten machten den Ordner ''.zfs'' in Datasets sichtbar. Z.B.
 +<code>
 +zfs set snapdir=visible  v-machines/home
 +</code>
 +Danach wird das gewünschte Snapshot automatisch beim Zugriff auf ''.zfs/snapshot/rep_home_2017-07-16_00:01:25'' gemountet. 
  
  
-===== Snapshot klonen =====+==== Snapshot klonen ====
  
 Es ist oft sehr praktisch ein Filesystem zu klonen um Dinge auszutesten. Es ist oft sehr praktisch ein Filesystem zu klonen um Dinge auszutesten.
Zeile 449: Zeile 474:
 </code> </code>
  
 +===== Mit komplettem ZFSpool umziehen =====
 +Mit einem kompletten Pool um zu ziehen ist super einfach, in Gegesatz zu nem Rsync oder ähnlichem. Zuerst macht man rekursiv ein Snapshot, danach kopiert man dem Pool auf die neuen/anderen Platten.
 +<code>
 +zfs snapshot -r oldpool@migration
 +zfs send -v -R -p oldpool@migration  | zfs receive -F myfreshpool
 +</code>
  
-====== Autoexpand ======+===== Autoexpand =====
  
 Ist "autoexpand" aktiviert vergrößert sich der Festplattenspeicher beim Tausch einer kleineren durch eine größere Platte automatisch. Beispiel: Man hat ein Raid1 mit 2x500GB Festplatten. Man tauscht die platten nacheinander aus (replace/resilvern). Ist die zweite Platte getauscht ist der Mehrspeicher sofort verfügbar.  Ist "autoexpand" aktiviert vergrößert sich der Festplattenspeicher beim Tausch einer kleineren durch eine größere Platte automatisch. Beispiel: Man hat ein Raid1 mit 2x500GB Festplatten. Man tauscht die platten nacheinander aus (replace/resilvern). Ist die zweite Platte getauscht ist der Mehrspeicher sofort verfügbar. 
Zeile 468: Zeile 499:
  
  
-===== Autoexpand auf einem Rootpool =====+==== Autoexpand auf einem Rootpool ====
  
 Das ganze ist ein wenig komplizierter da man die GPT Bootpartion beachten muss. Zuerst erstellt auf der neuen getauschten Disk eine GPT Partition: Das ganze ist ein wenig komplizierter da man die GPT Bootpartion beachten muss. Zuerst erstellt auf der neuen getauschten Disk eine GPT Partition:
      
-  sgdisk -Z /dev/sdf+  sgdisk -Z /dev/sdf # löscht nur gpt und mbr struktur 
 +  sgdisk -Z -o /dev/sdf # löscht auch Partitionen
   sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdf   sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdf
   zpool replace rpool 10714300945297318711 sdf2   zpool replace rpool 10714300945297318711 sdf2
-  grub-intall /dev/sdf+  grub-install /dev/sdf
  
 Das natürlich mit jeder Platte wiederholen. Das natürlich mit jeder Platte wiederholen.
Zeile 486: Zeile 518:
  
 9: reserved space (8MB) 9: reserved space (8MB)
 +
 +==== Umwandeln eines Rpool Singledisk in einen Mirror inkl. Autoexpand ====
 +Annahme ist hier ein Rpool mit einer Samsung EVO750. Da die Disk nicht Enterprise ist und das Wearoutlevel schon bei 90% ist, fügen wir eine Samsung SM863a als Mirror hinzu. Dann können wir beim Ausfall der EVO bequem eine weitere SM863a hinzufügen. Der zeitiger Status ist:
 +<code>
 +zpool status 
 +  pool: rpool
 + state: ONLINE
 +  scan: scrub repaired 0B in 0h3m with 0 errors on Sun Oct 14 00:27:05 2018
 +config:
 +
 +        NAME        STATE     READ WRITE CKSUM
 +        rpool       ONLINE               0
 +          sda2      ONLINE               0
 +</code>
 +Rpool's könne hier nur mit den Alias "SDX" umgehen. Alle anderen "nicht Rootpools" mit ''/dev/disk/by-id'' 
 +Wir haben nun unsere neue SSD in's laufende System gehängt. Diese scheint mit ''sdb'' auf. Wir konfigurieren diese DISK mit GPT schauen das wie oben beschrieben auch Autoexpand am Pool aktiviert ist und partitionieren diese richtig:
 +<code>
 +sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdb
 +Setting name!
 +partNum is 1
 +REALLY setting name!
 +The operation has completed successfully.
 +</code>
 +Mit ''partx -s /dev/sdb'' sehen wir das die Disk nun richtig konfiguriert wurde:
 +<code>
 +partx -s /dev/sdb
 +NR     START       END   SECTORS   SIZE NAME UUID
 +        34      2047      2014  1007K      abdb3664-8f24-4f9c-b69f-48041a12dd2a
 +      2048 468845709 468843662 223,6G zfs  54a8aa0b-3e13-4e05-b8f6-3bcc1a5452d5
 + 9 468845710 468862094     16385     8M      8dfaf865-cv4f-4931-86ba-9a9a274d3ead
 +</code>
 +Nun können wir die neue Disk zu unserer alten dazu hängen:
 +<code>
 +zpool attach  -o ashift=12 -f  rpool  /dev/sda2 /dev/sdb2
 +Make sure to wait until resilver is done before rebooting.
 +</code>
 +Nach erfolgreichen resilvern, sieht unser Pool nun so aus:
 +<code>
 +zpool status         
 +  pool: rpool
 + state: ONLINE
 +  scan: resilvered 31,9G in 0h2m with 0 errors on Mon Nov  5 17:02:53 2018
 +config:
 +
 +        NAME        STATE     READ WRITE CKSUM
 +        rpool       ONLINE               0
 +          mirror-0  ONLINE               0
 +            sda2    ONLINE               0
 +            sdb2    ONLINE               0
 +
 +errors: No known data errors
 +</code>
 +Danach noch Grub installieren und fertig. 
 +<code>
 +grub-install /dev/sdb
 +</code>
 +Nachdem wir dann später mal die EVO getauscht haben, wird der Pool automatisch auf die 240GB vergrößert. 
 +
 +
 +===== Autoreplace =====
 +Autoreplace ersetzt automatische eine defekte Platte aus einem Zpool. Hierfür ist aber ein eingener [[http://www.informit.com/articles/article.aspx?p=1433052&seqNum=7|Hotsparepool]] erforderlich. 
  
  
-====== Proxmox spezifisches ======+===== Proxmox spezifisches =====
  
 Unter Proxmox wird LVM defaultmäßing mitinstalliert, man im Installer wählen kann ob man ZFS oder EXT4 mit LVM haben möchte. Unter ZFS kann LVM einen Filter erstellen damit der HOST die LVMs von den Gästen nicht sieht. Ist sauberer. Unter Proxmox wird LVM defaultmäßing mitinstalliert, man im Installer wählen kann ob man ZFS oder EXT4 mit LVM haben möchte. Unter ZFS kann LVM einen Filter erstellen damit der HOST die LVMs von den Gästen nicht sieht. Ist sauberer.
Zeile 499: Zeile 592:
  
  
-===== Proxmox Rescue ZFS =====+==== Proxmox Rescue ZFS ====
  
  
Zeile 516: Zeile 609:
 Natürlich bevor wir das alles erledigen möge man sich vorher erkundigen ob noch etwaige Zusatzdatasets auf Root zeigen. Diese müssen vorher ausgehängt werden. Natürlich bevor wir das alles erledigen möge man sich vorher erkundigen ob noch etwaige Zusatzdatasets auf Root zeigen. Diese müssen vorher ausgehängt werden.
  
 +===== Kompletten RPOOL mit Proxmox recovern =====
 +https://darkdevil.osit.cc/index.php/s/rWkEAEytAsmLc1r
 +
 +FIXME
 +
 +===== sharenfs =====
 +Nutzt man ZFS als Dateisystem ist es klug die "sharenfs" Funktion von ZFS direkt statt dem System Export zu verwenden. Da hier die zeitliche Abfolge beim Systemstart immer optimal ist. Um eine Freigabe zu erstellen inkl. eines Datasets zu erstellen bedient man sich folgendem Befehl:
 +<code>
 +zfs create testpool/testnfs -o sharenfs="rw=@hostname1.local,rw=@192.168.1.3,no_root_squash,no_subtree_check,async"
 +</code>
 +Für IPV6 können als Source nur mehr FQDN verwendet werden.
 +
 +Bei einem bestehenden Dataset:
 +<code>
 +zfs set sharenfs="rw=@hostname1.local,rw=@192.168.1.3,no_root_squash,no_subtree_check,async" testpool/testnfs
 +</code>
 +Für eine einfache Freigabe:
 +<code>
 +zfs set sharenfs=on testpool/testnfs
 +</code>
 +Um eine Freigabe zu beenden:
 +<code>
 +zfs set sharenfs=off testpool/testnfs
 +</code>
 +Das Dataset löschen, löscht natürlich auch die Freigabe.
 +Um zu sehen welche Freigaben nun aktiv sind gibt es mehrere Möglichkeiten. Am Host selbst:
 +<code>
 +cat /etc/dfs/sharetab
 +</code>
 +<code>
 +zfs get sharenfs # kann auch mit weiteren Optionen kombiniert werden
 +</code>
 +Von einem anderen Host:
 +<code>
 +showmount  -e hostname.local
 +</code>
 +
 +===== Swap =====
 +Swap direkt auf ZFS erstellen. Empfohlen, genug RAM, oder Swap auf einem nicht ZFS-Filesystem. 
 +<code>
 +zfs create -V 8G -b $(getconf PAGESIZE) -o compression=zle -o logbias=throughput -o sync=always -o primarycache=metadata -o secondarycache=none -o com.sun:auto-snapshot=false v-machines/swap
 +</code>
  
-====== Links ======+===== Links =====
  
   *  [[https://pve.proxmox.com/wiki/Storage:_ZFS|ProxmoxWIKI ZFS]]   *  [[https://pve.proxmox.com/wiki/Storage:_ZFS|ProxmoxWIKI ZFS]]
Zeile 524: Zeile 659:
   *  [[https://wiki.archlinux.org/index.php/Experimenting_with_ZFS|Archlinux mit ZFS]]   *  [[https://wiki.archlinux.org/index.php/Experimenting_with_ZFS|Archlinux mit ZFS]]
   *  [[http://docs.oracle.com/cd/E24841_01/html/820-2313/gbbvf.html#gbcus|Oracle Reslivering]]   *  [[http://docs.oracle.com/cd/E24841_01/html/820-2313/gbbvf.html#gbcus|Oracle Reslivering]]
 +  * [[http://open-zfs.org/wiki/Performance_tuning|ZFS Tuning]]
  
  
-====== Notiz ======+===== Notiz =====
  
      
   zpool replace  -o ashift=9 zfs_raid <virtual device> /dev/sdd1   zpool replace  -o ashift=9 zfs_raid <virtual device> /dev/sdd1
 +  zdb --help