Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

--- server_und_serverdienste:linux_zfs [2017/04/01 02:38] – angelegt admin
+++ server_und_serverdienste:linux_zfs [2022/03/21 09:46] – [Autoexpand auf einem Rootpool] loma
@@ Zeile 1: / Zeile 1: @@
 {{datei:zfs-linux.png?nolink}}
+====== Linux ZFS ======
+Du möchtest dich gerne für unsere Hilfe erkenntlich zeigen 8-o. Gerne. Wir bedanken uns bei dir für deine Spende! LOL \\
+[[https://www.paypal.com/cgi-bin/webscr?cmd=_s-xclick&hosted_button_id=KE592Y5993ZKW|{{:wiki:btn_donatecc_lg.gif|}}]] \\
+\\
+Hauseigenes Apt-Repo: [[https://apt.iteas.at]]
+\\
+GITLAB Enterprise: [[https://git.osit.cc|{{:gitlab_logo.png?nolink&60|}}]]
+\\
+\\
 ZFS (ursprünglich Zettabyte File System) wird oft als Dateisystem angesehen, was im Grunde genommen ein Missverständnis darstellt. ZFS kann ein Dateisystem sein, aber beherrscht auch noch einiges mehr. Es vereint die Funktionalität eines Logical Volume Managers und eines Software-RAID mit einem Copy-on-Write-Dateisystem (COW). Das heißt, dass es (aufgrund seiner Kenntnisse der Festplattenbelegung) effizienter als jedes Hardware-RAID arbeitet, Daten-Integrität per Transaktionen ähnlich wie bei relationalen Datenbanken sichert und im Falle von Daten-Redundanz (Mehrfachspeicherung) sogar selbständig Daten repariert.
-  *  Systemgrundlage: Proxmox 3.4 / 4.X
+  *  Systemgrundlage: Proxmox 3.4 / 4.X / 5.0
   *  ZFSutils: 0.6.4.3 /  0.6.5-pve6~jessie
-  *  Kernel: 3.10.0-10-pve / 4.2.3-2-pve
+  *  Kernel: 3.10.0-10-pve / 4.2.3-2-pve / 4.10.17-4-pve
 Alles was unter diese Version liegt, ist entweder durch Bugs, oder fehlende Features wie z.B. das ZFS die Geräte per ID anspricht, nicht brauchbar.
-====== Option Ashift ======
+===== Option Ashift =====
@@ Zeile 37: / Zeile 47: @@
-====== Memorylimit setzen ======
+===== Memorylimit setzen =====
+Genaue Info zu den aktuellen Werten bekommt man mit:
+  arcstat
+oder
+  arc_summary
 Wenn man möchte kann man ZFS ein Memorylimit setzten.
@@ Zeile 43: / Zeile 57: @@
   nano  /etc/modprobe.d/zfs.conf
   options zfs zfs_arc_max=10737418240
+oder 8GB
+  8589934592
 Danach noch die initram updaten und rebooten.
@@ Zeile 50: / Zeile 67: @@
-====== Anlegen eines neuen Pools im Raid10 und hinzufügen zweier weiteren Festplatten ======
+===== Anlegen eines neuen Pools im Raid10 und hinzufügen zweier weiteren Festplatten =====
@@ Zeile 102: / Zeile 119: @@
   errors: No known data errors
-Die Daten werden bei einer Erweiterung nicht gesynct. Somit ist der Erweitungsprozess binnen Minuten abgeschlossen. Unabhängig von der Speichergröße. Daten werden erst dann auf die neuen Platten verteilt wenn diese das erste mal verwendet werden.
+Die Daten werden bei einer Erweiterung nicht gesynct. Somit ist der Erweitungsprozess binnen Minuten abgeschlossen. Unabhängig von der Speichergröße. Daten werden erst dann auf die neuen Platten verteilt wenn diese das erste mal geschrieben werden.
+**Wichtig ist auch zu erwähnen das die neu hinzugefügten Platten zuerst bevorzugt auf den Füllstand der anderen Platten gebracht werden, erst dann werden wieder immer alle HDD's gleichzeitg verwendet.**
-====== Anlegen eines neuen Pools im RaidZ10 (entspricht Raid50) ======
+===== Anlegen eines neuen Pools im RaidZ10 (entspricht Raid50) =====
 Annahme ist hier ein Gerät mit 2 SDDs für das OS im Raid1 (läuft bereits). Nun bauen wir 10 Stück SATA Fesplatten mit einer Enterprise SSD für für Cache und Log dazu. Man das ganze nicht auf einmal erstellen, also zuerst die hälfte der Disks + Log und Cache, danach den Rest:
@@ Zeile 155: / Zeile 174: @@
   errors: No known data errors
+Nachdem dies ein Rpool ist, danach nicht vergessen Grub auf allen hinzugefügten Platten zu installieren.
+===== Korrupte Daten =====
-====== Korrupte Daten ======
@@ Zeile 175: / Zeile 194: @@
-====== Festplatte ersetzen ======
+===== Festplatte ersetzen =====
@@ Zeile 185: / Zeile 204: @@
-===== Festplatte im Rpool ersetzen =====
+==== Festplatte im Rpool ersetzen ====
@@ Zeile 198: / Zeile 217: @@
   sgdisk -G /dev/sdb
-Nun den Resilverprozess anstoßen.
+Nun den Resilverprozess der Partition anstoßen.
   zpool replace -f rpool sdb2 sdb2
@@ Zeile 255: / Zeile 274: @@
   Write failed: Broken pipe
+Neuere Proxmoxsysteme haben ZFS immer beides. Grub und EFI. Verwendet man zum Booten Grub, verwendet man den ''grub-install''. Verwendet man EFI, bedient man sich systemd-boot:
+<code>
+pve-efiboot-tool format <new disk's ESP>
+pve-efiboot-tool init <new disk's ESP>
+</code>
+===== Die wichtigsten ZFS-Befehle auf einen Blick =====
-====== Die wichtigsten ZFS-Befehle auf einen Blick ======
@@ Zeile 277: / Zeile 300: @@
 | mount /dev/zvol/v-machines/home/vm-<Nummer>-disk-<Nummer> /<mountpoint>| Hängt eine VMdisk vom Zpool "v-machines" am gewünschten Mountpoint ein. |
 | zpool import -d /dev/disk/by-id/ -a| ersetzt SDX durch die ID der Festplatte |
+| zpool import v-machines neuepoolname| importiert einen bestehenden Pool mit einem anderen Namen |
+| zpool import -f -R /mnt rpool| importiert einen Rootpool auf einen anderen Mountpoint |
 | zfs list -t snapshot| zeigt alle Snapshots an |
 | zpool set listsnapshots=on rpool| zeigt bei "zfs list" auch snapshots an |
 | zfs list -r -t snapshot -o name,creation rpool| Snapshots mit Datum anzeigen |
 | zfs get volsize v-machines/HDD-vmdata-KVM/vm-113-disk-1  NAME                                     PROPERTY  VALUE    SOURCE  v-machines/HDD-vmdata-KVM/vm-113-disk-1  volsize   36G      local| zeigt den maximal möglichen Speicher eines Volumes an |
-| zfs set volsize=32g v-machines/HDD-vmdata-KVM/vm-113-disk-1| Verkleinert das Dataset auf 32GB |
+| zfs set volsize=32g v-machines/HDD-vmdata-KVM/vm-113-disk-1| Verkleinert/Vergrößert das zvol auf 32GB \\ (Blockdevice)|
-| zfs create -V 5gb tank/vol| legt ein neues Dataset mit einer maximalen Größe von 5G an |
+| zfs create -V 5gb tank/vol| legt ein neues zvol mit einer maximalen Größe von 5G an \\ (Blockdevice) |
+| zfs set quota=50g tank/backupfolder | setzt die Quota eines normalen Datesets auf 50g |
+| zfs rename -p rpool/test rpool/server123 | Verschiebt eine Dataset |
+| zfs list -o space | Speicherauslastung inkl. wie viel für Snapshots verbraucht wird |
+| mount -t zfs -o ro v-machines/home@rep_home_2017-07-05_00:36:48 /mnt/zfsmountsnap | Snapshot mounten |
+| zfs set primarycache=metadata pool/dataset | Optimal für Backups, hier wird der Ramverbrauch erheblich reduziert |
+|apt install zfs-auto-snapshot | [[https://forum.proxmox.com/threads/zfs-automatic-snapshot-including-ram.43057/#post-207054|Infolink]] |
-====== ZFS Snapshots und deren Verwaltung ======
+===== ZFS Snapshots und deren Verwaltung =====
 Snapshots eigenes sich hervorragend für die Datensicherung oder auch wenn man was testet oder auch nur Updates fährt. Man kann sofort wieder zurück. Um nun ein Snapshot von unserem Rootfilesystem zu erstellen geht von wie folgt vor:
@@ Zeile 324: / Zeile 355: @@
-===== Snapshots Remote abspeichern =====
+==== Snapshots Remote abspeichern ====
 Um nun auch wirkliche Backups zu generieren muss man die Snapshots natürlich außerhalb des Servers ablegen. In unserem ersten Beispiel senden wir einen Snapshot auf eine Backupfestplatte in unserem Server.
@@ Zeile 358: / Zeile 389: @@
-===== Snapshots inkrementell abspeichern =====
+==== Snapshots inkrementell abspeichern ====
 Die beste Methode für Backups ist wohl diese. Es werden hier immer nur die Änderungen gespeichert und man kann auch auf jede einzelne Datei zugreifen. In diesem Fall möchten wir wieder unser home-Dataset auf einer anderen Festplatte abspeichern. Zuerst müssen wir das Dataset auf der Zielfestplatte erstellen. Danach machen wir unser erstes Snapshot und überspielen das auf diese Platte. ACHTUNG: Feature wie Posixacls werden nicht mit aktiviert. Diese mit "zfs set ..." einfach vorher oder nachher nach Wunsch aktivieren.
@@ Zeile 389: / Zeile 420: @@
-==== Snapshot kann nicht gesendet werden ====
+=== Snapshot kann nicht gesendet werden ===
 Sollte das Snapshot nicht gesendet werden können z.b. hier ein riesiges Homedataset:
@@ Zeile 412: / Zeile 443: @@
-===== Snapshot von einem anderen Ort zurückspielen =====
+==== Snapshot von einem anderen Ort zurückspielen ====
 Um ein Snapshot zurückspielen zu können muss man zuerst vorhandene lokale Snapshots löschen:
@@ Zeile 423: / Zeile 454: @@
   pigz -d -c /backup/home@bla1.gz | zfs receive -F rpool/home
+==== Snapshot mounten und Daten rausholen ====
+Sehr praktisch. Um ein Snapshot zu mounten kann den normalen Mountbefehl benutzen. Z.B.
+<code>
+mount -t zfs v-machines/home@rep_home_2017-07-05_00:36:48 /mnt/zfsmountsnap
+</code>
+Um das ganze automatisch und elegant mit ZFS zu gestalten machten den Ordner ''.zfs'' in Datasets sichtbar. Z.B.
+<code>
+zfs set snapdir=visible  v-machines/home
+</code>
+Danach wird das gewünschte Snapshot automatisch beim Zugriff auf ''.zfs/snapshot/rep_home_2017-07-16_00:01:25'' gemountet.
-===== Snapshot klonen =====
+==== Snapshot klonen ====
 Es ist oft sehr praktisch ein Filesystem zu klonen um Dinge auszutesten.
@@ Zeile 449: / Zeile 490: @@
 </code>
+===== Mit komplettem ZFSpool umziehen =====
+Mit einem kompletten Pool um zu ziehen ist super einfach, in Gegesatz zu nem Rsync oder ähnlichem. Zuerst macht man rekursiv ein Snapshot, danach kopiert man dem Pool auf die neuen/anderen Platten.
+<code>
+zfs snapshot -r oldpool@migration
+zfs send -v -R -p oldpool@migration  | zfs receive -F myfreshpool
+</code>
-====== Autoexpand ======
+===== Autoexpand =====
 Ist "autoexpand" aktiviert vergrößert sich der Festplattenspeicher beim Tausch einer kleineren durch eine größere Platte automatisch. Beispiel: Man hat ein Raid1 mit 2x500GB Festplatten. Man tauscht die platten nacheinander aus (replace/resilvern). Ist die zweite Platte getauscht ist der Mehrspeicher sofort verfügbar.
@@ Zeile 468: / Zeile 515: @@
-===== Autoexpand auf einem Rootpool =====
+==== Autoexpand auf einem Rootpool ====
 Das ganze ist ein wenig komplizierter da man die GPT Bootpartion beachten muss. Zuerst erstellt auf der neuen getauschten Disk eine GPT Partition:
-  sgdisk -Z /dev/sdf
+<code>
-  sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdf
+sgdisk -Z /dev/sdf # löscht nur gpt und mbr struktur
-  zpool replace rpool 10714300945297318711 sdf2
+sgdisk -Z -o /dev/sdf # löscht auch Partitionen
-  grub-intall /dev/sdf
+sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdf
+partx -s /dev/sdf (hier sieht man die Partionierung)
+zpool replace rpool 10714300945297318711 sdf2
+grub-install /dev/sdf
+</code>
 Das natürlich mit jeder Platte wiederholen.
@@ Zeile 486: / Zeile 537: @@
 : reserved space (8MB)
+=== Partitionieren ab Proxmox-Boot-Tool ===
+Bei neuen Systemen wird nicht mehr Grub sondern Proxmox Boottool verwendet. Dabei wird für EFI eine extra 512MB Partition benötigt. Der Befehl dazu sieht dann so aus: Die erste zwei Befehle können auch über die Webgui durch einen Mausklick ausgeführt werden (Initialisiere Disk mit GPT)
+<code>
+sgdisk -Z /dev/disk/by-id/ata-ST8000VN004-3CP101_XXXXXX # löscht nur gpt und mbr struktur
+sgdisk -Z -o /dev/disk/by-id/ata-ST8000VN004-3CP101_XXXXXX # löscht auch Partitionen
+sgdisk -a1 -n1:34:2047 -t1:EF02 -n2:2048:+512M -t2:EF00 -n3:0:0 -t3:BF01 -c 3:zfs /dev/sdX
+partx -s /dev/disk/by-id/ata-ST8000VN004-3CP101_XXXXXX (hier sieht man die Partionierung)
+zpool replace rpool 10714300945297318711 ata-ST8000VN004-3CP101_XXXXXX-part3
+proxmox-boot-tool format /dev/disk/by-id/ata-ST8000VN004-3CP101_XXXXXX-part2
+proxmox-boot-tool init /dev/disk/by-id/ata-ST8000VN004-3CP101_XXXXXX-part2
+</code>
+==== Umwandeln eines Rpool Singledisk in einen Mirror inkl. Autoexpand ====
+Annahme ist hier ein Rpool mit einer Samsung EVO750. Da die Disk nicht Enterprise ist und das Wearoutlevel schon bei 90% ist, fügen wir eine Samsung SM863a als Mirror hinzu. Dann können wir beim Ausfall der EVO bequem eine weitere SM863a hinzufügen. Der zeitiger Status ist:
+<code>
+zpool status
+  pool: rpool
+ state: ONLINE
+  scan: scrub repaired 0B in 0h3m with 0 errors on Sun Oct 14 00:27:05 2018
+config:
+        NAME        STATE     READ WRITE CKSUM
+        rpool       ONLINE       0     0     0
+          sda2      ONLINE       0     0     0
+</code>
+Rpool's könne hier nur mit den Alias "SDX" umgehen. Alle anderen "nicht Rootpools" mit ''/dev/disk/by-id''
+Wir haben nun unsere neue SSD in's laufende System gehängt. Diese scheint mit ''sdb'' auf. Wir konfigurieren diese DISK mit GPT schauen das wie oben beschrieben auch Autoexpand am Pool aktiviert ist und partitionieren diese richtig:
+<code>
+sgdisk -a1 -n1:34:2047 -t1:EF02 -n9:-8M:0 -t9:BF07 -n2:2048:0 -t2:BF01 -c 2:zfs /dev/sdb
+Setting name!
+partNum is 1
+REALLY setting name!
+The operation has completed successfully.
+</code>
+Mit ''partx -s /dev/sdb'' sehen wir das die Disk nun richtig konfiguriert wurde:
+<code>
+partx -s /dev/sdb
+NR     START       END   SECTORS   SIZE NAME UUID
+        34      2047      2014  1007K      abdb3664-8f24-4f9c-b69f-48041a12dd2a
+      2048 468845709 468843662 223,6G zfs  54a8aa0b-3e13-4e05-b8f6-3bcc1a5452d5
+468845710 468862094     16385     8M      8dfaf865-cv4f-4931-86ba-9a9a274d3ead
+</code>
+Nun können wir die neue Disk zu unserer alten dazu hängen:
+<code>
+zpool attach  -o ashift=12 -f  rpool  /dev/sda2 /dev/sdb2
+Make sure to wait until resilver is done before rebooting.
+</code>
+Nach erfolgreichen resilvern, sieht unser Pool nun so aus:
+<code>
+zpool status
+  pool: rpool
+ state: ONLINE
+  scan: resilvered 31,9G in 0h2m with 0 errors on Mon Nov  5 17:02:53 2018
+config:
+        NAME        STATE     READ WRITE CKSUM
+        rpool       ONLINE       0     0     0
+          mirror-0  ONLINE       0     0     0
+            sda2    ONLINE       0     0     0
+            sdb2    ONLINE       0     0     0
+errors: No known data errors
+</code>
+Danach noch Grub installieren und fertig.
+<code>
+grub-install /dev/sdb
+</code>
+Nachdem wir dann später mal die EVO getauscht haben, wird der Pool automatisch auf die 240GB vergrößert.
+===== Autoreplace =====
+Autoreplace ersetzt automatische eine defekte Platte aus einem Zpool. Hierfür ist aber ein eingener [[http://www.informit.com/articles/article.aspx?p=1433052&seqNum=7|Hotsparepool]] erforderlich.
-====== Proxmox spezifisches ======
+===== Proxmox spezifisches =====
 Unter Proxmox wird LVM defaultmäßing mitinstalliert, man im Installer wählen kann ob man ZFS oder EXT4 mit LVM haben möchte. Unter ZFS kann LVM einen Filter erstellen damit der HOST die LVMs von den Gästen nicht sieht. Ist sauberer.
@@ Zeile 499: / Zeile 622: @@
-===== Proxmox Rescue ZFS =====
+==== Proxmox Rescue ZFS ====
@@ Zeile 516: / Zeile 639: @@
 Natürlich bevor wir das alles erledigen möge man sich vorher erkundigen ob noch etwaige Zusatzdatasets auf Root zeigen. Diese müssen vorher ausgehängt werden.
+===== Kompletten RPOOL mit Proxmox recovern =====
+https://darkdevil.osit.cc/index.php/s/rWkEAEytAsmLc1r
+FIXME
+===== sharenfs =====
+Nutzt man ZFS als Dateisystem ist es klug die "sharenfs" Funktion von ZFS direkt statt dem System Export zu verwenden. Da hier die zeitliche Abfolge beim Systemstart immer optimal ist. Um eine Freigabe zu erstellen inkl. eines Datasets zu erstellen bedient man sich folgendem Befehl:
+<code>
+zfs create testpool/testnfs -o sharenfs="rw=@hostname1.local,rw=@192.168.1.3,no_root_squash,no_subtree_check,async"
+</code>
+Für IPV6 können als Source nur mehr FQDN verwendet werden.
+Bei einem bestehenden Dataset:
+<code>
+zfs set sharenfs="rw=@hostname1.local,rw=@192.168.1.3,no_root_squash,no_subtree_check,async" testpool/testnfs
+</code>
+Für eine einfache Freigabe:
+<code>
+zfs set sharenfs=on testpool/testnfs
+</code>
+Um eine Freigabe zu beenden:
+<code>
+zfs set sharenfs=off testpool/testnfs
+</code>
+Das Dataset löschen, löscht natürlich auch die Freigabe.
+Um zu sehen welche Freigaben nun aktiv sind gibt es mehrere Möglichkeiten. Am Host selbst:
+<code>
+cat /etc/dfs/sharetab
+</code>
+<code>
+zfs get sharenfs # kann auch mit weiteren Optionen kombiniert werden
+</code>
+Von einem anderen Host:
+<code>
+showmount  -e hostname.local
+</code>
+===== Swap =====
+Swap direkt auf ZFS erstellen. Empfohlen, genug RAM, oder Swap auf einem nicht ZFS-Filesystem.
+<code>
+zfs create -V 8G -b $(getconf PAGESIZE) -o compression=zle -o logbias=throughput -o sync=always -o primarycache=metadata -o secondarycache=none -o com.sun:auto-snapshot=false v-machines/swap
+</code>
-====== Links ======
+===== Links =====
   *  [[https://pve.proxmox.com/wiki/Storage:_ZFS|ProxmoxWIKI ZFS]]
@@ Zeile 524: / Zeile 689: @@
   *  [[https://wiki.archlinux.org/index.php/Experimenting_with_ZFS|Archlinux mit ZFS]]
   *  [[http://docs.oracle.com/cd/E24841_01/html/820-2313/gbbvf.html#gbcus|Oracle Reslivering]]
+  * [[http://open-zfs.org/wiki/Performance_tuning|ZFS Tuning]]
-====== Notiz ======
+===== Notiz =====
   zpool replace  -o ashift=9 zfs_raid <virtual device> /dev/sdd1
+  zdb --help