ESXi ESXi ESXi PVE 500+ VMs ZERO DOWNTIME
Tornar al Blog

Com Vam Migrar +500 VMs de VMware a Proxmox Sense Aturar el Negoci

Un dels nostres clients es va trobar amb una factura de VMware que passava de 80.000 a 350.000 euros anuals després de l'adquisició de Broadcom. Tenia 12 hosts ESXi, més de 500 màquines virtuals i tres ubicacions. Necessitava una alternativa real, sense aturar el negoci. Això és el que vam fer.

El context: quan VMware deixa de ser una opció

El client és una empresa industrial amb presència a tres seus a Catalunya. El seu entorn de virtualització portava set anys sobre VMware vSphere amb vSAN: 12 hosts ESXi, més de 500 VMs en producció, xarxes VLAN segmentades per departament i rèpliques entre seus. Tot funcionava. Fins que va arribar la factura de renovació.

Amb el canvi de model de llicències de Broadcom, el cost passava de 80.000€ a 350.000€ anuals — un increment del 337%. No era un error: era el nou preu. El client ens va trucar amb una pregunta clara: «Podem sortir de VMware sense aturar el negoci?»

Entorn de partida: 12 hosts ESXi 7.0 | 3 seus | 512 VMs | vSAN | 47 VLANs | Rèpliques cross-site | SLA 99.9%

Fase 1: Auditoria completa (setmanes 1-2)

Abans de tocar res, necessitàvem saber exactament què teníem. Vam fer un inventari exhaustiu de tot l'entorn VMware amb RVTools, scripts PowerCLI personalitzats i documentació manual de dependències.

# Inventario automatizado con PowerCLI
Get-VM | Select Name, PowerState, NumCpu, MemoryGB, `
  @{N='DiskGB';E={(Get-HardDisk -VM $_ | Measure -Sum CapacityGB).Sum}}, `
  @{N='VLAN';E={(Get-NetworkAdapter -VM $_ ).NetworkName}}, `
  Guest, VMHost | Export-Csv -Path vm_inventory.csv

# Resultado: 512 VMs, 14.3 TB de disco, 47 VLANs unicas

L'auditoria va revelar sorpreses. Vam trobar 47 màquines amb Windows Server 2012 R2 que ningú recordava que existien, algunes corrent serveis de fitxers antics que encara tenien usuaris actius. També vam descobrir 23 snapshots orfes que consumien 2.1 TB d'espai innecessari.

Què vam documentar:

  • 512 VMs amb CPU, RAM, disc, xarxa i sistema operatiu
  • 47 VLANs amb mapes de dependència entre serveis
  • Polítiques de backup i rèpliques entre seus
  • Templates, snapshots orfes i VMs obsoletes
  • Classificació per criticitat: 83 crítiques, 156 importants, 273 estàndard

Fase 2: Disseny del nou entorn (setmanes 2-3)

Vam dissenyar un cluster Proxmox VE de 12 nodes (aprofitant el mateix hardware) amb Ceph com a storage distribuït. La clau era replicar exactament la topologia de xarxa existent perquè les aplicacions no notessin cap canvi.

Ceph Storage

Replicació triple, 3 pools: NVMe per a VMs crítiques (SQL, Exchange), SSD per a producció general, HDD per a arxiu i backups. Erasure coding 4+2 per al pool fred.

Xarxa

Linux bridges + VLANs replicant exactament les 47 xarxes VMware. Bonding LACP per a trunks. Xarxa Ceph dedicada a 25 Gbps separada del tràfic de VM.

Alta Disponibilitat

HA groups per rack amb regles d'afinitat. Fencing via IPMI/iDRAC (STONITH). Corosync amb link redundant entre seus. Quorum configurat per tolerar la caiguda d'una seu sencera.

Backup i DR

Proxmox Backup Server amb deduplicació. Backups incrementals diaris, complets setmanals. Rèpliques Ceph RBD mirroring entre seus per a DR.

Fase 3: Pilot amb 30 VMs (setmanes 3-4)

No vam migrar tot de cop. Vam seleccionar 30 VMs no crítiques — entorns de desenvolupament, servidors de test i eines internes — per validar tot el procés. La conversió VMDK a QCOW2 va ser el nucli tècnic:

# Conversion VMDK -> QCOW2 con compresion
qemu-img convert -f vmdk -O qcow2 -o preallocation=metadata \
  vm-disk.vmdk vm-disk.qcow2

# Importar a Proxmox (directo a Ceph pool)
qm importdisk 100 vm-disk.qcow2 ceph-ssd --format raw

# Para VMs grandes, conversion directa a raw en Ceph (mas rapido)
qemu-img convert -f vmdk -O raw vm-disk.vmdk rbd:ceph-ssd/vm-100-disk-0

# Verificacion de integridad
qemu-img check vm-disk.qcow2
qemu-img compare vm-disk.vmdk vm-disk.qcow2

El pilot va revelar dos problemes importants que vam resoldre abans de la migració massiva:

Problema 1: Drivers de disc
Les VMs Windows amb controlador LSI Logic no arrencaven amb VirtIO directament. Solució: instal·lar els drivers VirtIO abans de migrar, dins de VMware. Vam crear un procediment amb un script que muntava la ISO de VirtIO i instal·lava els drivers automàticament.

Problema 2: Xarxes amb MTU custom
Algunes VLANs de storage usaven jumbo frames (MTU 9000). El bridge per defecte de Proxmox utilitza MTU 1500. Vam configurar cada bridge amb el MTU correcte als fitxers /etc/network/interfaces de cada node.

Fase 4: Migració massiva (setmanes 4-8)

Amb el pilot validat, vam entrar en mode de migració. Cada dissabte, en finestres de manteniment de 4 hores (de 06:00 a 10:00), migràvem lots de 50 a 80 VMs. Vam automatitzar tot el procés amb scripts bash:

#!/bin/bash
# migrate_batch.sh - Migracion por lotes VMDK -> Proxmox/Ceph
BATCH_FILE="$1"          # CSV: vmname,vmid,pool,node
LOG="/var/log/migration/$(date +%Y%m%d).log"

while IFS=',' read -r vmname vmid pool node; do
    echo "[$(date)] Migrando $vmname -> VMID $vmid en $node" | tee -a "$LOG"

    # 1. Exportar VMDK via SSH desde ESXi
    ssh esxi "vim-cmd vmsvc/power.off \
      \$(vim-cmd vmsvc/getallvms | grep $vmname | awk '{print \$1}')"
    scp esxi:/vmfs/volumes/datastore1/$vmname/$vmname.vmdk /tmp/migration/

    # 2. Convertir e importar directamente al pool Ceph
    qemu-img convert -p -f vmdk -O raw \
      /tmp/migration/$vmname.vmdk rbd:$pool/vm-${vmid}-disk-0

    # 3. Crear config de VM en Proxmox
    qm create $vmid --name "$vmname" --memory 4096 --cores 2 \
      --net0 virtio,bridge=vmbr0 --ostype l26 \
      --scsi0 $pool:vm-${vmid}-disk-0 --scsihw virtio-scsi-single \
      --boot order=scsi0

    # 4. Verificacion
    qm start $vmid
    sleep 30
    qm agent $vmid ping && echo "[OK] $vmname operativa" | tee -a "$LOG"

    # 5. Cleanup
    rm /tmp/migration/$vmname.vmdk
done < "$BATCH_FILE"

Per a les VMs crítiques — servidors SQL Server, Exchange i l'ERP — no podíem permetre'ns cap finestra de manteniment. Vam usar una estratègia de replicació en calent:

  1. Replicació contínua VMDK → Ceph RBD amb rsync a nivell de bloc
  2. Delta sync final durant el micro-tall (< 2 minuts)
  3. Canvi de DNS i ARP per al cutover
  4. Validació automàtica post-migració amb health checks

Resultat: zero pèrdua de dades. Temps de tall màxim per VM crítica: 97 segons.

Fase 5: Optimització i decommission (setmanes 8-10)

Amb totes les VMs migrades, vam dedicar dues setmanes a optimitzar el rendiment del cluster Ceph i completar la transició:

# Tuning Ceph OSD para NVMe
ceph config set osd.* bluestore_cache_size_hdd 1073741824
ceph config set osd.* bluestore_cache_size_ssd 3221225472
ceph config set osd.* osd_memory_target 4294967296

# Balanceo de PGs
ceph balancer mode upmap
ceph balancer on

# Ajuste de recovery para no impactar produccion
ceph config set osd osd_recovery_max_active 1
ceph config set osd osd_recovery_sleep_hdd 0.1
ceph config set osd osd_max_backfills 1

# Verificacion de salud
ceph health detail
ceph osd pool stats

En paral·lel, vam formar l'equip IT del client amb sessions pràctiques de 3 dies cobrint temes com gestió de VMs, Ceph, backups, HA i resolució de problemes. Vam entregar documentació completa de tot l'entorn i un runbook per a incidències. Finalment, vam fer el decommission dels hosts ESXi: format, reclamació de llicències i retirada del vCenter.

Resultats: els números parlen

-72%

Cost anual

350K → 98K EUR

+15%

IOPS

Més rendiment disc

99.99%

Disponibilitat

4 mesos mesurats

+40%

Capacitat storage

Erasure coding

Mètrica VMware vSphere Proxmox + Ceph
Cost anual llicències 350.000 € 0 € *
Cost suport (opcional) Inclòs en llicència ~12.000 €
Cost migració + optimització - ~86.000 €
Cost total any 1 350.000 € 98.000 €
IOPS (4K random read) ~85.000 ~98.000
Capacitat storage útil 14.3 TB 20.1 TB
Disponibilitat (4 mesos) 99.95% 99.99%

* Proxmox VE és open source (AGPLv3). El cost de suport és per subscripció de suport empresarial opcional.

Lliçons apreses: 5 consells per a la teva migració

01 Comença per les VMs fàcils

Les VMs de test i desenvolupament són el banc de proves ideal. Permeten al teu equip agafar confiança amb el procés i detectar problemes sense impacte. Nosaltres vam trobar el problema dels drivers VirtIO gràcies a migrar primer una VM de test amb Windows.

02 Instal·la VirtIO drivers ABANS de migrar

Per a VMs Windows, munta la ISO de VirtIO dins de VMware i instal·la els drivers de disc, xarxa i ballooning. Després, la migració a Proxmox és transparent. Si ho fas després, necessitaràs arrencar en mode segur o amb controlador IDE temporal.

03 No subestimis les xarxes

El 80% dels problemes post-migració que vam trobar eren de xarxa: MTU incorrecte, VLANs mal configurades, bridges sense el tag adequat. Dedica temps a documentar i replicar la topologia de xarxa EXACTA. Testa connectivitat entre totes les VLANs abans de migrar la primera VM.

04 Ceph necessita tuning

Ceph amb la configuració per defecte funciona, però no rendeix al màxim. Ajustar la cache de BlueStore, el nombre de PGs per pool, els paràmetres de recovery i el tamany dels journals va fer una diferència mesurable. En el nostre cas, vam guanyar un 23% de IOPS només amb tuning.

05 Documenta-ho TOT

Cada decisió, cada canvi de configuració, cada problema i la seva solució. El runbook que vam crear té 120 pàgines i ha servit a l'equip IT del client per resoldre incidències de forma autònoma. La documentació és la diferència entre una migració exitosa i un desastre a càmera lenta.

Cronologia completa

Setmanes 1-2

Auditoria: inventari 512 VMs, mapes de xarxa, classificació per criticitat

Setmanes 2-3

Disseny: cluster Proxmox 12 nodes, Ceph 3 pools, xarxes, HA, backup

Setmanes 3-4

Pilot: 30 VMs no crítiques, detecció problemes VirtIO i MTU

Setmanes 4-8

Migració massiva: lots de 50-80 VMs cada dissabte, VMs crítiques amb replicació en calent

Setmanes 8-10

Optimització Ceph, formació equip IT, documentació, decommission ESXi

Et toca a tu

Si esteu davant d'una renovació de VMware amb preus desorbitats, o simplement voleu explorar alternatives obertes amb suport professional, podem ajudar-vos. Portem anys desplegant i gestionant entorns Proxmox amb Ceph en producció per a empreses de tota mida. Cada projecte és diferent, però l'experiència acumulada ens permet planificar migracions amb garanties.

Avaluació gratuïta de la teva infraestructura VMware

Analitzem el teu entorn, estimem costos i temps de migració i et presentem un pla detallat. Sense compromís.

Contactar amb everyWAN Servei de migració VMware

Etiquetes:

Compartir:

Articles relacionats

Subscriu-te al nostre butlletí

Per rebre històries del món IT, novetats d'everyWAN i ofertes exclusives per a subscriptors, dona't d'alta a la nostra llista de correu

Minorisa de Sistemas Informaticos y Gestión S.L. © 2026
everyWAN
everyWAN