La piattaforma per confrontare le migliori offerte in diversi servizi sceglie l’approccio DevOps per assicurarsi scalabilità e continuous deployment di Enter Cloud Suite. Obiettivo di Facile.it, utilizzato ogni mese da 1,5 milioni di italiani, è offrire agli utenti un servizio completo, gratuito e semplice da usare, che consenta di scegliere online la proposta più conveniente per risparmiare su assicurazioni, finanza e spese di casa.
Il traffico utenti del portale è in continuo aumento, con picchi in particolare durante le ore diurne. Per questo il cliente si è trovato nella necessità di migrare su una soluzione che permettesse non solo di crescere ed evolvere nel tempo in base al numero di utenti con maggiore flessibilità, ma anche di fare scaling (in e out) automaticamente e di adottare la filosofia DevOps. Occorreva anche puntare su un abbattimento dei costi a parità di risorse utilizzate.
Il team di Enter Cloud Suite ha definito insieme a Facile.it un piano di lavoro per riprogettare tutta l’infrastruttura, costituita da oltre 50 server sui quali gira un avanzato stack tecnologico composto da servizi e microservizi spalmati in ambienti eterogenei come macchine virtuali, container su cluster Docker Swarm e container su Kubernetes. Nel disegnare la nuova architettura si è puntato sul paradigma Infrastructure as a Code: si è quindi descritta tutta l’infrastruttura in codice “Terraform” e “Ansible”, entrambi versionati con Git, che consente una maggiore flessibilità dell’infrastruttura (permettendo un’espansione e contrazione futura) e una sua documentazione per tracciare tutti gli interventi effettuati; è stata implementata una soluzione di continuous delivery integrata con il flusso di continuous integration del cliente e conforme alle sue policy di accesso ed autorizzazione; tutti i servizi più importanti (Database e relativi balancer, il filesystem condiviso e il Load Balancing per il front end) sono stati messi in alta affidabilità. Oggi è possibile misurare ogni singolo aspetto dei servizi in uso tramite strumenti di telemetria (Telegraf / Influx / Grafana).
Particolare attenzione è stata dedicata alla migrazione del database su una soluzione in alta affidabilità (Galera cluster) che consente una replica sincrona dei dati su più nodi garantendone la consistenza. L’attività è stata effettuata arrecando il minor disagio possibile per il cliente, nonostante le dimensioni considerevoli della base dati impattata. Tutti i backup sono oggi effettuati utilizzando la soluzione di Object Storage – Swift ad alta velocità, con replica automatica sulle 3 Region di ECS – Milano, Amsterdam e Francoforte -, assicurando una soluzione di disaster recovery.
I risultati ottenuti si possono sintetizzare in continuous delivery e continuous integration, uno scaling automatico dell’infrastruttura, alta affidabilità e bassa latenza.