Installer et configurer K3s (approche industrialisee)

Conteneurisation — illustration — Illustration — Conteneurisation

Stack d’installation — K3s

Impact mesure (en %) — chiffres constates sur les projets du CV (sources : ALTEN/Worldline, VISEO/Rocher, Sylob, HPS).

Lead time du pipeline (min) sur 12 sprints

Couverture & automatisation

Cet article detaille l'installation et la configuration de K3s selon une approche industrialisee : reproductible, versionnee et prete pour la production des le depart.

Role : que fait K3s ?

K3s est une distribution Kubernetes certifiee CNCF, ultra-legere (binaire unique < 100 Mo), concue pour l'edge, l'IoT, le CI et les environnements a ressources contraintes. Elle remplace etcd par une base embarquee (SQLite/embedded etcd), integre conteneur runtime, CNI, Ingress (Traefik) et load balancer, tout en restant 100% compatible avec l'API Kubernetes. Ideale pour des clusters de test reproductibles, des PoC et des deploiements on-prem multi-noeuds simples a operer.

Cet article fait partie d'une serie de cinq consacree a K3s, abordant successivement les fondamentaux, l'installation, l'integration CI/CD, la production et le depannage. Chaque volet est autonome et orienté pratique d'ingenierie.

Installation et configuration

Une installation 'qui marche' ne suffit pas : viser des le depart une mise en place reproductible, versionnee et conforme aux contraintes de production.

Une commande pour le serveur ; les agents joignent via K3S_URL + K3S_TOKEN. En pratique, c'est un facteur direct de stabilite en production et de reduction du temps de diagnostic lorsqu'un incident survient. Le principe directeur reste l'immuabilite : on remplace plutot qu'on modifie en place, ce qui rend chaque etat reproductible. Sans cette discipline, le rollback devient incertain, ce qui allonge dangereusement le temps de reprise en cas de panne. Le bon niveau d'automatisation consiste a ce qu'aucune action manuelle non tracee ne soit necessaire pour le garantir. La consequence est une plateforme plus previsible, plus sure et nettement moins couteuse a operer au quotidien. Il s'inscrit dans une demarche GitOps/DevSecOps de bout en bout, ou Git reste l'unique source de verite.

HA : 3 serveurs avec --cluster-init/embedded etcd derriere un VIP/LB pour l'API. Bien maitrise, cet aspect reduit les interventions manuelles et securise les cycles de deploiement, ce qui est precisement l'objectif d'une demarche DevOps mature. La regle pratique est de rendre l'operation deterministe : memes entrees, meme resultat, quel que soit l'environnement. Neglige, ce point cree un point de defaillance unique et une dependance a la connaissance tacite d'un individu. On documente la decision et son contexte afin qu'un nouvel arrivant puisse la comprendre sans solliciter l'auteur. C'est precisement ce qui distingue une automatisation robuste d'un assemblage fragile de scripts difficilement maintenable. Il doit rester observable : expose en metriques et en alerting pour ne jamais sortir du champ de controle.

Desactiver les composants non desires (--disable traefik/servicelb) si une stack maison est preferee. Ignore, il devient une source recurrente d'incidents difficiles a tracer, car la cause racine est souvent loin du symptome observe. Le bon reflexe est de separer clairement configuration et code, et d'externaliser tout ce qui varie par environnement. L'absence de maitrise ici se paie en incidents de production et en perte de confiance dans la chaine de livraison. En mise en oeuvre, on commence par le formaliser dans un environnement de recette avant toute promotion vers la production. A l'echelle de dizaines d'applications, cet ecart de rigueur se traduit en jours d'exploitation economises chaque mois. Il gagne a etre standardise via un template, un role ou une bibliotheque partagee pour passer a l'echelle sans duplication.

Configurer un StorageClass adapte (local-path par defaut, ou Longhorn pour la persistance repartie). C'est l'un des leviers les plus rentables pour fiabiliser des environnements multi-equipes ou la moindre divergence de configuration coute cher. Il convient d'appliquer le moindre privilege : n'accorder que les droits strictement necessaires a l'execution. Le danger est d'introduire une faille de securite ou une non-conformite qui ne sera detectee qu'a l'audit. La regle d'or est de valider ce comportement par un test automatise qui echoue explicitement en cas de regression. C'est aussi un facteur de serenite pour les equipes d'astreinte, qui passent moins de nuits sur des incidents evitables. Il se documente et s'accompagne d'un runbook : la connaissance operationnelle ne doit pas dependre d'une seule personne.

Automatiser l'installation via Ansible pour des clusters reproductibles multi-noeuds. Dans un contexte reglemente (bancaire / PCI DSS), c'est aussi une exigence d'auditabilite : ce qui n'est pas tracable n'est pas conforme. L'approche saine consiste a echouer vite et explicitement plutot qu'a masquer une erreur qui resurgira plus tard. Le risque, sinon, est une derive silencieuse de configuration entre environnements (le fameux 'ca marche chez moi'). Concretement, on l'inscrit dans la revue de code et dans la definition of done de l'equipe, pas dans une procedure orale. L'impact se mesure directement sur les indicateurs DORA : lead time, frequence de deploiement, taux d'echec des changements et MTTR. Cet element s'integre naturellement dans un pipeline industrialise, revu en code et versionne avec l'application.

Concepts et architecture

Avant toute mise en oeuvre, il faut un modele mental correct de K3s. Les points suivants constituent la base sans laquelle l'outil reste une boite noire fragile.

Binaire unique embarquant API server, scheduler, controller, kubelet, containerd, Flannel CNI et Traefik. Ce point fait souvent la difference entre une plateforme que l'on subit et une plateforme que l'on pilote. Sur le plan operationnel, la mise en oeuvre doit etre idempotente : pouvoir etre rejouee sans effet de bord ni divergence d'etat. A defaut, on s'expose a des deploiements non reproductibles, impossibles a rejouer a l'identique en cas d'incident. On le rend mesurable : un indicateur dedie dans le tableau de bord permet d'en suivre l'evolution dans le temps. L'effet est tangible sur le temps de mise en production et sur la qualite percue par les equipes de developpement. Il se traite comme du code : versionne, teste, et promu a l'identique d'un environnement a l'autre, sans reconstruction.

Datastore pluggable : SQLite (mono-noeud), embedded etcd (HA), ou backend externe (MySQL/Postgres). Le negliger revient a accumuler une dette technique invisible jusqu'au jour ou elle bloque une livraison critique. Le principe directeur reste l'immuabilite : on remplace plutot qu'on modifie en place, ce qui rend chaque etat reproductible. Sans cette discipline, le rollback devient incertain, ce qui allonge dangereusement le temps de reprise en cas de panne. Le bon niveau d'automatisation consiste a ce qu'aucune action manuelle non tracee ne soit necessaire pour le garantir. Le retour sur investissement apparait des les premiers cycles de livraison automatises, puis se compose dans la duree. Il s'inscrit dans une demarche GitOps/DevSecOps de bout en bout, ou Git reste l'unique source de verite.

100% conforme a l'API Kubernetes : les manifests/Helm/kubectl fonctionnent a l'identique. Concretement, ce point conditionne la fiabilite et la reproductibilite de toute la chaine de livraison : un ecart ici se propage a l'ensemble des environnements. La regle pratique est de rendre l'operation deterministe : memes entrees, meme resultat, quel que soit l'environnement. Neglige, ce point cree un point de defaillance unique et une dependance a la connaissance tacite d'un individu. On documente la decision et son contexte afin qu'un nouvel arrivant puisse la comprendre sans solliciter l'auteur. La consequence est une plateforme plus previsible, plus sure et nettement moins couteuse a operer au quotidien. Il doit rester observable : expose en metriques et en alerting pour ne jamais sortir du champ de controle.

Composants par defaut (Traefik, ServiceLB, local-path) desactivables selon le besoin. En pratique, c'est un facteur direct de stabilite en production et de reduction du temps de diagnostic lorsqu'un incident survient. Le bon reflexe est de separer clairement configuration et code, et d'externaliser tout ce qui varie par environnement. L'absence de maitrise ici se paie en incidents de production et en perte de confiance dans la chaine de livraison. En mise en oeuvre, on commence par le formaliser dans un environnement de recette avant toute promotion vers la production. C'est precisement ce qui distingue une automatisation robuste d'un assemblage fragile de scripts difficilement maintenable. Il gagne a etre standardise via un template, un role ou une bibliotheque partagee pour passer a l'echelle sans duplication.

Resume des commandes essentielles

Aide-memoire operationnel des commandes et configurations les plus utilisees au quotidien. Chaque entree indique la commande puis son role.

curl -sfL https://get.k3s.io | sh -Installer un serveur K3s mono-noeud

curl -sfL https://get.k3s.io | K3S_URL=https://srv:6443 K3S_TOKEN=t sh -Joindre un agent

k3s kubectl get nodeskubectl integre

cat /var/lib/rancher/k3s/server/node-tokenRecuperer le token de join

k3s server --cluster-initInitialiser un cluster HA (embedded etcd)

k3s-uninstall.sh / k3s-agent-uninstall.shDesinstaller serveur / agent

systemctl status k3sEtat du service

k3s kubectl apply -f app.yamlDeployer une charge

INSTALL_K3S_EXEC='--disable traefik' ...Desactiver des composants par defaut

k3s ctr images lsImages du runtime containerd embarque

kubectl get svc -n kube-system traefikIngress Traefik integre

k3s etcd-snapshot saveSnapshot du datastore (HA)

Cas concret (contexte projet)

Pour les microservices bancaires haute disponibilite (Worldline / Societe Generale Maroc), la containerisation et l'orchestration Kubernetes/Helm ont standardise les deploiements et fiabilise des plateformes traitant des millions de transactions par jour. Le retour sur investissement apparait des les premiers cycles de livraison automatises, puis se compose dans la duree.

Synthese : bonnes pratiques

HA embedded etcd (3 serveurs) en production, snapshots testes.
Desactiver les composants par defaut non utilises.
Installation automatisee (Ansible/k3d) et reproductible.
Securite K8s standard (RBAC/NetworkPolicy/secrets chiffres).
Observabilite et GitOps identiques a un cluster classique.

Conclusion

Maitriser K3s ne se limite pas a connaitre des commandes : il s'agit de l'integrer dans une demarche d'ingenierie reproductible, observable et securisee. Applique avec rigueur, K3s devient un levier mesurable de fiabilite et de velocite des cycles de livraison.

Local → GitHub → CI/CD → VPS

Local

Dev, tests unitaires, Docker, lint

GitHub

Push, Pull Request, revue de code, versionnement

CI/CD

Build, tests, scan securite, image Docker

VPS

Deploiement Docker/K8s, Cloudflare, monitoring

Voir des videos sur YouTube

← K3s : fondamentaux et architecture K3s dans une chaine CI/CD →