Aller au contenu
Approche plateforme

Documentation technique

AI Platform Engineering sur AWS.

Comment nous concevons, sécurisons et exploitons des services GenAI en production sur AWS, du compte cloud au socle d'agents.

Destiné aux équipes techniques (architecture, DSI, cloud, sécurité). Les choix sont adaptés à votre contexte ; ce qui suit décrit notre architecture de référence.

L'IA comme un produit, sur un socle réutilisable.

L'objectif n'est pas de faire tourner un modèle, mais de livrer un service GenAI fiable, intégré au SI, sécurisé et mesuré, puis de le répliquer. Cela suppose un socle cloud et des pratiques d'ingénierie, pas une succession de POC.

Sécurité & gouvernance dès le départ

Comptes isolés, moindre privilège, chiffrement, traçabilité : la conformité est une condition de départ, pas une rustine.

Les données là où elles vivent

On connecte les sources existantes (S3, bases, ERP/CRM/GED) sans les recopier inutilement, avec résidence des données en Europe.

Tout en Infrastructure as Code

Landing zone, réseaux, modèles, agents : provisionnés et versionnés (Terraform / CDK), reproductibles d'un environnement à l'autre.

Observabilité & FinOps

Chaque appel modèle est tracé, mesuré et budgété ; le coût par usage et par token est piloté.

Humain dans la boucle

Les actions sensibles passent par une validation explicite ; des garde-fous encadrent les réponses.

Architecture de référence.

Un usage GenAI utile repose sur des couches qui fonctionnent ensemble, de la fondation cloud jusqu'à l'adoption. La sécurité, l'observabilité et le FinOps sont transverses.

06 Adoption & valeur
Assistants métiers Mesure d'usage KPIs Extension
05 Agents & applications
API Gateway Lambda ECS / Fargate Step Functions EventBridge
04 Socle GenAI, Amazon Bedrock
Bedrock (Claude) Knowledge Bases (RAG) Guardrails AgentCore Inférence UE
03 Données & intégration SI
S3 OpenSearch Serverless Aurora pgvector DynamoDB Glue Connecteurs MCP
02 Réseau & sécurité
VPC PrivateLink KMS Secrets Manager GuardDuty WAF
01 Landing Zone & comptes
AWS Organizations Control Tower SCPs IAM Identity Center
Transverse à toutes les couches
Sécurité Conformité Observabilité (CloudWatch · X-Ray) Traçabilité (CloudTrail) FinOps (Budgets · Cost Explorer)

Mise en place de l'environnement cloud (Landing Zone).

Avant tout usage GenAI, on pose une fondation cloud saine : isolation des environnements, sécurité centralisée et garde-fous automatiques. C'est ce qui rend la suite reproductible et auditable.

  • Multi-comptes par défaut

    Séparer production, hors-production, sécurité et outillage limite le rayon d'impact et clarifie les responsabilités.

  • Garde-fous automatiques (SCP)

    Des règles d'organisation empêchent les configurations dangereuses : régions non autorisées, ressources non chiffrées.

  • Identité centralisée (SSO)

    Accès fédérés via IAM Identity Center, droits temporaires et moindre privilège.

  • Sécurité & logs centralisés

    CloudTrail, Config, GuardDuty et Security Hub agrégés dans un compte dédié.

  • Réseau maîtrisé

    VPC privés, PrivateLink vers Bedrock et les services, pas d'exposition inutile sur Internet.

AWS Organizations

Management

  • Organizations
  • Facturation
  • Control Tower

Security

  • Log Archive
  • Audit
  • GuardDuty · Security Hub

Infrastructure

  • Réseau (Transit Gateway)
  • VPC partagés
  • Shared services

Workloads

  • GenAI, Dev
  • GenAI, Prod

Socle déployé via AWS Control Tower + Infrastructure as Code, adaptable à une landing zone déjà en place.

Les services AWS que nous utilisons.

Sélection guidée par le besoin et votre contexte, pas de complexité gratuite.

GenAI

  • Amazon Bedrock

    Modèles managés (dont Claude), sans serveur à gérer.

  • Bedrock Knowledge Bases

    RAG managé : ingestion, embeddings, recherche.

  • Bedrock Guardrails

    Filtrage contenus, sujets, masquage des PII.

  • Bedrock AgentCore

    Agents : orchestration, mémoire, identité, outils.

Données & vecteurs

  • Amazon S3

    Stockage des documents et données sources.

  • OpenSearch Serverless

    Recherche vectorielle pour le RAG.

  • Aurora PostgreSQL / pgvector

    Vecteurs et données relationnelles.

  • DynamoDB · Glue

    État/mémoire agents, ingestion de données.

Intégration & exécution

  • API Gateway · Lambda

    APIs privées et fonctions serverless.

  • ECS / Fargate

    Conteneurs pour charges durables.

  • Step Functions · EventBridge

    Orchestration et événements.

  • Connecteurs MCP

    Outils agents vers ERP, CRM, GED, APIs.

Sécurité & identité

  • IAM · IAM Identity Center

    Moindre privilège, accès fédérés (SSO).

  • KMS · Secrets Manager

    Chiffrement et gestion des secrets.

  • PrivateLink

    Accès privé à Bedrock et aux services.

  • GuardDuty · Security Hub · WAF

    Détection, posture, protection applicative.

Gouvernance & landing zone

  • AWS Organizations · Control Tower

    Multi-comptes et garde-fous.

  • AWS Config

    Conformité continue des ressources.

  • CloudTrail

    Journal d'audit de toutes les actions.

  • Service Catalog

    Modèles approuvés en libre-service.

Observabilité & FinOps

  • CloudWatch · X-Ray

    Métriques, logs, traces des requêtes.

  • Cost Explorer · Budgets

    Suivi et alertes de coûts.

  • Journalisation Bedrock

    Traçage des invocations modèles.

  • Tags FinOps

    Coût par usage, équipe et environnement.

Patterns GenAI agentiques.

Les briques que nous assemblons selon le cas d'usage, toujours encadrées.

RAG (recherche augmentée)

Bedrock Knowledge Bases + base vectorielle : les réponses s'appuient sur vos documents, avec citation des sources.

Agents & outils (MCP)

Un agent (AgentCore) appelle des outils, recherche, APIs métier, actions, via le protocole MCP, avec des droits cadrés.

Garde-fous (Guardrails)

Filtrage des contenus et des sujets, masquage des données sensibles (PII) en entrée et en sortie.

Humain dans la boucle

Les actions à risque (écriture, envoi, décision) requièrent une validation explicite et tracée.

Évaluation & qualité

Jeux de tests, mesure de pertinence et détection de régression avant et après mise en production.

Aligné sur le AWS Well-Architected Framework.

Nos choix suivent les six piliers du Well-Architected Framework, et sa Generative AI Lens. Appliqués à un usage GenAI :

Excellence opérationnelle

Déploiements automatisés (IaC, CI/CD), runbooks, observabilité de bout en bout.

Sécurité

Moindre privilège, chiffrement, isolation réseau, traçabilité, garde-fous.

Fiabilité

Quotas et limites gérés, reprise sur erreur, dégradation maîtrisée des appels modèles.

Performance

Modèle choisi selon le besoin, mise en cache, RAG ciblé, dimensionnement serverless.

Optimisation des coûts

Coût par token suivi, modèles adaptés, budgets et alertes (FinOps).

Développement durable

Régions et modèles adaptés, ressources serverless, pas de sur-provisionnement.

Nous appliquons aussi la Generative AI Lens : évaluation des réponses, garde-fous, supervision humaine et maîtrise des coûts d'inférence.

Industrialisation : Infrastructure as Code & CI/CD.

Landing zone, réseaux, garde-fous, serveurs MCP et agents : tout est versionné, testé et déployé automatiquement. Terraform (ou AWS CDK) pour l'infrastructure, un pipeline CI/CD dédié pour les outils MCP et les agents.

Terraform, extrait illustratif
# Bedrock guardrail, filter content + mask PII
resource "aws_bedrock_guardrail" "assistant" {
  name                      = "assistant-guardrail"
  blocked_input_messaging   = "Request blocked."
  blocked_outputs_messaging = "Response filtered."

  sensitive_information_policy_config {
    pii_entities_config { type = "EMAIL", action = "ANONYMIZE" }
  }
}

# Least-privilege execution role for the agent / MCP server
resource "aws_iam_role" "agent" {
  name               = "genai-agent-exec"
  assume_role_policy = data.aws_iam_policy_document.assume.json
}

resource "aws_iam_role_policy" "agent" {
  role = aws_iam_role.agent.id
  policy = jsonencode({
    Version   = "2012-10-17"
    Statement = [{
      Effect   = "Allow"
      Action   = ["bedrock:InvokeModel", "bedrock:Retrieve"]
      Resource = [var.model_arn, aws_opensearchserverless_collection.kb.arn]
    }]
  })
}

# MCP server container on ECS Fargate, behind a private API
module "mcp_server" {
  source        = "./modules/fargate-service"
  name          = "mcp-crm"
  image         = "${aws_ecr_repository.mcp.repository_url}:${var.git_sha}"
  task_role_arn = aws_iam_role.agent.arn
  private       = true
}

Pipeline CI/CD, serveurs MCP & agents

  1. 01

    Commit

    Code agent / serveur MCP, prompts, config Terraform.

  2. 02

    Lint & tests

    Tests unitaires, validation des schémas d'outils MCP, scan IaC.

  3. 03

    Build image

    Conteneur MCP / agent poussé sur ECR, scan de vulnérabilités.

  4. 04

    Évaluation

    Jeux de tests agent : pertinence, garde-fous, non-régression.

  5. 05

    Déploiement

    Terraform apply, ECS/Fargate ou AgentCore, dev → prod.

  6. 06

    Run & observabilité

    Traces, coûts, alertes ; rollback si régression.

Promotion dev → prod approuvée ; secrets injectés via Secrets Manager, jamais en clair. Outils : GitLab CI / GitHub Actions / CodePipeline.

Sécurité, conformité & maîtrise.

Résidence des données (UE)

Inférence et stockage en Europe ; vos données ne servent pas à entraîner les modèles.

Chiffrement de bout en bout

KMS (clés gérées), TLS partout, secrets dans Secrets Manager.

Moindre privilège

Rôles IAM dédiés par usage, accès temporaires, environnements séparés.

Traçabilité complète

CloudTrail, journalisation des invocations Bedrock, traçage des sources et actions.

Réseau privé

Accès à Bedrock et aux données via PrivateLink, sans transit par Internet.

Coûts sous contrôle (FinOps)

Budgets, coût par usage et par token, alertes de dérive.

Du compte AWS au service en production.

01

Fondation

Landing zone, comptes, sécurité et réseau (Control Tower + IaC).

02

Connexion des données

Sources SI, ingestion, base vectorielle, droits d'accès.

03

Construction du service

RAG et/ou agent, outils MCP, garde-fous, API.

04

Industrialisation

CI/CD, IaC, environnements dev → prod, tests et évaluation.

05

Exploitation (Run)

Observabilité, FinOps, amélioration continue, extension.

Auditer votre socle ou cadrer une architecture GenAI sur AWS ?

Échangeons sur votre environnement existant, vos contraintes de sécurité et la trajectoire la plus simple vers un usage en production.

Échanger avec un architecte