Imagen Docker para aplicaciones Python/Flask

La suma de las partes

14 de mayo de 2019 por

Bacalov, Damian

Production Ready

En el artículo anterior vimos qué requisitos básicos debía cumplir una imagen Docker para ser considerada Production Ready.

Definidas las bases, te voy a mostrar cómo crear imágenes Docker Production Ready para tus aplicaciones Python/Flask.

Spoiler alert! Si no podés esperar y querés ver el producto final, te invito a ver directamente mi proyecto de Github docker-python-flask.

¿Cómo publicamos aplicaciones Python/Flask en producción?

Antes de crear la imagen Docker, primero quería saber cuál es la forma recomendada hoy en día para publicar aplicaciones Python/Flask en servidores tradicionales. Recurrí a DigitalOcean y hallé la dirección correcta:

Python/Flask
Servidor uWSGI
Servidor Web Nginx
Unix Socks para comunicación entre Nginx y uWSGI

¡Perfecto! Ya sé lo que quiero; ahora necesito incluir todo esto en una imagen Docker respetando las características que hacen que un contenedor sea ProductionReady

¿Cómo incluimos todo esto en un contenedor Docker?

Las primeras pruebas estuvieron basadas en Gabriela Melo, Bradley Zhou y Scott Zelenka. Fue increíble ver mis aplicaciones dentro de contenedores por primera vez, sin embargo, el tamaño de las imágenes me pareció exagerado.

Gabriela utiliza la imagen python:3.5 como base que pesa 922MB, Scott utiliza la imagen nginx:latest de unos 109MB (sobre el que debemos instalar Python), Bradley utiliza python:3.6-slim que tiene un tamaño de 138MB.

Alpine Linux, primer intento

El siguiente paso era evidente, reemplazar las imágenes base por Alpine:latest, la imagen recomendada para prácticamente todos nuestros contenedores. Sin embargo, al intentar ejecutar pip3 install uwsgi, se produce un error que me resultaba imposible solucionar.

Fernando Koff resolvió este problema instalando todos los paquetes necesarios para compilar uwsgi. No obstante, el resultado es una imagen más grande de lo deseado.

Alpine Linux, segundo intento

Todo indicaba que el camino correcto era utilizar el paquete uwsgi para Alpine, pero conseguir documentación fue una misión imposible. Por suerte, encontré a Roman Dodin, que me enseño cómo configurarlo.

Mi propuesta está basada en esta imagen, solo que con dos cambios. Primero, no estaba convencido de usar Supervisord, un gestor de servicios tan pesado como innecesario, creo yo, para lo que estaba buscando. Segundo, el código fuente de mi aplicación no incluye algunos archivos que realmente no tienen que ver con el desarrollo: nginx.conf, flask-site-nginx.conf, supervisord.conf y uwsgi.ini.

Yoan Blanc comparte una propuesta minimalista muy interesante, pero utiliza dos contenedores separados. Es muy probable que utilice sus ideas cuando despliegue mis aplicaciones en Kubernetes.

Uniendo todas las partes

A esta altura tenía una idea bien definida de cómo quería mis contenedores, sólo necesitaba unir las partes. La base que usé fue la imagen de Aleksander S., la más pequeña usando Alpine, Python3 y uWSGI a la que le agregué los paquetes nginx y bash.

Luego, en lugar de configurar nginx y el sitio web correspondiente, decidí simplemente sobreescribir el archivo /etc/nginx/conf.d/default.conf directamente desde el Dockerfile. De esta manera, no necesité un archivo extra en mi repositorio GIT.

Por último, elegí crear un script bash para iniciar los servicios tal como indica la página oficial de docker.com y no utilizar Supervisord ya que es un servicio bastante costoso en megabytes.

Aplicación Flask

Bien, tengo mi contenedor que es pequeño, no usa servidores de debugging y con pocos archivos extra en el repositorio GIT. Para que el contenedor sea realmente Production Ready, necesitamos dos características más:

El código debe ser único para todos los ambientes
Los desarrolladores no deben conocer las credenciales de producción

Para cumplir con la regla de código único alcanzaría con incluir, en el repositorio GIT, las configuraciones de todos los ambientes y elegir la correcta con una variable de entorno según el ambiente. Sin embargo esta estrategia va en contra de la segunda premisa ya que, al estar en el repositorio GIT, los desarrolladores conocerán las credenciales de todos los ambientes.

Para solucionar ambos puntos mi propuesta es la siguiente: en el archivo __init__.py de mi aplicación, pregunto por la existencia de una variable de entorno. Si existe, sobreescribe la configuración de la aplicación.

Ejemplo:

if "MODULE_NAME" in os.environ:
    app.config["MY_MODULE"].update(
        name=os.environ["MODULE_NAME"]
)

De este modo, el desarrollador solo conoce las credenciales del entorno de Desarrollo y esto es lo que queda en el repositorio GIT. Pero al iniciar el contenedor en otro ambiente, simplemente agregamos “-e MODULE_NAME=my_name” a comando docker run y la configuración será la apropiada.

El producto final

Les dejo tanto el repositorio GIT como la imagen en docker hub para que puedan revisarlo, probarlo y contarme qué les parece. ¡Hasta la próxima!

La ruta con Flex CUDs en GCVE

Siguiendo la captura anterior, tu inversión en los nodos de GCVE queda protegida durante todo el ciclo. Si en el segundo año decidís migrar una carga de VMware hacia Compute Engine (GCE) o GKE, podés cancelar el CUD de GCVE y transferir su valor remanente para establecer un nuevo CUD equivalente en GCE o GKE.

Esto te permite mantener el descuento, conservar el ahorro y acompañar la evolución de tus workloads, reflejando de manera precisa el enfoque de Lift, Run & Transform.

Conectividad Nativa: El Primer Paso hacia PaaS

Como mencioné antes, uno de los errores más comunes es ver GCVE como un silo. Su verdadero valor está en su conectividad nativa de baja latencia con el ecosistema de Google Cloud. Una vez que tu entorno VMware está en GCVE, tus aplicaciones heredadas están literalmente a milímetros de consumir servicios nativos de Google.

No aprovechar estos servicios nativos representa una pérdida del TCO real de la infraestructura. Por eso es fundamental utilizar el tiempo que GCVE ofrece para ser estratégicos con cada aplicación y planificar qué workloads pueden modernizarse sin disrupción.

Desde Wetcom hacemos especial foco en identificar el consumo base para dimensionar Flex CUDs con precisión, asegurando ahorro en todo el cómputo y habilitando una transición ordenada hacia otros servicios cuando tenga sentido.

Algunos ejemplos de caminos posibles y que podemos probar con PoCs sin disrupción incluyen:

Hacia Google Compute Engine (GCE): Ideal para workloads que pueden beneficiarse de familias de máquinas especializadas, incluidas instancias con GPU o TPU.
Hacia servicios PaaS de Bases de Datos: Como Cloud SQL, AlloyDB o Cloud Spanner. Muchas de estas transiciones se logran de manera transparente utilizando el servicio nativo Database Migration Service (DMS) para migraciones homogéneas. Esto libera la carga operativa de los DBAs delegando la responsabilidad a Google.
Un dato de valor, la posibilidad de probar bases de datos como las que mencione y sin disrupción es un gran beneficio, ya que al tener baja latencia entre GCVE y el servicio nativo, las pruebas de concepto no impactan el servicio de producción.
Hacia Contenedores (Cloud Run / GKE): GCVE facilita identificar qué VMs son candidatas naturales para avanzar hacia modelos cloud-native cuando llegue el momento.

Seguridad Nativa y Mitigación de Riesgos

Y no nos limitemos únicamente en la modernización de nuestras aplicaciones. La preocupación por la seguridad en la nube es natural, y en Google Cloud se aborda con un enfoque de “menor privilegio” y “guardrails” claros.

La interconexión de GCVE con el VPC del cliente permite configurar micro-firewalls granulares, garantizando que solo los puertos y servicios estrictamente necesarios estén abiertos.
Servicios como Cloud Armor, Next Generation Firewall (NGFW) y Security Command Center (SCC) ofrecen una batería de protección y análisis. SCC, en particular, analiza la infraestructura y alerta sobre riesgos, ofreciendo una guía de best practices para mitigar vulnerabilidades como ataques de ransomware.
Y algo fundamental: establecer un Foundation adecuado desde el inicio, definiendo límites, permisos y controles por perfil de usuario, para evitar configuraciones riesgosas o costos inesperados. Desde Wetcom podemos acompañarlos en este diseño.

Pero mejor, veamos esta gráfica que resume claramente el recorrido que estamos describiendo:

Esta gráfica de Google Cloud resume la hoja de ruta que podemos diseñar, mostrando cómo se pasa de un costo base del 100% on-premise a aproximadamente un 45% del costo original en el quinto año. Lo interesante es que este ahorro puede sostenerse —y amplificarse— gracias a los Flex CUDs, que permiten transicionar el compromiso a distintos servicios de cómputo a medida que avanzamos con el Replatform & Refactor hacia servicios como GCE o GKE. Esto habilita liberar nodos de GCVE y reducir, de forma progresiva, parte del licenciamiento de VMware que quedaría en desuso.

El resultado final es un entorno híbrido optimizado:

GCVE para aquellas aplicaciones legacy que necesitan seguir ejecutándose allí, a milímetros de los servicios nativos de Google.
Y el resto de las aplicaciones ya modernizadas sobre GCE, GKE o bases de datos como servicio, aprovechando todo el potencial de la nube.

El proceso puede requerir tiempo para determinadas cargas de trabajo, pero el impacto acumulado habilita un aprovechamiento total del TCO de tu infraestructura con el correr de los años.

Inversión Inteligente, Futuro Asegurado

La elección de GCVE no es un compromiso con la tecnología de ayer, sino una decisión inteligente de migración. Te permite resolver la urgencia del presente mientras habilitás el futuro de la modernización, con la flexibilidad financiera que ofrecen los Flex CUDs.

Si te quedaste con ganas de indagar un poco más sobre hacia dónde podrías transicionar tus cargas de trabajo en GCP, te recomiendo este episodio de nuestros #InsanePodcasts, donde contamos distintos escenarios posibles:Google Cloud VMware Engine: Cómo evitar la fatiga tecnológica

¿Buscás una estrategia segura para evolucionar tu entorno VMware?

Desde Wetcom podemos acompañarte con un Cloud Assessment 100% bonificado para evaluar tu entorno VMware (o de otra nube) y diseñar una Hoja de Ruta hacia la modernización progresiva.

¿Migrando a GCVE? También te ayudamos con la cotización de licencias y nodos.

Accedé ahora