- Doble ancho de banda de memoria y hasta 16 GB para LLMs/VLMs y CNNs exigentes.
- Diseño M.2 2280 más delgado, gestión térmica avanzada y seguridad con Root of Trust.
- 33% más en CNNs y 2x tokens/s en LLMs/VLMs con consumo típico cercano a 6,5 W.
El Metis M.2 Max de Axelera AI llega como una evolución directa de su tarjeta M.2 para inferencia en el borde, con un salto claro en memoria y rendimiento pensado para modelos de visión y de nueva generación como LLMs y VLMs. Este módulo M.2 2280 M-key duplica el ancho de banda de memoria, introduce un perfil más delgado y añade funciones de seguridad reforzadas para afrontar entornos exigentes.
Más allá del músculo, se ha cuidado la integración: hay variantes con hasta 16 GB, opciones para rangos térmicos estándar y extendidos, un disipador de bajo perfil opcional y un sistema para ajustar automáticamente el rendimiento según límites de energía o temperatura. Axelera acompaña el hardware con el Voyager SDK para facilitar la puesta en producción de modelos estándar e internos, simplificando el camino desde el laboratorio al despliegue en el edge.
Qué es Metis M.2 Max y a quién va dirigido
Metis M.2 Max es una tarjeta de aceleración de IA en formato M.2 2280 que toma como base el Metis AIPU (Artificial Intelligence Processing Unit) y lo lleva un paso más allá. Su objetivo es acelerar inferencias de visión por computador y de modelos generativos, incluidos LLMs y VLMs, en dispositivos embebidos y equipos compactos donde el consumo y el espacio mandan.
Por su forma y compatibilidad, encaja tanto en PCs industriales como en gateways y placas con ranura M.2 M-key PCIe Gen3 x4. Las industrias objetivo son la manufactura, el retail, la seguridad, la salud y la seguridad pública, escenarios donde el procesamiento local reduce latencias, refuerza la privacidad y alivia cargas en la nube.
Ficha técnica resumida y requisitos del host
Para quienes necesiten un repaso sintético de la integración, estos son los puntos más relevantes. Conviene validar cada detalle en la documentación del fabricante antes del diseño final del sistema.
- Acelerador: Metis AIPU.
- Memoria: 1 GB, 4 GB, 8 GB o 16 GB.
- Interfaz: M.2 2280 M-key con PCIe Gen 3.0 x4; requisito mecánico H5.6.
- CPU host: Intel Core, AMD Ryzen, Arm64 (aarch64).
- Sistema operativo: Linux nativo probado en Ubuntu 22.04; guía Docker para otras distros.
- Seguridad: Root of Trust, arranque seguro, actualización segura (firmware autenticado).
- Gestión térmica: sonda de potencia para ajuste automático; disipador de bajo perfil opcional.
- Potencia: cumplimiento M.2 rev. 4.0 (11,55 W medio, 23,1 W pico); operación típica anunciada ~6,5 W.
- Rangos térmicos: estándar (-20 °C a +70 °C) y extendido (-40 °C a +85 °C).
Novedades clave frente al Metis M.2 original
La propuesta de valor de M.2 Max se basa en cuatro ejes: memoria, perfil físico, gestión térmica y seguridad. El doble de ancho de banda de memoria desbloquea flujos más rápidos para LLMs/VLMs y aporta un 33% más de rendimiento en CNNs, lo que se traduce en más FPS o menor latencia a igual consumo.
- Doble ancho de banda de memoria para alimentar modelos exigentes sin cuellos de botella en un factor de forma M.2 compacto.
- Capacidades de memoria de 1, 4, 8 y 16 GB para adaptarse desde pruebas hasta despliegues avanzados.
- Perfil más delgado con reducción del 27% en altura y opción de disipador de bajo perfil para chasis ajustados.
- Gestión térmica avanzada con sonda de potencia integrada que ajusta automáticamente el rendimiento a límites de energía/temperatura.
- Seguridad reforzada: Root of Trust, arranque seguro y actualización segura, bloqueando firmware no autenticado.
La compañía afirma además un impulso notable en modelos generativos: el caudal de tokens por segundo se duplica para LLMs y VLMs respecto a la generación anterior, manteniéndose en un rango de potencia medio típico en torno a 6,5 W durante la operación habitual.
Rendimiento y eficiencia energética
En tareas de visión, los CNNs reciben un incremento del 33% que puede marcar la diferencia en pipelines con modelos en cascada o paralelos, por ejemplo para multi-cámara o etapas de pre/post-procesado. En LLMs/VLMs se reporta el doble de tokens por segundo, un dato práctico que muchos equipos usan hoy como métrica de desempeño real.
En consumo, Axelera sitúa el funcionamiento típico en torno a 6,5 W de potencia media durante cargas comunes, mientras que la integración eléctrica cumple con la especificación M.2 rev. 4.0 de PCI-SIG con 11,55 W de promedio y picos de 23,1 W. Esta combinación permite encajar la tarjeta en sistemas con presupuestos térmicos muy contenidos, algo clave en cajas compactas o entornos sin ventilación activa.
Sobre números “macro” de cómputo, hay un matiz importante: la información oficial del Max no entra en detalles de TOPS, aunque el ecosistema Metis AIPU se ha publicitado con hasta 214 TOPS y eficiencias del orden de 15 TOPS/W en materiales de plataforma. Fuentes especializadas señalan que esa cifra tope no sería representativa para la versión M.2, un recordatorio de que los TOPS, sin contexto de precisión/carga, pueden ser engañosos frente a métricas operativas como tokens/s o FPS en modelos concretos.
Seguridad de firmware pensada para el edge
El borde es un terreno especialmente sensible a amenazas, y por ello el M.2 Max incorpora un Root of Trust provisionado de forma segura en el propio silicio. Esta base habilita arranque seguro y actualización segura, de modo que solo ejecutará firmware autenticado emitido por Axelera AI.
La gracia está en que estos mecanismos se comportan de modo transparente para el usuario: no requieren intervención humana ni complican los flujos de mantenimiento. Para organizaciones con flotas heterogéneas, esta capa añade confianza y reduce la superficie de ataque en despliegues prolongados.
Diseño físico, disipación y ajuste automático
El M.2 Max utiliza el formato M.2 2280 con llave M, integrándose por borde en el slot del host con enlace PCIe Gen 3.0 x4. La reducción del 27% en altura, sumada al disipador de bajo perfil opcional, amplía la compatibilidad con chasis que antes quedaban descartados por holgura.
Para escenarios con restricciones energéticas o térmicas, la tarjeta equipa una sonda de potencia a bordo capaz de modular el rendimiento a ajustes predefinidos, manteniendo el sistema dentro de límites seguros. Este control permite exprimir el hardware sin exceder el presupuesto térmico del chasis, algo habitual en gateways pasivos o cajas IP.
Memoria, temperaturas y variantes
Axelera ofrecerá configuraciones con 1, 4, 8 y hasta 16 GB de memoria, un abanico lo bastante amplio para cubrir desde POCs hasta inferencia de modelos más corpulentos. El doble de ancho de banda de memoria frente al modelo previo es el motor que habilita el salto en CNNs y en throughput de tokens.
En condiciones ambientales, habrá dos rangos: estándar (-20 °C a +70 °C) y extendido (-40 °C a +85 °C) pensado para entornos agresivos. Esta bifurcación facilita homologar la misma plataforma desde oficinas a fábricas o exteriores sin recurrir a diseños ad hoc.
Por tipo de aplicaciones, la compañía cita de forma explícita industria, retail, seguridad, sanidad y seguridad pública, ecosistemas donde se combinan necesidades de latencia baja, continuidad de servicio y robustez proactiva ante fallos o intrusiones.
Requisitos del sistema e integración del host
Para integrarse, el Metis M.2 Max exige un host con ranura M.2 2280 M-key y enlace PCIe Gen3 x4. A nivel mecánico, se especifica la necesidad de H5.6 en el form factor, un detalle relevante para integradores que trabajan con barebones o placas industriales.
En compatibilidad de CPU, el soporte abarca Intel Core, AMD Ryzen y procesadores Arm64 (aarch64), ampliando el abanico más allá del x86. En software, hay soporte nativo para Linux probado en Ubuntu 22.04, con una guía Docker disponible para evaluar o desarrollar en otras distribuciones.
Si el objetivo es evaluación rápida, se puede adquirir la tarjeta de forma standalone o con solución de refrigeración, permitiendo validar primero en laboratorio y luego trasladar el stack a campo con el mismo hardware. Axelera afirma pruebas activas con integradores como Dell, Lenovo, Advantech o Aetina, algo útil para reducir incertidumbres de compatibilidad.
Voyager SDK: modelos, pipelines y herramientas
El SDK Voyager es el pegamento que permite pasar del modelo al despliegue: ofrece pipelines y modelos listos para usar, y compatibilidad con marcos estándar del sector. La promesa es acelerar la integración, ya sea con modelos de visión como YOLOv5/YOLOv8 o con LLMs y VLMs para tareas generativas y multimodales.
Además de ejemplos, el ecosistema incorpora herramientas de cuantización avanzadas que sostienen la precisión de predicción sin arruinar el rendimiento, una palanca clave en chips de borde. Tener pipelines end-to-end listos reduce el tiempo de desarrollo, desde la ingesta de múltiples cámaras hasta la orquestación de modelos en paralelo o cascada.
En la práctica, algunos comentarios en redes han señalado ciertas fricciones al exportar modelos personalizados o con la documentación. Es un área a vigilar y que suele mejorar con iteraciones del SDK, pero no desdibuja el valor de contar con un entorno unificado para portar, optimizar y desplegar.
Contexto de arquitectura y comparativas del mercado
El corazón de la plataforma Metis es un AIPU basado en una arquitectura propia con pilares como RISC-V y Digital In-Memory Computing (D-IMC). Esta aproximación busca maximizar la eficiencia moviendo menos datos y explotando el paralelismo, lo que sustenta cifras de eficiencia que la compañía ha publicitado en su ecosistema (hasta 214 TOPS y 15 TOPS/W para la plataforma en su conjunto).
En comparación con alternativas para el edge como NVIDIA Jetson Orin o Hailo, distintas fuentes subrayan una relación rendimiento/vatio muy competitiva para cargas de visión y generativas en el borde. La ausencia intencionada de TOPS específicos para la variante Max apunta a un foco en métricas de caso de uso, como FPS o tokens/s, más útiles para dimensionar sistemas reales.
Casos de uso destacados
El Max no solo acelera un modelo, también habilita pipelines con múltiples cámaras y redes en paralelo o en cascada, mitigando latencias y ahorrando ancho de banda hacia la nube. Esto resulta clave en seguridad, control de calidad e inspección industrial, donde el procesado local constante y fiable es imprescindible.
En robótica y movilidad, el bajo consumo típico y el formato M.2 permiten integrarlo en equipos compactos y alimentados por batería. Para sanidad o retail, el borde contribuye a resguardar datos sensibles y a generar respuestas rápidas en interacción con usuarios.
Disponibilidad y precios
Axelera AI ha confirmado que el Metis M.2 Max empezará a enviarse en el cuarto trimestre de 2025 a través de su webstore y de socios de canal. A día de hoy no hay precio oficial publicado para el Max, si bien se pueden tomar referencias del modelo previo.
En el mercado se citan precios del Metis M.2 original de 229,95 € sin refrigeración y 241,95 € con solución activa en la tienda de Axelera, mientras que otras fuentes mencionan un lanzamiento del modelo estándar en 149 $. Algunos medios estiman que el nuevo Max podría situarse en 300–400 €, pero son cifras orientativas hasta que exista PVP definitivo.