← Metaustral | Documentación

1. Introducción

Comprende las bases: qué es un catálogo de datos, por qué importa y el valor de negocio que entrega.

1.1 ¿Qué es un catálogo de datos?

Un catálogo de datos es un inventario organizado de todos los activos de información de una organización: tablas, vistas, dashboards, KPIs, reportes y datasets. Funciona como fuente única de verdad que responde las preguntas más frecuentes sobre datos: ¿Qué datos tenemos? ¿Qué significa este campo? ¿Quién lo posee? ¿De dónde viene?

Metaustral catalog view
El catálogo de Metaustral — busca, filtra por tipo/estado/dominio y visualiza cada activo con su propietario, etiquetas, nivel de sensibilidad y score de calidad.

1.2 Por qué las organizaciones necesitan un catálogo de datos

A medida que las organizaciones crecen, los datos se dispersan en decenas de bases de datos, dashboards y herramientas. Sin un catálogo, los equipos enfrentan problemas recurrentes:

  • Silos de datos: cada equipo mantiene su propia copia privada de la información.
  • Esfuerzo duplicado: los analistas gastan el 60–80% de su tiempo buscando y limpiando datos en vez de analizarlos.
  • Pérdida de confianza: definiciones inconsistentes generan reportes contradictorios.
  • Riesgo de compliance: sin visibilidad sobre datos sensibles ni quién los accede.
  • Onboarding lento: los nuevos integrantes tardan semanas en entender el ecosistema de datos.

1.3 Beneficios de la gestión centralizada de metadatos

BeneficioImpacto
DescubribilidadCualquier persona puede encontrar cualquier activo en segundos con búsqueda y filtros.
Definiciones compartidasLos glosarios de negocio alinean a los equipos sobre qué significa cada término.
GobernanzaLa propiedad, sensibilidad e historial de auditoría crean responsabilidad.
Visibilidad de linajeEntiende el recorrido completo de los datos desde el origen hasta el reporte.
Conciencia de calidadLos scores de calidad destacan qué activos necesitan atención.

2. ¿Qué es Metaustral?

Gobernanza de datos de nivel enterprise — sin el precio enterprise ni meses de implementación.

2.1 El problema que resolvemos

Las herramientas tradicionales de catálogo de datos fueron construidas para grandes empresas con equipos de ingeniería de datos dedicados, presupuestos de seis cifras y meses disponibles para la implementación. El resultado: la mayoría de las empresas medianas simplemente prescinden de ellas — sus datos quedan sin documentar, sin gobernar e inaccesibles para quienes más los necesitan.

Metaustral cambia esa ecuación. Entrega las mismas capacidades — descubrimiento automatizado, mapeo de linaje, scoring de calidad, historial de auditoría, búsqueda con IA — en un producto que puedes configurar en minutos y que todo tu equipo puede usar desde el primer día sin necesidad de capacitación.

2.2 ¿Por qué Metaustral?

Lo que otros cobran Cómo lo entrega Metaustral
6–12 meses de implementación Operativo en minutos — sin servicios profesionales
Equipo de ingeniería de datos dedicado para mantenerlo Cualquier administrador lo gestiona desde un panel web
Licencias enterprise desde $50,000/año Planes desde gratuito — escala a medida que creces
Integraciones complejas y dependencia del proveedor Conecta tus bases de datos existentes en un clic
Meses de capacitación de usuarios UI intuitiva — los analistas son productivos desde el día uno
Construido para equipos reales Ya seas una startup de 3 personas o una empresa de 500, Metaustral se adapta. El plan Free te permite comenzar a documentar tus activos más críticos hoy — sin tarjeta de crédito, sin llamada de ventas.

2.3 Planes y límites

Plan Activos de datos Conexiones BD Usuarios
Free Free Hasta 20 Ninguna 1 admin
Starter Starter Hasta 300 1 Hasta 3
Pro Pro Hasta 5.000 Ilimitadas Hasta 30
Enterprise Enterprise Ilimitados + IA + Agente on-premise Ilimitadas Ilimitados
Seguridad al bajar de plan Si bajas a un plan con menos activos, los existentes se conservan. No podrás crear nuevos hasta estar dentro del límite.

2.4 Casos de uso típicos

  • Programas de gobernanza de datos: asigna propietarios, administradores y sensibilidad a cada activo — sin una herramienta de gobernanza dedicada que cueste seis cifras.
  • Analytics de autoservicio: permite que los analistas encuentren y entiendan datasets sin preguntarle al equipo de datos, reduciendo el intercambio de mensajes en horas por semana.
  • Compliance regulatorio: rastrea columnas PII sensibles y audita cada cambio con un registro completo — listo para revisiones SOX, GDPR o HIPAA.
  • Aceleración del onboarding: los nuevos integrantes exploran el catálogo para entender el ecosistema en horas, no semanas — ahorrando días de tiempo de ingenieros senior.
  • Análisis de impacto: usa el linaje de datos para entender qué reportes se rompen cuando cambia una tabla de origen, antes de hacer el cambio.
  • Sincronización de metadatos: mantén el catálogo actualizado automáticamente con importaciones programadas — sin trabajo manual.

3. Primeros pasos

De cero a tu primer activo de datos documentado en menos de 5 minutos.

3.1 Crea tu cuenta

Entra a la página de registro

Visita /register y completa tu nombre de empresa, correo y contraseña. Cada registro crea un espacio de trabajo aislado (tenant) para tu organización.

Inicia sesión

Usa tu correo y contraseña en /login. La plataforma emite un token de acceso de 30 minutos (auto-renovado) y un token de refresco de 7 días almacenado localmente.

Accede al panel de administración

Como creador de la cuenta, tienes el rol de Admin. Navega a /admin para gestionar usuarios, conexiones y configuración del catálogo.

3.2 Crea tu primer activo de datos

Desde la vista del catálogo (/app), haz clic en + Nuevo. Elige un tipo de activo (Tabla, Dashboard, KPI, etc.), completa el nombre, descripción, propietario, dominio y etiquetas, y guarda. Tu primer activo ya está en el catálogo.

3.3 Invita usuarios

Desde el panel de administración, ve a la pestaña Usuarios. Ingresa un correo, elige un rol (Admin, Editor o Viewer) y envía la invitación. Los límites de usuarios dependen de tu plan (3 en Starter, 30 en Pro, ilimitados en Enterprise).

3.4 Explora el catálogo

La vista del catálogo (/app) te permite buscar por nombre, filtrar por tipo de activo, estado, dominio o etiqueta. Haz clic en cualquier activo para abrir su página de detalle con metadatos completos, documentación de columnas, grafo de linaje y score de calidad.

Catalog browse view
Explorando el catálogo: filtros por tipo a la izquierda, cuadrícula de activos con propietario, dominio, cantidad de columnas, badge de calidad y etiqueta de estado.

4. Activos de datos

Los objetos centrales del catálogo — todo lo que documentas, descubres y gobiernas.

4.1 Tipos de activos

Tipo Descripción Tiene columnas
TABLETABLE Tabla de base de datos
VIEWVIEW Vista de base de datos
DASHBOARDDASHBOARD Panel de visualización BI No
KPIKPI Indicador clave de rendimiento No
REPORTREPORT Reporte o documento No
DATASETDATASET Dataset genérico (archivo, API, etc.) No

4.2 Ciclo de vida del activo

graph LR A([draft]) --> B([active]) B --> C([deprecated]) C --> D([archived]) B --> D style A fill:#334155,stroke:#3D6478,color:#f1f5f9 style B fill:#065f46,stroke:#10b981,color:#f1f5f9 style C fill:#78350f,stroke:#f59e0b,color:#f1f5f9 style D fill:#1f2937,stroke:#6b7280,color:#9ca3af

Ciclo de vida: borrador → activo → deprecado → archivado

Asset detail page
Página de detalle del activo — encabezado con estado, sensibilidad, dominio, badge de score de calidad y desglose de puntos por campo (descripción, propietario, steward, dominio, categoría, etiquetas, documentación de columnas).

4.3 Propiedad del activo

  • Propietario (Owner): la persona (o equipo) responsable de producir y mantener el dato.
  • Administrador de datos (Steward): la persona responsable de asegurar la calidad de los metadatos y la exactitud de la documentación.

4.4 Etiquetas, dominio y clasificación

  • Etiquetas (Tags): etiquetas de forma libre para filtrado (ej: finanzas, pii).
  • Dominio: el área de negocio a la que pertenece el activo (ej: Ventas, Marketing, RRHH).
  • Categoría: una sub-agrupación dentro de un dominio.
  • Sensibilidad: una de public, internal, confidential o restricted.

5. Import Wizard

Crea o actualiza activos, columnas, linaje y relaciones ERD en un solo paso — desde un único archivo Excel.

5.1 ¿Qué es el Import Wizard?

El Import Wizard te permite poblar tu catálogo de datos de forma masiva usando una plantilla Excel estructurada (.xlsx). En lugar de crear activos uno por uno desde la interfaz, puedes preparar cientos de registros en una hoja de cálculo e importarlos en una sola operación. Está disponible para todos los planes — sin necesidad de conexión a base de datos.

Import Wizard — step 1 upload
Paso 1 — Subir archivo: descarga la plantilla Excel, complétala y arrástrala (o búscala) para subirla. El wizard la valida antes de importar.

5.2 Estructura de la plantilla Excel

Descarga la plantilla desde la pestaña Import Wizard ( en el menú lateral). Contiene cinco hojas:

  • Assets — campos requeridos: asset_name, asset_type. Soporta los 6 tipos de activo: TABLE, VIEW, DASHBOARD, KPI, REPORT, DATASET.
  • Columns — campos requeridos: asset_name, asset_type, column_name. Documenta las columnas de esquema de activos TABLE y VIEW.
  • Lineage — campos requeridos: source_asset, target_asset. Usa source_type / source_database cuando los nombres de activos sean ambiguos.
  • ERD — campos requeridos: source_table, target_table. Define relaciones de clave foránea entre tablas.
  • Instrucciones (EN / ES) — guía de referencia embebida con descripción de campos y ejemplos.

5.3 Previsualización y validación

Tras subir el archivo, el wizard muestra una previsualización antes de escribir ningún dato en el catálogo. La pantalla de previsualización muestra:

  • Un resumen con el conteo de activos nuevos a crear, activos a actualizar, columnas, filas de linaje, filas de ERD y errores.
  • Una tabla de activos a crear (verde) y activos a actualizar (azul), con los campos afectados listados.
  • Cualquier error a nivel de fila que deba corregirse antes de ejecutar la importación — por ejemplo, tipo de activo inválido, campo requerido faltante o nombre de activo ambiguo.
Import Wizard — step 2 preview
Paso 2 — Previsualización: las tarjetas de estadísticas muestran los conteos de un vistazo. Los errores se listan fila por fila con el nombre de la hoja y el número de fila, para que puedas corregirlos en el archivo Excel. Las filas válidas se muestran en las tablas de crear/actualizar más abajo.

5.4 Reglas de fusión

  • Lógica de coincidencia: un activo se identifica por nombre + tipo. Para TABLE y VIEW, database_name es un desempate adicional.
  • Actualizar, nunca sobreescribir con vacío: si una celda en el Excel está vacía, se conserva el valor existente en el catálogo. Solo las celdas no vacías actualizan el catálogo.
  • Error de ambigüedad: si dos activos comparten nombre y tipo y no se provee database_name, el wizard genera un error — agrega database_name para desambiguar.
  • Deduplicación de Lineage y ERD: las filas que ya existen en el catálogo se omiten silenciosamente — no se crean duplicados.
  • Dependencias en el mismo archivo: puedes importar columnas, linaje y ERD para activos que se crean en el mismo Excel — el wizard los resuelve en el orden correcto.

5.5 Registro de auditoría

Cada ejecución del Import Wizard queda registrada en el historial de auditoría. Cada activo creado o actualizado genera una entrada individual de CREATE o UPDATE, y una entrada resumen de tipo IMPORT captura los totales de la operación completa. Esto permite a los administradores rastrear exactamente qué se importó, quién lo hizo y cuándo.

Consejo: El Import Wizard está disponible para todos los planes (Gratis, Starter, Pro, Enterprise) y requiere el rol Editor o Admin. Los usuarios con rol Viewer no tienen acceso.

6. Descubrimiento de metadatos

Conecta tus bases de datos y deja que Metaustral descubra automáticamente tablas, vistas y columnas.

5.1 Fuentes de datos soportadas

SQL Server MySQL PostgreSQL Snowflake BigQuery Databricks
Motor Puerto Autenticación
SQL ServerSQL Server14331433 Usuario + Contraseña
MySQLMySQL33063306 Usuario + Contraseña
PostgreSQLPostgreSQL54325432 Usuario + Contraseña
SnowflakeSnowflake443443 Usuario + Contraseña + Warehouse + Rol
BigQueryBigQuery JSON de cuenta de servicio
DatabricksDatabricks443443 Host + HTTP Path + Token de acceso personal
Requisito de plan Las conexiones a bases de datos requieren el plan Starter o superior. El plan Free solo admite creación manual de activos.

5.2 Conectar una base de datos

Abre Conexiones

En el panel de administración (/admin), ve a Conexiones → Nueva conexión.

Completa las credenciales

Selecciona el tipo de motor e ingresa host, puerto, base de datos y credenciales. Las contraseñas se cifran con Fernet antes de guardarse — nunca en texto plano.

Prueba la conexión

Haz clic en Probar conexión. Metaustral ejecuta una consulta SELECT 1 e informa el resultado o el detalle del error.

Descubre e importa

Usa Descubrimiento para navegar esquemas → tablas → columnas. Selecciona qué importar y haz clic en Importar al catálogo.

graph LR DB[(Your database)] -->|Encrypted credentials| DE[Metaustral\nDiscovery Engine] DE -->|INFORMATION_SCHEMA| SC[Schemas] SC --> T[Tables / Views] T --> C[Catalog Assets] style DB fill:#1e293b,stroke:#3D6478,color:#f1f5f9 style DE fill:#1E3038,stroke:#9CC4D1,color:#f1f5f9 style SC fill:#1e293b,stroke:#3D6478,color:#94a3b8 style T fill:#1e293b,stroke:#3D6478,color:#94a3b8 style C fill:#065f46,stroke:#10b981,color:#f1f5f9

Flujo de descubrimiento: tu base de datos → motor Metaustral → activos del catálogo

DB Connections panel
El panel de Conexiones BD en el área de administración — donde agregas, pruebas y gestionas tus conexiones de base de datos antes de ejecutar el descubrimiento.

5.3 Descubrimiento automático de metadatos

Metaustral lee el INFORMATION_SCHEMA de tu base de datos para descubrir tablas, vistas y sus columnas. Para Databricks, soporta tanto Unity Catalog (espacio de nombres de 3 niveles: catalog.schema.table) como el metastore Hive legacy. Nunca se leen datos de tus tablas — solo definiciones de esquema.

5.4 Sincronización programada

Crea programaciones de importación para mantener tu catálogo sincronizado automáticamente. Cada ejecución usa una estrategia de fusión inteligente (smart merge): las tablas nuevas se crean, las existentes se actualizan, y las tablas que ya no están en el origen se marcan inactivas (no se eliminan). Frecuencias disponibles: Diaria, Semanal (día seleccionado), Mensual (día seleccionado).

6. Linaje de datos

Rastrea los datos a medida que fluyen desde las tablas de origen hasta dashboards y reportes.

6.1 ¿Qué es el linaje de datos?

El linaje de datos es el historial documentado de cómo los datos se mueven y transforman a través de los sistemas. Responde: "Este KPI está roto — ¿de qué tabla upstream proviene?" o "Si cambio esta tabla, ¿qué dashboards se verán afectados?"

6.2 Cómo funciona el linaje en Metaustral

El linaje se expresa como aristas dirigidas entre activos del catálogo. Cada arista tiene un origen, un destino, un tipo de transformación opcional (ej: "ETL", "SQL view", "dbt model") y una descripción de texto libre. Desde la página de detalle de cualquier activo, puedes ver tanto las dependencias upstream como downstream. Los editores y superiores pueden crear o eliminar aristas de linaje.

graph LR A[("orders\ntable")] -->|ETL| B[("orders_daily\nview")] B -->|SQL| C[("Revenue\nKPI")] B -->|dbt model| D[("Sales\nDashboard")] C --> E[("Monthly\nReport")] style A fill:#1E3038,stroke:#3D6478,color:#f1f5f9 style B fill:#1E3038,stroke:#3D6478,color:#f1f5f9 style C fill:#065f46,stroke:#10b981,color:#f1f5f9 style D fill:#065f46,stroke:#10b981,color:#f1f5f9 style E fill:#1E3038,stroke:#9CC4D1,color:#f1f5f9

Ejemplo: tabla cruda → vista agregada → KPI y dashboard → reporte

6.3 Beneficios de negocio

  • Análisis de impacto: antes de cambiar una tabla, ve qué activos downstream dependen de ella.
  • Análisis de causa raíz: cuando un reporte falla, rastrea el pipeline de datos upstream para encontrar el origen del problema.
  • Compliance: demuestra la cadena completa de movimiento de datos para datasets sensibles.
  • Confianza: los analistas entienden de dónde vienen sus números.

7. Diagramas ERD

Visualiza relaciones de clave foránea entre tablas como diagramas entidad-relación generados automáticamente.

7.1 ¿Qué es un ERD?

Un Diagrama Entidad-Relación (ERD) muestra cómo las tablas de base de datos están conectadas a través de restricciones de clave foránea. Responde preguntas como "¿Qué tablas referencian la tabla customers?" o "¿Cómo es la estructura del esquema de orders?" Un ERD es la forma más rápida de incorporar nuevos miembros del equipo a un esquema de base de datos y documentar el modelo de datos para compliance o revisión arquitectónica.

7.2 ERDs en Metaustral

Los diagramas ERD aparecen en la página de detalle de activos tipo TABLE únicamente — como una pestaña ERD dedicada entre Linaje y Glosario. Las relaciones se almacenan en una tabla separada erd_relations, independiente del grafo de linaje, de modo que agregar o eliminar aristas ERD nunca afecta los datos de linaje.

erDiagram CUSTOMERS ||--o{ ORDERS : "customer_id" ORDERS ||--|{ ORDER_ITEMS : "order_id" PRODUCTS ||--o{ ORDER_ITEMS : "product_id"

Ejemplo de ERD: customers → orders → order_items ← products

7.3 Detección automática de FK

Al importar tablas desde una base de datos conectada, Metaustral detecta automáticamente las restricciones de clave foránea y crea relaciones ERD para ellas. Las relaciones detectadas se marcan con un badge AUTO. La detección es compatible con:

  • SQL Server — vía sys.foreign_key_columns
  • MySQL — vía INFORMATION_SCHEMA.KEY_COLUMN_USAGE
  • PostgreSQL — vía information_schema.table_constraints
DWHs en la nube Snowflake, BigQuery y Databricks no refuerzan restricciones FK a nivel de motor, por lo que la detección automática no está disponible para esos conectores. Puedes agregar relaciones manualmente igualmente.

7.4 Relaciones manuales

Los editores y administradores pueden agregar relaciones manualmente desde la pestaña ERD. Haz clic en + Agregar relación, busca la tabla relacionada, especifica opcionalmente los nombres de las columnas FK y PK, elige un tipo de cardinalidad (muchos a uno, uno a muchos, uno a uno, muchos a muchos) y agrega opcionalmente una etiqueta. Las relaciones agregadas manualmente se marcan con un badge MANUAL y pueden eliminarse en cualquier momento.

Buena práctica Abre la pestaña ERD primero en tus tablas de hechos más importantes (órdenes, transacciones, eventos) — generalmente tienen las más relaciones FK y brindan la vista más clara de tu modelo de datos.

8. Glosarios

Define la terminología de negocio compartida y vincúlala directamente a los activos del catálogo.

8.1 ¿Qué son los glosarios?

Un glosario de negocio es una colección de definiciones estandarizadas de términos usados en toda la organización. Sin uno, el mismo concepto puede significar cosas diferentes para distintos equipos — "cliente activo" puede estar definido de manera diferente por Marketing, Ventas y Finanzas, generando reportes contradictorios.

8.2 Cómo funcionan los glosarios en Metaustral

Cada glosario tiene un nombre, una descripción opcional y una lista de términos — cada término tiene un nombre y una definición. Los glosarios se crean y gestionan desde el panel de administración. Cualquier activo del catálogo puede vincularse a un glosario, y sus términos aparecen directamente en la página de detalle del activo.

Buena práctica Crea un glosario por dominio de negocio (Finanzas, Ventas, RRHH) y vincula las tablas y dashboards relevantes a cada uno.

9. Score de calidad de datos

Un score de completitud automático que muestra qué tan bien está documentado cada activo.

9.1 Por qué importa

Un catálogo con activos sin documentar aporta poco valor. El Score de calidad asigna a cada activo un score de 0 a 100 basado en la completitud de sus metadatos, facilitando la priorización del esfuerzo de documentación. El dashboard de administración muestra el score general del tenant — el promedio de todos los activos en tu espacio de trabajo.

9.2 Cálculo del score

Campo Puntos Condición
Descripción 2525 Presente y de más de 10 caracteres
Nombre del propietario 2020 No vacío
Dominio 1515 No vacío
Documentación de columnas
(solo TABLE / VIEW)
1515 Proporcional al % de columnas con descripción
Nombre del steward 1010 No vacío
Categoría 1010 No vacío
Etiquetas 55 Al menos una etiqueta
Score de columnas Para tablas y vistas, los 15 puntos de columnas son proporcionales: si 6 de 10 columnas activas tienen descripción, el score de columnas es 9 puntos (60% × 15). Para otros tipos de activos, los 15 puntos se otorgan automáticamente.
Quality score breakdown
El panel de desglose del score en la página de detalle del activo — cada campo muestra cuántos puntos aportó al total de 100 puntos del score de calidad.

10. Historial de auditoría Pro Enterprise

Un registro completo de cada acción de escritura en tu espacio de trabajo.

10.1 Qué se registra

Cada acción de creación, actualización y eliminación en los activos del catálogo se registra con: tipo de acción (ej: create_item, update_item), tipo de recurso e ID, el correo del usuario que la realizó, un payload JSON con los valores de campo, y un timestamp UTC exacto. Los logs se pueden filtrar por acción y tipo de recurso, paginados hasta 200 registros por solicitud.

10.2 Cómo los logs de auditoría ayudan a la gobernanza

  • Responsabilidad: cada cambio tiene un actor identificado y un timestamp — sin modificaciones anónimas.
  • Compliance regulatorio: demuestra a los auditores (SOX, GDPR, HIPAA) que los cambios en activos sensibles están rastreados.
  • Investigación de incidentes: el log de auditoría dice exactamente quién cambió qué y cuándo.
Requisito de plan El Historial de auditoría está disponible solo en los planes Pro y Enterprise.

11. Roles de usuario y permisos

Controla quién puede ver, editar y gestionar datos en tu espacio de trabajo.

Viewer
  • Explorar catálogo
  • Buscar activos
  • Ver detalles del activo
  • Ver linaje
  • Ver glosarios
Editor
  • Todo lo de Viewer
  • Crear / editar activos
  • Gestionar columnas
  • Crear aristas de linaje
  • Gestionar glosarios
Admin
  • Todo lo de Editor
  • Eliminar activos
  • Gestionar usuarios
  • Gestionar conexiones
  • Ver logs de auditoría
  • Configurar descubrimiento
Acción ViewerEditorAdmin
Explorar catálogo
Crear / editar activos
Eliminar activos
Gestionar linaje
Gestionar glosarios
Gestionar usuarios
Configurar conexiones
Ver logs de auditoría
Usar módulo de IAEnterprise
Admin control panel
El Panel de Control de Administración — resumen de activos totales, usuarios, score de calidad promedio y distribución de calidad en niveles Excelente / Bueno / Regular / Deficiente, con activos que necesitan atención destacados.

12. Módulo de IA Enterprise

Haz preguntas sobre tu catálogo en lenguaje natural y obtén respuestas instantáneas con contexto.

Solo Enterprise Requiere una clave API de Anthropic configurada por el administrador en el panel de configuración de superadmin.

12.1 Búsqueda en lenguaje natural

En vez de navegar filtros, puedes hacerle preguntas al asistente de IA como se las harías a un colega. El asistente tiene contexto completo de tu catálogo — todos los nombres de activos, tipos, descripciones, propietarios, etiquetas y términos del glosario — y responde basándose en lo que está realmente documentado en tu espacio de trabajo.

Ejemplos de preguntas:
"¿Qué tablas contienen datos de clientes?"
"¿Cuál es el origen del KPI de Ingresos Mensuales?"
"Muéstrame todos los activos del equipo de Finanzas."
"¿Qué tablas están marcadas como confidenciales?"

12.2 Cómo funciona

Cuando envías una pregunta, Metaustral construye un snapshot del contexto de tu catálogo y lo envía junto con tu pregunta a Claude Haiku (Anthropic). El modelo devuelve una respuesta en lenguaje natural mostrada en la interfaz de chat. Nunca se envían datos reales de tus bases de datos — solo metadatos del catálogo.

sequenceDiagram participant U as User participant M as Metaustral participant AI as Claude Haiku (Anthropic) U->>M: "Which tables contain PII data?" M->>M: Build catalog context snapshot M->>AI: Question + catalog metadata AI-->>M: Natural language answer M-->>U: Display answer in chat M->>M: Log usage (tokens, cost)

Módulo IA: pregunta del usuario → contexto del catálogo → Claude Haiku → respuesta

13. Agente on-premise Enterprise

Descubre metadatos de bases de datos que no pueden ser accedidas directamente desde la nube.

13.1 Por qué las organizaciones lo necesitan

Muchas organizaciones operan bases de datos dentro de redes privadas que no pueden ser alcanzadas desde la nube. El agente on-premise resuelve esto ejecutándose dentro de la red privada: se conecta a la base de datos local, descubre los metadatos y los envía a la API en la nube de Metaustral — sin exponer nunca la base de datos a internet.

13.2 Consideraciones de seguridad

  • Solo tráfico saliente: el agente inicia solicitudes HTTPS salientes a la API de Metaustral. No es necesario abrir puertos de firewall entrantes.
  • Solo metadatos: el agente lee únicamente definiciones de esquema — nunca datos reales de filas.
  • Aislamiento de credenciales: las credenciales se almacenan en un archivo .env local y nunca se transmiten a la nube.

13.3 Resumen de arquitectura

graph TB subgraph cloud[" Cloud — Metaustral"] API[Metaustral API] CAT[(Catalog)] API --> CAT end subgraph private[" Private Network"] AGENT[On-Premise Agent\nPython script] DB[(Internal Database)] AGENT -->|INFORMATION_SCHEMA| DB end AGENT -->|HTTPS outbound only| API style cloud fill:#182830,stroke:#3D6478,color:#f1f5f9 style private fill:#0f1e1a,stroke:#10b981,color:#f1f5f9 style AGENT fill:#065f46,stroke:#10b981,color:#f1f5f9 style DB fill:#1e293b,stroke:#3D6478,color:#f1f5f9 style API fill:#1E3038,stroke:#9CC4D1,color:#f1f5f9 style CAT fill:#1e293b,stroke:#3D6478,color:#f1f5f9

Agente on-premise: dentro de la red privada → HTTPS saliente → API en la nube de Metaustral

El agente puede ejecutarse una vez (bajo demanda) o en un intervalo recurrente (ej: cada hora). Cada ejecución sincroniza los metadatos e informa el resultado al historial de ejecuciones de la plataforma.

Excel / Import Wizard

Llena tu catálogo en masa — activos, columnas, linaje y relaciones ERD — desde un único archivo Excel estructurado.

Descripción general

El Import Wizard permite crear o actualizar cientos de entradas del catálogo a la vez usando una plantilla .xlsx pre-estructurada. Es ideal para migraciones iniciales, sprints de documentación masiva y para mantener el catálogo sincronizado con una hoja maestra gestionada por tu equipo de datos.

Requisito de plan El Import Wizard está disponible en todos los planes. Se requiere el rol Editor o Admin — los Viewers no tienen acceso.

Paso 1 — Descarga la plantilla y sube tu archivo

Navega a Data Management → Import Wizard. Haz clic en Download template para obtener el archivo .xlsx oficial, completa los datos en sus cuatro hojas (Assets, Columns, Lineage, ERD) y arrastra el archivo completado al área de carga.

Import Wizard — upload step
Import Wizard paso 1: descarga la plantilla Excel y luego arrastra tu archivo completado para cargarlo.

Paso 2 — Vista previa y ejecución

Tras la carga, Metaustral analiza el archivo y muestra una vista previa de lo que se creará o actualizará — desglosado por nuevos activos, actualizaciones, columnas, vínculos de linaje y relaciones ERD. Revisa el resumen y haz clic en Execute import para aplicar los cambios.

Import Wizard — preview step
Import Wizard paso 2: vista previa de nuevos activos y actualizaciones, con conteos por categoría y detalle fila a fila antes de ejecutar.

Hojas de la plantilla Excel

SheetSheet Qué contiene
AssetsAssets Una fila por activo. Obligatorio: nombre, tipo. Opcional: descripción, propietario, dominio, estado, sensibilidad, etiquetas, database_name, schema_name.
ColumnsColumns Metadatos de columnas para activos TABLE y VIEW. Obligatorio: asset_name, column_name, data_type. Opcional: description, is_pk, is_nullable.
LineageLineage Relaciones de flujo de datos. Obligatorio: source_name, target_name. Opcional: notas de transformación.
ERDERD Relaciones estilo clave foránea. Obligatorio: from_asset, from_column, to_asset, to_column, cardinality.
Consejo: Las celdas en blanco en el Excel conservan el valor existente en el catálogo — el wizard nunca sobreescribe un campo con un valor vacío. Solo las celdas no vacías actualizan el catálogo.

Integración con SQL Server

Conecta una instancia de Microsoft SQL Server a Metaustral y descubre automáticamente tablas, vistas, columnas y claves foráneas.

Requisitos previos

  • Una instancia de SQL Server (2012 o superior) accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
  • Un login SQL con al menos VIEW DEFINITION y SELECT sobre INFORMATION_SCHEMA.
  • TCP/IP habilitado en el puerto 1433 (o un puerto personalizado) y permitido a través de firewalls de red.
  • Plan Starter, Pro o Enterprise (las conexiones a bases de datos no están disponibles en el plan Free).

Cómo conectar

Abre DB Connections

Desde el menú Data Management, selecciona DB Connections y haz clic en + New connection.

Selecciona SQL Server como tipo

Elige SQL Server en el desplegable Type. El formulario mostrará los campos requeridos.

Completa los detalles de conexión

Ingresa el nombre de conexión, host/servidor, puerto (por defecto 1433), nombre de base de datos, usuario, contraseña y un filtro de esquema opcional (ej. dbo, ventas). Haz clic en Save.

Ejecuta el descubrimiento

Ve a Discovery, selecciona tu nueva conexión y haz clic en Connect. Metaustral inspeccionará la base de datos y listará todas las tablas y vistas disponibles para importar.

SQL Server connection form
Formulario de conexión SQL Server — host, puerto 1433, base de datos, usuario, contraseña y filtro de esquema opcional.

Campos de conexión

Campo Requerido Notas
Connection nameNombre de conexiónEtiqueta para esta conexión en el catálogo.
Host / ServerHost / ServidorDirección IP o hostname de tu SQL Server.
PortPuertoPor defecto: 1433.
DatabaseBase de datosLa base de datos a inspeccionar.
UsernameUsuarioLogin SQL con derechos de VIEW DEFINITION.
PasswordContraseñaAlmacenada cifrada con Fernet — nunca legible en texto plano.
Schema filterFiltro de esquemaNoLista separada por comas. Si está vacío, se muestran todos los esquemas.
Consejo: Crea un login SQL de solo lectura dedicado para Metaustral. El proceso de descubrimiento solo lee INFORMATION_SCHEMA y nunca accede a datos de filas.

Integración con MySQL

Conecta una base de datos MySQL o MariaDB a Metaustral y descubre automáticamente tablas, vistas, columnas y relaciones de clave foránea.

Requisitos previos

  • MySQL 5.7+ o MariaDB 10.3+ accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
  • Un usuario MySQL con SELECT en information_schema para la base de datos objetivo.
  • Puerto 3306 abierto para conexiones entrantes desde los rangos IP de Metaustral.
  • Plan Starter, Pro o Enterprise.

Cómo conectar

Abre DB Connections y haz clic en + New connection

Selecciona MySQL como tipo

El formulario muestra: host, base de datos, usuario y contraseña. No se muestra campo de puerto (MySQL siempre usa el 3306).

Completa las credenciales y guarda

Ingresa el nombre de conexión, host, nombre de base de datos, usuario y contraseña. Haz clic en Save.

Ejecuta el descubrimiento desde la página Discovery

MySQL connection form
Formulario de conexión MySQL — host, nombre de base de datos, usuario y contraseña.
Consejo: Usa un usuario MySQL de solo lectura dedicado: GRANT SELECT ON information_schema.* TO 'metaustral_ro'@'%';

Integración con PostgreSQL

Conecta una base de datos PostgreSQL a Metaustral y cataloga automáticamente sus tablas, vistas, columnas y relaciones de clave foránea.

Requisitos previos

  • PostgreSQL 11+ accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
  • Un usuario PostgreSQL con CONNECT en la base de datos objetivo y USAGE en los esquemas a inspeccionar.
  • Puerto 5432 accesible desde Metaustral.
  • Plan Starter, Pro o Enterprise.

Cómo conectar

Abre DB Connections y haz clic en + New connection

Selecciona PostgreSQL como tipo

Completa los detalles de conexión

Ingresa el host, nombre de base de datos, usuario y contraseña. Haz clic en Save.

Ve a Discovery, selecciona la conexión y haz clic en Connect

PostgreSQL connection form
Formulario de conexión PostgreSQL — host, base de datos, usuario y contraseña.
Consejo: Otorga privilegios mínimos con GRANT CONNECT ON DATABASE mydb TO metaustral_ro; GRANT USAGE ON SCHEMA public TO metaustral_ro;

Integración con Snowflake

Conecta tu data warehouse de Snowflake a Metaustral y descubre automáticamente bases de datos, esquemas, tablas y vistas.

Requisitos previos

  • Una cuenta activa de Snowflake con un virtual warehouse en ejecución.
  • Un usuario Snowflake con USAGE en el warehouse y REFERENCES (o superior) en la base de datos y esquemas objetivo.
  • Plan Starter, Pro o Enterprise.

Cómo conectar

Abre DB Connections y haz clic en + New connection

Selecciona Snowflake como tipo

Completa los campos específicos de Snowflake

Ingresa tu Account Identifier (ej. xy12345.us-east-1), Database, Warehouse, un Role opcional, y tu Username y Password.

Guarda y ejecuta el descubrimiento

Snowflake connection form
Formulario de conexión Snowflake — account identifier, database, warehouse, role opcional, usuario y contraseña.

Campos de conexión

Campo Notas
Account IdentifierAccount IdentifierEncuéntralo en Snowflake en Admin → Accounts. Formato: orgname-accountname o locator.region.
DatabaseDatabaseLa base de datos Snowflake a inspeccionar.
WarehouseWarehouseVirtual warehouse utilizado para ejecutar las consultas de introspección.
Role (optional)Role (opcional)Sobreescribe el rol por defecto para esta sesión. Úsalo si tu usuario necesita un rol específico para acceder a la base de datos objetivo.
Consejo: Crea un rol Snowflake dedicado con privilegios mínimos: GRANT USAGE ON WAREHOUSE my_wh TO ROLE metaustral_ro; GRANT REFERENCES ON ALL TABLES IN DATABASE mydb TO ROLE metaustral_ro;

Integración con Databricks

Conecta un workspace de Databricks a Metaustral usando un token de acceso personal y descubre tablas, esquemas y metadatos del Unity Catalog.

Requisitos previos

  • Un workspace de Databricks (AWS, Azure o GCP) con Unity Catalog o Hive Metastore habilitado.
  • Un Personal Access Token — genéralo en Databricks en User Settings → Developer → Access Tokens.
  • Un HTTP Path de un SQL Warehouse en ejecución — encuéntralo en SQL Warehouses → Connection details.
  • Plan Starter, Pro o Enterprise.

Cómo conectar

Abre DB Connections y haz clic en + New connection

Selecciona Databricks como tipo

Completa los detalles de conexión

Ingresa el Host de tu workspace (ej. adb-1234567890.azuredatabricks.net), Port (por defecto 443), Catalog, HTTP Path y tu Personal Access Token.

Guarda y ejecuta el descubrimiento

Databricks connection form
Formulario de conexión Databricks — host, puerto 443, catalog, HTTP path y personal access token.

Campos de conexión

Campo Dónde encontrarlo
HostHostLa URL de tu workspace Databricks sin https://.
PortPuertoSiempre 443 para HTTPS.
CatalogCatalogNombre del Unity Catalog (ej. main) o hive_metastore.
HTTP PathHTTP PathEn SQL Warehouses → tu warehouse → Connection details. Formato: /sql/1.0/warehouses/abc123.
Access TokenAccess TokenUser Settings → Developer → Access Tokens → Generate new token.
Consejo: Los tokens expiran — establece una expiración larga o automatiza la rotación. Guarda el token de forma segura; Metaustral lo cifra en reposo con Fernet, pero es visible durante el paso de configuración.

Bases de datos on-premise Enterprise

Conecta bases de datos SQL Server, MySQL o PostgreSQL que corren dentro de redes corporativas privadas — sin abrir puertos de firewall entrantes.

¿Por qué no puedo conectar directamente?

Las bases de datos en la nube (RDS, Azure SQL, Cloud SQL) son accesibles por IP desde Metaustral. Pero las bases de datos en redes corporativas privadas suelen estar bloqueadas por firewalls y no tienen IP pública. El Agente on-premise resuelve esto: un script Python liviano corre dentro de tu red, se conecta a la base de datos localmente y envía los metadatos a Metaustral por HTTPS saliente — la única dirección que los firewalls suelen permitir por defecto.

Arquitectura

graph LR subgraph private[" Private / Corporate Network"] DB[(On-Premise DB\nSQL Server / MySQL / PG)] AGENT[On-Premise Agent\nPython script] DB -->|INFORMATION_SCHEMA| AGENT end subgraph cloud[" Cloud — Metaustral"] API[Metaustral API] CAT[(Catalog)] API --> CAT end AGENT -->|HTTPS outbound — port 443| API style private fill:#0f1e1a,stroke:#10b981,color:#f1f5f9 style cloud fill:#182830,stroke:#3D6478,color:#f1f5f9 style AGENT fill:#065f46,stroke:#10b981,color:#f1f5f9 style DB fill:#1e293b,stroke:#3D6478,color:#f1f5f9 style API fill:#1E3038,stroke:#9CC4D1,color:#f1f5f9 style CAT fill:#1e293b,stroke:#3D6478,color:#f1f5f9

El agente corre dentro de la red privada → solo HTTPS saliente → no se necesitan reglas de firewall entrantes.

Bases de datos soportadas (on-premise)

SQL Server MySQL PostgreSQL

Aspectos de seguridad

  • Solo tráfico saliente: el agente realiza solicitudes HTTPS a api.metaustral.com. No se necesitan abrir puertos entrantes.
  • Solo metadatos: el agente lee definiciones de esquema desde INFORMATION_SCHEMA únicamente — nunca lee datos reales de filas.
  • Credenciales permanecen on-premise: las credenciales de la base de datos se almacenan en un archivo .env local y nunca se envían a la nube.
  • Transporte cifrado: toda la comunicación entre el agente y Metaustral usa TLS 1.2+.
Requiere plan Enterprise El Agente on-premise está disponible exclusivamente en el plan Enterprise. Ver precios o contacta a ventas para hacer upgrade.

Para instrucciones completas de configuración, consulta la documentación del Agente on-premise →

FAQ

Preguntas comunes sobre Metaustral.

Un catálogo de datos es un inventario organizado de todos los activos de información de tu empresa: tablas, vistas, dashboards, KPIs, reportes y datasets. Permite que cualquier persona del equipo entienda qué datos existen, qué significan, quién los posee y cómo están relacionados entre sí.
Configura las credenciales de tu base de datos desde el panel de administración. El sistema se conecta de forma segura, lee los esquemas disponibles y te muestra las tablas y vistas que puedes importar al catálogo con un solo clic, incluyendo sus columnas y tipos de datos. Motores soportados: SQL Server, MySQL, PostgreSQL, Snowflake, BigQuery y Databricks.
Plan Free: 1 admin. Starter: hasta 3 usuarios. Pro: hasta 30 usuarios. Enterprise: ilimitados. Cada usuario tiene un rol: Admin (gestiona todo), Editor (crea y edita activos) o Viewer (solo consulta).
Sí. Cada empresa tiene su propio espacio aislado. Las contraseñas de conexiones se cifran con Fernet antes de guardarse. El catálogo almacena únicamente metadatos — nunca el contenido real de tus bases de datos.
SQL Server, MySQL, PostgreSQL, Snowflake, BigQuery y Databricks para descubrimiento automático. Cualquier tipo de activo (dashboards, KPIs, reportes, datasets) puede documentarse manualmente sin importar el motor que uses.
Sí, con el agente on-premise disponible exclusivamente en el plan Enterprise. Es un script Python liviano instalado en tu red interna. Se conecta a tu base de datos local, descubre los metadatos y los envía de forma segura a la nube. Tu base de datos nunca queda expuesta a internet.
Sí. Puedes hacer upgrade o downgrade cuando quieras. Si bajas de plan y tienes más activos de los permitidos, los existentes se conservan pero no podrás crear nuevos hasta estar dentro del límite.
Sí. La plataforma está completamente disponible en español e inglés. El soporte también se ofrece en ambos idiomas.