Ctedra Camelia Ctedra Camelia Ctedra Camelia Ctedra Camelia canal Yotube
Difusión

Nuevo artículo de la Cátedra CAMELIA publicado en Information Fusion sobre la interoperabilidad de datos con MILA

Nuevo artículo de la Cátedra CAMELIA publicado en Information Fusion sobre la interoperabilidad de datos con MILA
María Taboada, investigadora de la Cátedra CAMELIA USC–Plexus de IA aplicada a la Medicina publica un nuevo artículo en acceso abierto en Information Fusion (Elsevier), en el que se presenta MILA, un enfoque innovador para el ontology matching orientado a mejorar la interoperabilidad de datos y el intercambio de conocimiento.

El OntologyMatching desempeña un papel clave en la integración de fuentes de información heterogéneas, un reto especialmente relevante en ámbitos como la salud, donde la interoperabilidad semántica resulta fundamental. Sin embargo, los enfoques basados en grandes modelos de lenguaje (LLM) suelen enfrentarse a elevados costes computacionales y a limitaciones de rendimiento.

Para superar estos desafíos, el equipo investigador conformado por María Taboada, Diego Martínez, Mohammed Arideh y Rosa Mosquera, ha desarrollado MILA, una metodología que combina un pipeline retrieve–identify–prompt con una estrategia de búsqueda en profundidad priorizada (prioritized depth-first search). Esta arquitectura permite descubrir correspondencias semánticas de forma eficiente, minimizando el número de solicitudes a modelos LLM y reduciendo significativamente el tiempo de ejecución.

El sistema fue evaluado en tres retos de la edición 2024 de la Ontology Alignment Evaluation Initiative, donde alcanzó la mejor puntuación F-Measure en cinco de las siete tareas no supervisadas, superando a sistemas de referencia hasta en un 17% y manteniendo una alta estabilidad en distintos escenarios y configuraciones.

Al integrar estrategias de búsqueda programadas, embeddings aprendidos y heurísticas basadas en prompting, MILA logra un alto rendimiento en alineamiento de ontologías sin necesidad de heurísticas específicas de dominio ni procesos de fine-tuning, consolidándose como una solución robusta y escalable para entornos complejos.

Acceso al artículo completo en este enlace