MENU
Canal 26
Buscar Noticias
OSA Argentina
04.09.2025  por TOTALMEDIOS

Salesforce AI Research lanza simulador y nuevas métricas para evaluar agentes de IA empresariales

Salesforce AI Research anunció avances en inteligencia artificial orientados al ámbito empresarial, entre ellos un entorno de simulación (CRMArena-Pro) para poner a prueba agentes en escenarios complejos, un índice de referencia para medir su preparación en tareas de CRM y nuevas capacidades de consolidación de datos en Data Cloud. 

Salesforce AI Research presentó un entorno de simulación empresarial para poner a prueba la capacidad de los agentes en escenarios empresariales realistas, respaldando el lanzamiento de una nueva herramienta de evaluación comparativa entre estos. Además, ha mejorado Data Cloud con capacidades de consolidación avanzadas que aprovechan modelos de lenguaje pequeños y grandes, unificando datos de forma autónoma. Estas innovaciones están impulsando avances en IA que abordan los retos más urgentes a los que se enfrentan hoy en día los directores de informática y los responsables de TI.

Desde la mejora de la calidad de los datos hasta el establecimiento de nuevos estándares en la medición del rendimiento de los agentes, Salesforce AI Research está proporcionando a las empresas la confianza y las herramientas necesarias para evolucionar hacia empresas con agentes, es decir, organizaciones que adoptan el trabajo digital y utilizan la IA para trabajar junto a los seres humanos.
Kantar IBOPE Media
Simulación de entornos empresariales con CRMArena-Pro

Los pilotos no aprenden a volar en medio de una tormenta; se entrenan en simuladores de vuelo que los obligan a prepararse para los retos más extremos. En todos los campos de alto riesgo, las habilidades y la consistencia se perfeccionan no a través de la acción en vivo, sino a través de una preparación deliberada, en un espacio donde el fracaso es una herramienta de aprendizaje y no un error costoso.

Los agentes de IA también se benefician de las pruebas y la formación mediante simulación, que los prepara para gestionar la imprevisibilidad de los escenarios empresariales cotidianos antes de implementarlos. Salesforce AI Research ha lanzado CRMArena-Pro, para probar el rendimiento de los agentes en escenarios complejos, de múltiples turnos y agentes, como la previsión de ventas, la clasificación de casos de servicio y los procesos CPQ. CRMArena-Pro crea un marco de entorno empresarial simulado riguroso y rico en contexto, con datos sintéticos en los que se pueden evaluar de forma segura las llamadas API a los sistemas pertinentes, así como la capacidad de proteger los datos de identificación personal.

Actuando como un gemelo digital de una empresa, estos entornos van más allá de los simples bancos de pruebas, ya que capturan toda la complejidad de las operaciones empresariales. Salesforce AI Research está avanzando en la formación de agentes de IA con estas simulaciones, lo que permite a las empresas probar a los agentes en escenarios como escaladas de servicio al cliente o interrupciones de la cadena de suministro antes de que estos entren en funcionamiento. Al incorporar el «ruido» del mundo real en el entorno de prueba, las empresas pueden evaluar mejor el rendimiento, reforzar la resiliencia frente a casos extremos y salvar la brecha entre la formación y las operaciones en vivo. El resultado son agentes de IA capaces, coherentes, fiables y preparados para la empresa.

Medición de la preparación de los agentes con el índice de referencia agéntica para CRM

Con la aparición diaria de nuevos modelos y actualizaciones de IA, las empresas se enfrentan al creciente dilema de qué modelo —o combinación de modelos— es el más adecuado para ayudar a los agentes en entornos empresariales reales. La respuesta no puede provenir únicamente de los ciclos de expectación o del tamaño bruto; requiere una forma rigurosa de medir el rendimiento de los agentes dentro de flujos de trabajo empresariales específicos.

Esta necesidad llevó a Salesforce a presentar el nuevo Agentic Benchmark for CRM, la primera herramienta de evaluación comparativa, diseñada para evaluar a los agentes de IA no en función de sus capacidades genéricas, sino en los contextos que más importan a las empresas, como el servicio de atención al cliente, el de campo, marketing y ventas. La evaluación comparativa mide a los agentes en función de cinco métricas empresariales esenciales —precisión, coste, velocidad, confianza, seguridad, y sostenibilidad— que, en conjunto, conforman una evaluación exhaustiva y basada en datos de su preparación para su implementación en el mundo real.

La sostenibilidad, la métrica más reciente de la herramienta de medición agéntica, es especialmente importante de seguir. Esta medida destaca el impacto medioambiental relativo de los sistemas de IA, que pueden requerir importantes recursos computacionales. Las empresas pueden minimizar su huella medioambiental y determinar la sostenibilidad de su IA, al tiempo que logra el rendimiento que necesita, alineando el tamaño del modelo con el nivel específico de inteligencia necesario para completar una tarea específica de la empresa. Con nuevos modelos que surgen casi cada semana, las empresas se ven abrumadas por cuál implementar y utilizar para impulsar sus agentes de IA. Este punto de referencia les ayuda a emparejar los modelos adecuados con los agentes adecuados para obtener un rendimiento fiable y de nivel empresarial.

MCP-Eval y MCP-Universe son dos benchmarks adicionales y complementarios publicados por Salesforce AI Research este trimestre. Están diseñados para evaluar a los agentes con diferentes niveles de rigor y realizar un seguimiento de los LLM mientras interactúan con los servidores MCP en entornos de uso reales.

MCP-Eval proporciona una evaluación escalable y automática a través de tareas sintéticas, lo que lo hace muy adecuado para realizar pruebas en una amplia gama de servidores MCP.
MCP-Universe presenta tareas desafiantes del mundo real con evaluadores basados en la ejecución, que someten a pruebas de estrés a los agentes en escenarios complejos, ofreciendo un marco ampliable para crear y evaluar a los mismos.

Juntos, forman un potente conjunto de herramientas: MCP-Eval para evaluaciones iniciales amplias y MCP-Universe para diagnósticos y depuración más profundos. Este enfoque dual es fundamental para las empresas para comprender dónde fallan los agentes y perfeccionar sus marcos o integraciones de herramientas en consecuencia. Y con una plataforma que integra contexto, razonamiento mejorado y barreras de confianza, las organizaciones pueden ir más allá de la experimentación por cuenta propia para ofrecer agentes preparados para tener un impacto empresarial en el mundo real.

Consolidación de datos en la conciliación de cuentas

Los datos unificados y de alta calidad son fundamentales para el rendimiento fiable y escalable de los agentes de IA. Permiten una toma de decisiones contextualizada, precisa y conforme a las normas y los objetivos de la organización. Sin embargo, estos datos rara vez están limpios o bien organizados, lo que supone un reto constante. Los registros de clientes suelen estar duplicados en los distintos departamentos, los campos están incompletos y las convenciones de formato y nomenclatura inconsistentes dificultan la conciliación de datos entre sistemas.

Para abordar este problema, los equipos de investigación y de productos de Salesforce AI se asociaron para perfeccionar modelos de lenguaje grandes y pequeños e impulsar Account Matching, una función que identifica y unifica de forma autónoma cuentas en conjuntos de datos dispersos e inconsistentes. En lugar de tratar "The Example Company, Inc." y "Example Co." como entidades separadas, el sistema ahora puede utilizar la IA para consolidarlas en un único registro oficial. A diferencia de los sistemas estáticos basados en reglas que requieren una configuración manual laboriosa, Account Matching concilia con precisión millones de registros.

Este es el tipo de avances que generan un retorno de la inversión real para los clientes hoy en día. Solo en el primer mes, la herramienta patentada de un cliente que utiliza Account Matching unificó más de un millón de cuentas con una tasa de coincidencia del 95%, lo que redujo el tiempo medio de gestión en 30 minutos. La herramienta cotejó automáticamente datos como nombres de cuentas, sitios web, direcciones o números de teléfono de todas las unidades de negocio, creó un flujo de trabajo en cada organización para que los vendedores se pusieran en contacto y solo remitió a personas el 5% de los casos más complejos. Al ayudar a los vendedores a encontrar rápidamente contrapartes que cubrían cuentas iguales o similares, la solución contribuyó a eliminar el trabajo duplicado, acelerar los ciclos de ventas y evitar la pérdida de oportunidades. Lo mejor de todo es que toda la solución se implementó sin necesidad de codificación, lo que redujo los costes y mejoró drásticamente la eficiencia.

Para conocer más: SalesforceAIResearch.com.


En esta nota:

Otras noticias del día

Medios

Zootopia 2 se convierte en la película animada más taquillera de la historia a nivel global

La producción alcanzó una recaudación acumulada de 1.703 millones de dólares y se posicionó como la novena película más exitosa de la historia. En América Latina, se consolidó como el estreno más taquillero del estudio, con más de 114,6 millones de dólares recaudados y 27 millones de espectadores. La película continúa en cartelera en los cines de la región. Ver más

Medios

La secuela de “Pedro el Escamoso” llega muy pronto a Telefe

La nueva historia retoma al icónico personaje tras más de veinte años, en un intento por recomponer el vínculo con su hijo y adaptarse a un mundo muy distinto al que dejó atrás. La producción combina humor y emoción, recuperando el espíritu de la ficción original. Todos los episodios ya se encuentran disponibles en Disney+. Ver más

Research

En Chile, la inversión publicitaria creció 4,8% interanual en noviembre 2025

La AAM de Chile publicó su reporte de inversión en medios correspondiente a noviembre de 2025, elaborado a partir de datos de sus Agencias de Medios Asociadas. El informe refleja una inversión total de $98.107 millones, con un crecimiento interanual del 4,8%. En el acumulado de enero a noviembre, la inversión alcanzó los $907.217 millones, un 3,9% más que en el mismo período de 2024. Ver más

multimedia / campañas publicitarias

Para lo que viene sos imprescindible. Preparate

Agencia: Selva by aleph Marca: Social learning Soporte: Youtube, instagram, tiktok, facebook y linkedin

Social Learning lanzó una campaña 100% digital desarrollada por Selva by Aleph, con foco en destacar el rol de las personas en un mercado laboral en transformación. Bajo el claim “Para lo que viene sos imprescindible. Preparate”, la iniciativa busca reforzar la importancia de la formación como puente hacia nuevas oportunidades.

El mejor verano del mundo - Reencuentro

Agencia:Digitas

Marca:Fernet branca

Soporte:

Te la mereSED

Agencia: draftline ar

Marca:Brahma

Soporte:

Hacer el bien, hace bien

Agencia:Humo rojo

Marca:Fundación multipolar

Soporte:

"Mateo, un buen tipo"

Agencia:Fri

Marca:Gobierno de chile

Soporte:Tv y web

Ver todos