Salesforce AI Research anunció avances en inteligencia artificial orientados al ámbito empresarial, entre ellos un entorno de simulación (CRMArena-Pro) para poner a prueba agentes en escenarios complejos, un índice de referencia para medir su preparación en tareas de CRM y nuevas capacidades de consolidación de datos en Data Cloud.
Salesforce AI Research presentó un entorno de simulación empresarial para poner a prueba la capacidad de los agentes en escenarios empresariales realistas, respaldando el lanzamiento de una nueva herramienta de evaluación comparativa entre estos. Además, ha mejorado
Data Cloud con capacidades de consolidación avanzadas que aprovechan modelos de lenguaje pequeños y grandes, unificando datos de forma autónoma. Estas innovaciones están impulsando avances en IA que abordan los retos más urgentes a los que se enfrentan hoy en día los directores de informática y los responsables de TI.
Desde la mejora de la calidad de los datos hasta el establecimiento de nuevos estándares en la medición del rendimiento de los agentes,
Salesforce AI Research está proporcionando a las empresas la confianza y las herramientas necesarias para evolucionar hacia empresas con agentes, es decir, organizaciones que adoptan el trabajo digital y utilizan la IA para trabajar junto a los seres humanos.
Simulación de entornos empresariales con CRMArena-Pro
Los pilotos no aprenden a volar en medio de una tormenta; se entrenan en simuladores de vuelo que los obligan a prepararse para los retos más extremos. En todos los campos de alto riesgo, las habilidades y la consistencia se perfeccionan no a través de la acción en vivo, sino a través de una preparación deliberada, en un espacio donde el fracaso es una herramienta de aprendizaje y no un error costoso.
Los agentes de IA también se benefician de las pruebas y la formación mediante simulación, que los prepara para gestionar la imprevisibilidad de los escenarios empresariales cotidianos antes de implementarlos.
Salesforce AI Research ha lanzado
CRMArena-Pro, para probar el rendimiento de los agentes en escenarios complejos, de múltiples turnos y agentes, como la previsión de ventas, la clasificación de casos de servicio y los procesos CPQ.
CRMArena-Pro crea un marco de entorno empresarial simulado riguroso y rico en contexto, con datos sintéticos en los que se pueden evaluar de forma segura las llamadas API a los sistemas pertinentes, así como la capacidad de proteger los datos de identificación personal.
Actuando como un gemelo digital de una empresa, estos entornos van más allá de los simples bancos de pruebas, ya que capturan toda la complejidad de las operaciones empresariales. Salesforce AI Research está avanzando en la formación de agentes de IA con estas simulaciones, lo que permite a las empresas probar a los agentes en escenarios como escaladas de servicio al cliente o interrupciones de la cadena de suministro antes de que estos entren en funcionamiento. Al incorporar el «ruido» del mundo real en el entorno de prueba, las empresas pueden evaluar mejor el rendimiento, reforzar la resiliencia frente a casos extremos y salvar la brecha entre la formación y las operaciones en vivo. El resultado son agentes de IA capaces, coherentes, fiables y preparados para la empresa.
Medición de la preparación de los agentes con el índice de referencia agéntica para CRM
Con la aparición diaria de nuevos modelos y actualizaciones de IA, las empresas se enfrentan al creciente dilema de qué modelo —o combinación de modelos— es el más adecuado para ayudar a los agentes en entornos empresariales reales. La respuesta no puede provenir únicamente de los ciclos de expectación o del tamaño bruto; requiere una forma rigurosa de medir el rendimiento de los agentes dentro de flujos de trabajo empresariales específicos.
Esta necesidad llevó a Salesforce a presentar el nuevo Agentic Benchmark for CRM,
la primera herramienta de evaluación comparativa, diseñada para evaluar a los agentes de IA no en función de sus capacidades genéricas, sino en los contextos que más importan a las empresas, como el servicio de atención al cliente, el de campo, marketing y ventas. La evaluación comparativa mide a los agentes en función de cinco métricas empresariales esenciales —precisión, coste, velocidad, confianza, seguridad, y sostenibilidad— que, en conjunto, conforman una evaluación exhaustiva y basada en datos de su preparación para su implementación en el mundo real.
La sostenibilidad, la métrica más reciente de la herramienta de medición agéntica, es especialmente importante de seguir. Esta medida destaca el impacto medioambiental relativo de los sistemas de IA, que pueden requerir importantes recursos computacionales. Las empresas pueden minimizar su huella medioambiental y determinar la sostenibilidad de su IA, al tiempo que logra el rendimiento que necesita, alineando el tamaño del modelo con el nivel específico de inteligencia necesario para completar una tarea específica de la empresa. Con nuevos modelos que surgen casi cada semana, las empresas se ven abrumadas por cuál implementar y utilizar para impulsar sus agentes de IA. Este punto de referencia les ayuda a emparejar los modelos adecuados con los agentes adecuados para obtener un rendimiento fiable y de nivel empresarial.
MCP-Eval y
MCP-Universe son dos benchmarks adicionales y complementarios publicados por
Salesforce AI Research este trimestre. Están diseñados para evaluar a los agentes con diferentes niveles de rigor y realizar un seguimiento de los LLM mientras interactúan con los servidores MCP en entornos de uso reales.
MCP-Eval proporciona una evaluación escalable y automática a través de tareas sintéticas, lo que lo hace muy adecuado para realizar pruebas en una amplia gama de servidores MCP.
MCP-Universe presenta tareas desafiantes del mundo real con evaluadores basados en la ejecución, que someten a pruebas de estrés a los agentes en escenarios complejos, ofreciendo un marco ampliable para crear y evaluar a los mismos.
Juntos, forman un potente conjunto de herramientas:
MCP-Eval para evaluaciones iniciales amplias y
MCP-Universe para diagnósticos y depuración más profundos. Este enfoque dual es fundamental para las empresas para comprender dónde fallan los agentes y perfeccionar sus marcos o integraciones de herramientas en consecuencia. Y con una plataforma que integra contexto, razonamiento mejorado y barreras de confianza, las organizaciones pueden ir más allá de la experimentación por cuenta propia para ofrecer agentes preparados para tener un impacto empresarial en el mundo real.
Consolidación de datos en la conciliación de cuentas
Los datos unificados y de alta calidad son fundamentales para el rendimiento fiable y escalable de los agentes de IA. Permiten una toma de decisiones contextualizada, precisa y conforme a las normas y los objetivos de la organización. Sin embargo, estos datos rara vez están limpios o bien organizados, lo que supone un reto constante. Los registros de clientes suelen estar duplicados en los distintos departamentos, los campos están incompletos y las convenciones de formato y nomenclatura inconsistentes dificultan la conciliación de datos entre sistemas.
Para abordar este problema, los equipos de investigación y de productos de Salesforce AI se asociaron para perfeccionar modelos de lenguaje grandes y pequeños e impulsar Account Matching, una función que identifica y unifica de forma autónoma cuentas en conjuntos de datos dispersos e inconsistentes. En lugar de tratar "The Example Company, Inc." y "Example Co." como entidades separadas, el sistema ahora puede utilizar la IA para consolidarlas en un único registro oficial. A diferencia de los sistemas estáticos basados en reglas que requieren una configuración manual laboriosa, Account Matching concilia con precisión millones de registros.
Este es el tipo de avances que generan un retorno de la inversión real para los clientes hoy en día. Solo en el primer mes, la herramienta patentada de un cliente que utiliza Account Matching unificó más de un millón de cuentas con una tasa de coincidencia del 95%, lo que redujo el tiempo medio de gestión en 30 minutos. La herramienta cotejó automáticamente datos como nombres de cuentas, sitios web, direcciones o números de teléfono de todas las unidades de negocio, creó un flujo de trabajo en cada organización para que los vendedores se pusieran en contacto y solo remitió a personas el 5% de los casos más complejos. Al ayudar a los vendedores a encontrar rápidamente contrapartes que cubrían cuentas iguales o similares, la solución contribuyó a eliminar el trabajo duplicado, acelerar los ciclos de ventas y evitar la pérdida de oportunidades. Lo mejor de todo es que toda la solución se implementó sin necesidad de codificación, lo que redujo los costes y mejoró drásticamente la eficiencia.
Para conocer más:
SalesforceAIResearch.com.