diciembre 11, 2024

AWS fortalece Amazon Bedrock con protección de IA pionera en la industria

AWS fortalece Amazon Bedrock con protección de IA pionera en la industria, capacidad de orquestación de agentes y opción de personalización avanzada

Las comprobaciones de Automated Reasoning, la colaboración entre múltiples agentes y Model Distillation se desarrollan en la sólida base de capacidades de nivel empresarial disponibles en Amazon Bedrock para ayudar a los clientes a pasar de la prueba de concepto a la IA generativa lista para producción más rápidamente

En AWS re:Invent, Amazon Web Services, Inc. (AWS), una empresa de Amazon.com, Inc. (NASDAQ: AMZN), anunció nuevas capacidades para Amazon Bedrock, un servicio totalmente administrado para crear y escalar aplicaciones de inteligencia artificial (IA) generativa con modelos fundacionales de alto rendimiento. Los anuncios de ayudan a los clientes a prevenir errores factuales debido a alucinaciones, organizar múltiples agentes impulsados ​​por IA para tareas complejas y crear modelos más pequeños y específicos para tareas que pueden funcionar de manera similar a un modelo de gran tamaño a una fracción del costo y de la latencia.

  • Las comprobaciones de Automated Reasoning son la primera y única protección de IA generativa que ayuda a prevenir errores fácticos debido a alucinaciones de modelos, lo que abre nuevos casos de uso de IA generativa que exigen los más altos niveles de precisión.
  • Los clientes pueden utilizar la colaboración entre múltiples agentes para crear y organizar fácilmente múltiples agentes de IA para resolver problemas juntos, ampliando las formas en que los clientes pueden aplicar la IA generativa para abordar sus casos de uso más complejos.
  • Model Distillation permite a los clientes transferir conocimiento específico de un modelo grande y altamente capaz a uno más pequeño y eficiente que puede ser hasta un 500% más rápido y un 75% menos costoso de ejecutar.
  • Decenas de miles de clientes utilizan actualmente Amazon Bedrock, y Moody’s, PwC y Robin AI se encuentran entre los que aprovechan estas nuevas capacidades para escalar de manera rentable la inferencia y superar los límites de la innovación de la IA generativa.

“Con una amplia selección de modelos, capacidades líderes que facilitan a los desarrolladores la incorporación de IA generativa en sus aplicaciones y un compromiso con la seguridad y la privacidad, Amazon Bedrock se ha vuelto esencial para los clientes que desean que la IA generativa sea una parte fundamental de sus aplicaciones y negocios”, afirmó el Dr. Swami Sivasubramanian, vicepresidente de IA y Datos de AWS. “Es por eso que hemos visto que Amazon Bedrock ha multiplicado por 4,7 su base de clientes solo en el último año. Con el tiempo, a medida que la IA generativa transforme más empresas y experiencias de clientes, la inferencia se convertirá en una parte fundamental de cada aplicación. Con el lanzamiento de estas nuevas capacidades, estamos innovando en nombre de los clientes para resolver algunos de los principales desafíos, como las alucinaciones y el costo, que enfrenta toda la industria al trasladar las aplicaciones de IA generativa a la producción”.

Las comprobaciones de Automated Reasoning previenen errores factuales debido a alucinaciones

Si bien los modelos continúan avanzando, incluso los más capaces pueden alucinar y proporcionar respuestas incorrectas o engañosas. Las alucinaciones siguen siendo un desafío fundamental en toda la industria, lo que limita la confianza que las empresas pueden depositar en la IA generativa. Esto es especialmente cierto para las industrias reguladas, como la atención médica, los servicios financieros y las agencias gubernamentales, donde la precisión es fundamental y las organizaciones necesitan realizar auditorías para asegurarse de que los modelos respondan adecuadamente. Las comprobaciones de Automated Reasoning son la primera y única protección de IA generativa que ayuda a prevenir errores factuales debido a alucinaciones utilizando un razonamiento lógicamente preciso y verificable. Al aumentar la confianza que los clientes pueden depositar en las respuestas del modelo, las comprobaciones de Automated Reasoning abren la IA generativa a nuevos casos de uso donde la precisión es primordial.

El razonamiento automático es una rama de la IA que utiliza las matemáticas para demostrar que algo es correcto. Se destaca cuando se trata de problemas en los que los usuarios necesitan respuestas precisas a un tema amplio y complejo, y que tiene un conjunto de reglas bien definido o una recopilación de conocimientos sobre el tema. AWS cuenta con un equipo de expertos en razonamiento automático de clase mundial que han utilizado esta tecnología durante la última década para mejorar las experiencias en AWS. Entre los ejemplos están la demostración de que los permisos y los controles de acceso se implementan correctamente para mejorar la seguridad o la verificación de millones de escenarios en Amazon Simple Storage Service (S3) antes de la implementación, a fines de garantizar que la disponibilidad y la durabilidad permanezcan protegidas.

Amazon Bedrock Guardrails facilita a los clientes la aplicación de controles de seguridad e IA responsable a las aplicaciones de IA generativa, lo que permite que los clientes guíen a los modelos para que solo hablen sobre temas relevantes. Accesible a través de Amazon Bedrock Guardrails, las comprobaciones de Automated Reasoning ahora permiten a Amazon Bedrock validar respuestas fácticas para comprobar su precisión, producir resultados auditables y mostrar a los clientes exactamente por qué un modelo llegó a un resultado. Esto aumenta la transparencia y garantiza que las respuestas del modelo estén en línea con las reglas y políticas de un cliente. Por ejemplo, un proveedor de seguros de salud que necesita asegurarse de que su aplicación de servicio al cliente, impulsada por inteligencia artificial generativa, responda correctamente a las preguntas de los clientes sobre las políticas, podría beneficiarse de los controles de Automated Reasoning. Para aplicarlos, el proveedor carga la información de su póliza y Amazon Bedrock desarrolla automáticamente las reglas necesarias, guiando a los clientes para que las prueben de manera iterativa a fines de asegurarse de que el modelo esté ajustado a la respuesta correcta, sin necesidad de conocimientos de razonamiento automatizado. Luego, el proveedor de seguros aplica el control y, a medida que el modelo genera respuestas, Amazon Bedrock las verifica. Si una respuesta es incorrecta, como por ejemplo si se calcula mal el deducible o se marca un procedimiento que no está cubierto, Amazon Bedrock sugiere la respuesta correcta utilizando la información de la comprobación de Automated Reasoning.

PwC, una firma global de servicios profesionales, está utilizando las comprobaciones de Automated Reasoning para crear asistentes y agentes de IA que sean sumamente precisos, confiables y útiles para llevar los negocios de sus clientes a la vanguardia. PwC incorpora verificaciones de Automated Reasoning en soluciones específicas de la industria para clientes en servicios financieros, atención médica y ciencias biológicas, incluidas aplicaciones que verifican el contenido de cumplimiento generado por IA con la Administración de Alimentos y Medicamentos (FDA, su sigla en inglés) de Estados Unidos y otras normas regulatorias. Internamente, PwC emplea verificaciones de Automated Reasoning para garantizar que las respuestas generadas por los asistentes y agentes de IA generativa sean precisas y cumplan con las políticas internas.

Cree y coordine fácilmente varios agentes para ejecutar flujos de trabajo complejos

A medida que las empresas hacen de la IA generativa una parte central de sus aplicaciones, quieren hacer más que simplemente resumir contenido y potenciar las experiencias de chat también quieren que sus aplicaciones realicen acciones. Los agentes impulsados ​​por IA pueden ayudar a las aplicaciones de los clientes a realizar estas acciones mediante el uso de las capacidades de razonamiento de un modelo para desglosar una tarea, como ayudar con la devolución de un pedido o analizar los datos de retención de clientes, todo en una serie de pasos que el modelo puede ejecutar. Amazon Bedrock Agents facilita a los clientes la creación de estos agentes para que funcionen en todos los sistemas y fuentes de datos de una empresa. Si bien un solo agente puede ser útil, las tareas más complejas, como realizar análisis financieros en cientos o miles de variables diferentes, pueden requerir una gran cantidad de agentes con sus propias especializaciones. Sin embargo, la creación de un sistema que pueda coordinar varios agentes, compartir el contexto entre ellos y enrutar dinámicamente diferentes tareas al agente adecuado requiere herramientas especializadas y experiencia en IA generativa que muchas empresas no tienen disponibles. Es por eso que AWS está expandiendo Amazon Bedrock Agents para admitir la colaboración entre múltiples agentes, lo que permite a los clientes desarrollar y coordinar fácilmente agentes especializados para ejecutar flujos de trabajo complejos.

Al utilizar la colaboración entre múltiples agentes en Amazon Bedrock, los clientes pueden obtener resultados más precisos al crear y asignar agentes especializados para pasos específicos de un proyecto y acelerar las tareas al organizar el trabajo en paralelo de varios agentes. Por ejemplo, una institución financiera podría utilizar Amazon Bedrock Agents para ayudar a realizar la debida diligencia sobre una empresa antes de invertir. En primer lugar, el cliente utiliza Amazon Bedrock Agents para crear una serie de agentes especializados centrados en tareas específicas, como analizar factores económicos globales, evaluar las tendencias de la industria y revisar los datos financieros históricos de la empresa. Una vez que han creado todos sus agentes especializados, crean un agente supervisor para gestionar el proyecto. El supervisor se encarga de la coordinación, como dividir y enrutar las tareas a los agentes adecuados, otorgando a los agentes específicos acceso a la información que necesitan para completar su trabajo, y determinando qué acciones se pueden procesar en paralelo y cuáles necesitan detalles de otras tareas antes de que el agente pueda seguir adelante. Una vez que todos los agentes especializados completan sus aportes, el agente supervisor reúne la información, sintetiza los resultados y desarrolla un perfil de riesgo general.

Moody’s, líder mundial en calificaciones crediticias y análisis financiero, ha elegido la colaboración entre múltiples agentes de Amazon Bedrock para mejorar sus flujos de trabajo de análisis de riesgos. Moody’s está aprovechando Amazon Bedrock para crear agentes a los que se les asigna una tarea específica y se les da acceso a conjuntos de datos personalizados para realizar su función. Por ejemplo, un agente puede analizar las tendencias macroeconómicas, mientras que otro evalúa los riesgos específicos de la empresa utilizando datos financieros propietarios y un tercero evalúa el posicionamiento competitivo. Estos agentes colaboran de forma continua, sintetizando sus resultados en información precisa y procesable. Este enfoque innovador permite a Moody’s ofrecer evaluaciones de riesgos más rápidas y precisas, lo que consolida su reputación como autoridad confiable en la toma de decisiones financieras.

             Cree modelos más pequeños, rápidos y rentables con Model Distillation

En la actualidad, los clientes experimentan con una amplia variedad de modelos para encontrar el que mejor se adapta a las necesidades únicas de su negocio. Sin embargo, incluso con todos los modelos disponibles en la actualidad, es un desafío encontrar uno con la combinación adecuada de conocimiento específico, costo y latencia. Los modelos más grandes tienen más conocimiento, pero tardan más en responder y cuestan más, mientras que los modelos pequeños son más rápidos y económicos de ejecutar, pero no son tan capaces. La destilación de modelos es una técnica que transfiere el conocimiento de un modelo de gran tamaño a un modelo pequeño, al mismo tiempo que conserva las características de rendimiento del modelo pequeño. Sin embargo, para hacer esto se requiere experiencia especializada en aprendizaje automático (ML, su sigla en inglés) para trabajar con datos de entrenamiento, ajustar manualmente el modelo y ajustar sus pesos sin comprometer las características de rendimiento que llevaron al cliente a elegir el modelo más pequeño en primer lugar. Con Amazon Bedrock Model Distillation, cualquier cliente puede ahora destilar su propio modelo, que puede ser hasta un 500% más rápido y un 75% menos costoso de ejecutar que los modelos originales, con una pérdida de precisión de menos del 2% para casos de uso como la generación aumentada de recuperación (RAG, su sigla en inglés). Ahora, los clientes pueden optimizar para lograr la mejor combinación de capacidades, precisión, latencia y costo para su caso de uso, sin necesidad de conocimientos de ML.

Con Amazon Bedrock Model Distillation, los clientes simplemente seleccionan el mejor modelo para un caso de uso determinado y un modelo más pequeño de la misma familia que ofrece la latencia que requiere su aplicación al costo adecuado. Después de que el cliente proporciona prompts de muestra, Amazon Bedrock hará todo el trabajo para generar respuestas y ajustar el modelo más pequeño, e incluso puede crear más datos de muestra, si es necesario, para completar el proceso de destilación. Esto les brinda a los clientes un modelo con el conocimiento y la precisión relevantes del modelo de gran tamaño, pero con la velocidad y el costo del modelo más pequeño, lo que lo hace ideal para casos de uso de producción, como interacciones de chat en tiempo real. Model Distillation funciona con modelos de Anthropic y Meta.

Robin AI, que ofrece un asistente con tecnología de IA que permite que los procesos legales complejos sean más rápidos, económicos y accesibles, utiliza Model Distillation para ayudar a potenciar las preguntas y respuestas legales de alta calidad en millones de cláusulas contractuales. Model Distillation permite que Robin AI obtenga la precisión que necesita a una fracción del costo, mientras que las respuestas más rápidas brindan una interacción más fluida entre sus clientes y el asistente.

Las comprobaciones de Automated Reasoning, la colaboración entre múltiples agentes y Model Distillation están disponibles en la vista previa.