¿Qué opinas de los LLM?

Posted by

ChatGPT, Claude, Gemini, Copilot, Perplexity, Llama, Mistral.

A continuación, una descripción y características de los los LLM más conocidos.
¿Cuáles están entre mis preferencias?
Se acerca bastante a la secuencia del listado.

ChatGPT (última versión: GPT-4o/4o1) https://chat.openai.com/

Chat de búsqueda y generación de texto desarrollado por OpenAI. Los usuarios Plus y empresariales pueden crear sus propias versiones personalizadas (Custom GPTs) basadas en sus propios datos. Por ejemplo, para un caso de redacción de una entrada de blog sobre las últimas tendencias tecnológicas, ChatGPT 4O proporcionó un esquema bien estructurado y generó contenidos atractivos con una edición mínima. Una buena herramienta para escritores, con capacidad para entender el contexto y ofrecer respuestas coherentes.

Características
– ChatGPT permite introducir prompts con dictados de voz.
– Permite subir archivos para analizar, resumir, crear gráficos y tablas.
– GPT store: ChatGPT permite crear y almacenar tus propios GPTs.
– Context Length (3.5)= 4k, (4.x)=32k, 128k token
– Internet Access: versión 3.5: No; versión 4x: Si
Ventajas:
– Conversaciones informales
– Ayuda para redactar, resumir y escribir textos
– Generar ideas
Precios: Gratuito: 0 $/mes; Plus: 20 $/mes; Team: 25 $ por usuario / mes

Claude (última versión: Claude 3 Opus) https://claude.ai/

Desarrollado por Anthropic AI, un chatbot de IA y un gran modelo lingüístico (LLM) subyacente. Claude está entrenado para mantener conversaciones naturales basadas en texto y destaca en tareas de resumen, edición, preguntas y respuestas, toma de decisiones, escritura de código, etc. Util para trabajos de investigación en los que proporcione datos precisos, comentarios sobre diversos aspectos de la cuestión. Ùtil para tareas complejas que requieren un análisis detallado y pensamiento crítico. Recurro a Claude cuando necesito una segunda opinión de ChatGPT.

Características
– Mensajes destacados: permite marcar con una estrella los chats destacados.
– Función que muestra el contenido generado en un área de pantalla separada, que facilita la gestión de conversaciones largas.
– Permite subir archivos que pueden ser analizados.
– La función «Proyectos» mantiene un contexto persistente a lo largo de varias conversaciones.
– Context Length (free)= 13k, (pro)=200k token
– Internet Access: No
Ventajas:
– Investigación académica
– Respuesta a preguntas complejas
– Análisis en profundidad
Precio: Claude ofrece un plan gratuito limitado de mensajes por día.
Pro: 20 USD/mes. Acceso a Claude 3 Haiku y Claude 3 Opus, creación de proyectos, acceso prioritario.
Equipo: 25 USD/mes/por miembro, cinco miembros mínimo. Todo en Pro, compartir y chatear con compañeros de equipo, facturación y administración central.

Gemini (última versión: 1.5) https://gemini.gooqle.com/

Proporciona respuestas informativas y completas mediante búsquedas en Internet, ofrece pruebas para apoyar sus afirmaciones y puede crear imágenes a partir de prompts de texto. Gemini tiene la ventana contextual más larga de todos los LLM (Context Length = 1 Mtoken), útil en grandes proyectos. la última versión, Gemini 1.5 Pro, destaca por sus capacidades multimodales, lo que le permite procesar y generar contenidos tanto textuales como visuales. Esto lo hace ideal para crear materiales ricos e interactivos.

Características
– Se integra con la búsqueda de Google, p.ej. si dudas de cualquier información que Gemini le proporcione.
– Gemini tiene sus propias extensiones: Google Maps, Youtube, Vuelos y Hoteles.
– Capacidades multimodales: genera respuestas en imágenes como en texto.
– Context Length = 1 Mtoken
– Internet Access: Si
Ventajas:
– Aplicaciones personalizadas
– Tareas específicas de dominio
– La ventana contextual más larga de todos los LLM (Context Length = 1 Mtoken)
Precios: Opción gratuita (Forever gratis)
Gemini advanced: 1 mes de prueba gratis y 23 $/mes a partir de entonces

    Copilot (última versión: CoPilot+ PCs) https://copilot.microsoft.com/

    Chat de búsqueda y generación de texto integrado con el buscador Bing de Microsoft, Copilot es un sofisticado asistente de IA diseñado para agilizar los procesos de trabajo. Con una interfaz limpia e intuitiva, Copilot ofrece resultados directos y eficientes. CoPilot utiliza OpenAPIs GPT-4o como una de sus tecnologías.
    Funcionalmente, Copilot es similar a otros asistentes de inteligencia artificial. Los usuarios introducen prompts, reciben contenido generado y pueden modificar o regenerar las respuestas según sea necesario. La herramienta también admite la carga de imágenes y la escritura por voz.
    Si necesito comprobar las fuentes de las respuestas dadas por la IA en una investigación, utilizo Microsoft Copilot. Así me aseguro de que utilizo las citas adecuadas y evitar el plagio.
    Copilot te dará las referencias de los datos, permitiéndote leerlos más a fondo, utilizarlos en tu investigación y hacer las citas apropiadas cuando sea necesario.

    Características
    – Integración con Microsoft 365: Copilot se integra con las herramientas de productividad, como Word, Excel, PowerPoint, Outlook y Teams.
    – CoPilot Notebook: Cuaderno de CoPilot en la que puedes escribir prompts detallados y colaborar con él.
    – Lectura en voz alta y exportación a Word, PDF o Texto.
    – Analizar imágenes: CoPilot ofrece un resumen del contenido en la imagen, o cualquier dato basado en los prompts que hayas introducido.
    – Context Length = 128 Ktoken
    – Internet Access: Si
    Ventajas:
    – Desarrollo de software
    – Ayuda a la programación
    – Aumento de la productividad de los programadores
    Precios: Gratuito para siempre
    CoPilot Pro: 20 $/usuario/mes
    CoPilot para Microsoft 365: 30 $/usuario/mes, facturado anualmente

      Perplexity (última versión: Sonar small chat, Sonar medium chat) https://www.perplexity.ai/

      Herramienta de búsqueda y generación de texto con inclusión de referencias utilizadas.
      Perplexity indexa la web cada día. Así, las respuestas son de mejor calidad. Ofrece sugerencias de búsquedas relacionadas y la posibilidad de buscar vídeos e imágenes relacionados.
      Create Collections: para organizar y agrupar temas bajo un título que luego puedes compartir con otros.
      Threads: Hilos: Los hilos no son más que una serie de tus chats recientes. Estos hilos se pueden añadir a cualquier colección.

      Características
      – Focus: modo de enfoque, para mantener tus búsquedas centradas en un área específica. P.ej. escritura, académicas, vídeos, sociales, matemáticas.
      – Listado de fuentes por defecto.
      – Context Length = (free)=4K, (Pro)= 32 Ktoken
      – Internet Access: Si
      Ventajas:
      – Aplicaciones en tiempo real
      – Robots de atención al cliente
      – Análisis de datos
      Precios: Gratuito para siempre
      Profesional: 20 $ mensuales

      Llama (última versión: 3.1) https://www.llama.com/

      Desarrollado por Meta AI. Modelo de código abiewrto. El modelo Llama 3.1 es el primer LLM de código abierto capaz de rivalizar con los mejores modelos de código cerrado. Llama 3.1 ofrece una ventana de contexto mucho mayor, de 128K (Context Length), una mejora significativa respecto a los modelos Llama anteriores, que sólo tenían 8K.

      Característivas
      – Context Length = 128 Ktoken
      – Internet Access: No
      Ventajas:
      – destaca en pruebas comparativas, matemáticas y clasificación.
      Precios: Gratuito

      Mistral Le Chat) (última versión: Mistral NeMo 12B) https://mistral.ai/

      Mistral AI es una innovadora tecnología de inteligencia artificial desarrollada por Meta AI (Francia), de ex empleados de Meta y Google DeepMind, Mistral (Le Chat). Un tipo de gran modelo lingüístico que permite capacidades avanzadas de procesamiento del lenguaje natural. Potente herramienta para diversas aplicaciones, como la traducción de idiomas, el resumen de textos y la generación de contenidos. Funcionalmente, es como las demás herramientas. La interfaz de usuario, no es la mejor, ni la calidad de las respuestas.
      El primer modelo multimodal de Mistral, Pixtral 12B, puede procesar imágenes y texto, como fuee anunciado en septiembre 2024, debería permitir escanear, analizar y buscar archivos de imagen.

      Características
      – Context Length = 32k, 128, 256 Ktoken (depende del modelo)
      – Internet Access: No
      Precios:
      El plan de precios de Mistral es complejo. Tiene tres tipos de modelos:
      – Modelos de uso general,
      – Modelos especializados y
      – Modelos de ajuste fino. Debajo de cada uno hay más tipos.
      En función de ellos, los usuarios tienen que pagar. Por ejemplo, el Mistral Nemo cuesta $ 0,3/1M de tokens.

        Observación:

        Este artículo recoge datos y opiniones de referencia de diversos especialistas. Si descubres un error, te agradecemos nos envíes un email a jaime.oyarzo@uah.es

        Fuentes: (sep 2024)

        Leave a Reply

        Your email address will not be published. Required fields are marked *